azkaban(六):杀死和暂停
2021-08-13 本文已影响0人
万事万物
Pause
用于暂停正在运行的job
一旦点击,
Pause
将变成Resume
Resume
kill And Resume暂停
点击 Resume
将继续执行任务
继续运行
kill
用于杀死后面还未运行的的任务。
image.png
继续运行被Kill的任务
- 方式一:
重新执行:禁用已经完成的任务,启用被kill
掉的任务
image.png -
方式二:
指定续上,在此基础上继续运行未完成的任务。
image.png
采用第二种方式:
-
进入
选择History页面History
中,
-
进入被
kill
掉的任务中,点击id
进入。
image.png
-
点击
执行详情Prepare Execution
-
继续执行
执行过的job自动置灰(禁用)
执行情况 -
从 JavaTestJob 中继续执行
继续执行 -
执行完毕
执行完毕
重试机制
当某个任务运行出错,可以按照以上方式进行重新尝试运行,上面的处理方式虽然已经做得很好了,运行也比较方便,但是一旦错误,就挂掉了,最好的做法就是容错机制。允许犯错误,但是不能一而再,再而三的犯错
。
在 azkaban中配置重试机制需要加两个参数
nodes:
- name: JobA
type: command
config:
command: sh /not_exists.sh
retries: 3
retry.backoff: 10000
retries
:重试次数
retry.backoff
:每次重试间隔时间(单位毫秒)
重新运行一个项目
将 java.class
修改成 job.class
配置重试次数
重试时间 5秒一次。
image.png
运行结果:
查看TimeLine
,三个竖杠就是三次重试次数。虽然结果是运行失败。
运行失败