azkaban 简单demo
一. azkaban job简单配置
1. 目录结构
- lib 目录下,为java的jar包
- script 目录下,是shell脚本
- sql 目录下,是hive sql脚本
2. 定义flow1信息
2.1. f1/az-hive-01.job
1 | type: hive |
- hiveconf.xxx 指定需要传入sql的参数设置,sql文件内用${hiveconf:xx} 表示
2.2. f1/az-java-02.job
1 | type=javaprocess |
- java任务,指定运行的main class
2.3. f1/az-shell.job
1 | type: command |
- 执行shell 脚本,dependencies,表示需要等待,hive以及java任务执行成功后,执行。
2.4 f1/az-f1-end.job 定义flow
1 | type: flow |
- 需要和 f1无依赖的最终任务名称(az-shell.job)一致
3. 定义flow2信息
3.1. f2/az-f2-1.job
1 | type: command |
3.2. f2/az-f2-end.job 定义flow2信息
1 | type: flow |
- flow.name 需要和flow2 的任务名称一致,既az-f2-1.job
3.3. az-end.job 定义最终任务信息
1 | type: noop |
- 需要等待 flow1,flow2执行完毕
4. 打包运行
4.1. 打zip包,并上传
4.2. 设定任务
4.3. 设置定时执行,SLA报警
4.4. 运行结果
二. azkaban flow简单配置
1. 目录结构
- lib 目录下,为java的jar包
- script 目录下,是shell脚本
- sql 目录下,是hive sql脚本
- azkaban-demo-flow.project 定义执行flow的版本
- azkaban-demo-flow.flow 定义工作流详细
2. 工作流设定
1 | --- |
[demo地址] (git@github.com:nick-weixx/azkaban-demo.git)