devops:改变思维,让一切更加高效

Airflow简单介绍及测试安装

2019-03-08  本文已影响217人  潘晓华Michael

Airflow是什么

为什么使用Airflow

Airflow常用的场景

Airflow主要用于执行预定的批处理作业。它能够很好地管理不同的批量作业的关系,并给将复杂的关系图形化展示。

一句话:任何批量任务或者需要手动去触发执行的任务都可以考虑一下Airflow

Airflow安装

airlow使用ansible role方式安装 https://github.com/idealista/airflow-role

  1. 安装准备软件ansible、gcc、python-devel
$ yum install ansible gcc python-devel -y
  1. 创建文件requirements.yml
- src: idealista.airflow-role
  version: 1.0.0
  name: airflow
  1. 下载airflow role
$ ansible-galaxy install -p roles -r requirements.yml -f
  1. 更改role中的install.yml
    将roles/airflow/tasks/install.yml中的apt模块改成package模块
    将roles/airflow/tasks/install.yml中的Copy Daemon scripts中的when条件去掉
$ cat roles/airflow/tasks/install.yml
...
- name: Airflow | Installing dependencies
  package:
    name: "{{ item }}"
    state: present
  with_items: "{{ airflow_required_libs }}"
...
- name: Airflow | Copy Daemon scripts
  template:
    src: "{{ item.key }}.service.j2"
    dest: /lib/systemd/system/{{ item.key }}.service
    mode: 0644
  notify: restart {{ item.key }}
  with_dict: "{{ airflow_services }}"

更改role下的config.yml及templates/airflow-***.service.j2文件
/usr/local/bin/airflow改为/usr/bin/airflow

$ cat roles/airflow/tasks/config.yml
...
- name: Airflow | Initializing DB
  shell: AIRFLOW_HOME={{ airflow_home }} airflow initdb
...
$ cat roles/airflow/templates/airflow-webserver.service.j2
...
ExecStart=/usr/bin/airflow webserver --pid /run/airflow/webserver.pid
...

目的该role使用pkg只能在Debian 或 Ubuntu 环境下安装,更改后,可以在centos环境下安装

  1. 更新ansible的hosts文件
$ cat /etc/ansible/hosts
127.0.0.1 ansible_connection=local
  1. 创建部署airflow的ansible yaml
$ cat airflow.yml
---
- hosts: all
  roles:
  - { role: airflow }
  1. 安装airflow
$ ansible-playbook airflow.yml

执行完以上操作后本机就安装好了airflow,同时也配置好了service等。

  1. 手动初始化db
$ HOME=/etc/airflow; airflow initdb
  1. 更新配置/etc/airflow/airflow.cfg
$ cat /etc/airflow/airflow.cfg
...
max_threads = 1
dagbag_import_timeout = 30
...
  1. 启动airflow-worker
$ systemctl restart airflow-worker

安装好后展示

Airflow主页.png

问题记录

相关文章

Airflow中文文档
任务调度神器 airflow 之初体验
airflow 安装,部署,填坑
airflow 配置 CeleryExecutor
浅谈调度工具——Airflow
如何部署一个健壮的 apache-airflow 调度系统
Airflow工作模式及适用场景
浅谈调度工具——Airflow

上一篇 下一篇

猜你喜欢

热点阅读