Ubuntu下安装Airflow

2022-05-10  本文已影响0人  青云直上

Airflow是基于Python的ETL和任务调度的工具

要求

当前最新版是Airflow 2.3.0, 需要:

安装

先激活目标python虚拟环境(以python3.7为例),再执行以下命令(除非希望安装在base环境)

pip install "apache-airflow==2.3.0" --constraint "https://raw.githubusercontent.com/apache/airflow/constraints-2.3.0/constraints-3.7.txt"

若要为不同版本python安装,以上命令把3.7替换成相应的支持的版本即可

数据库初始化

airflow standalone # all-in-one service使用默认的sqlite3
#或者
airflow initdb 

访问web界面

# 启动 web 服务器,默认端口是 8080
airflow webserver -p 8080

浏览器使用 localhost:8080 就好了

启动 scheduler 服务器

进去web界面后可能会提示scheduler未启动,运行一下以下命令就好了

airflow scheduler

插件依赖

取决于环境要求,可能需要安装额外的插件依赖,比如若要使用Postgres DB,需要安装 postgres-devel yum package. 具体不同环境下的extra和provider可查阅以下链接。

Reference for package extras.

参考链接

Installation from PyPI — Airflow Documentation (apache.org)

上一篇 下一篇

猜你喜欢

热点阅读