dag-factory:从YAML生成Airflow DAG
Apache Airflow是“以编程方式编写,安排和监视工作流的平台。”目前,它正处于发展阶段。 在DataEngConf NYC 2018上,似乎所有其他话题都是关于或提及Airflow的。 也有无数关于不同公司如何使用该工具的博客文章,甚至还有播客! Airflow的主要用例似乎是ETL或ELT或ETTL或我们今天使用的首字母缩写词,用于将数据从生产系统批量转移到数据仓库。 这种模式通常会在多个管道中重复。 我最近发表了一篇关于如何在日常工作中使用Airflow并使用YAML配置使这些重复的管道易于编写,更新和扩展的演讲。 这种方法的灵感来自Chris Riccomini在WePay上有关Airflow的开创性文章。 然后,听众中有人问“您如何从YAML转到Airflow DAG?”我的回答是,我们有一个Python文件来解析配置并生成DAG。 这个答案似乎并不能使听众或我自己满意。 这种模式在有关Airflow的讨论或帖子中非常普遍,但似乎我们都在独立编写相同的逻辑。 因此,关于达工厂的想法诞生了。 dag-factory库使您可以按照以下步骤轻松地从YAML配置创建DAG。 首先,将dag-factory安装到您的Airflow环境中:…