Addax(此前叫DataX)是一款支持主流数据库(Cassandra,ClickHouse,DBF,Hive,InfluxDB,Kudu,MySQL,Oracle,Presto(Trino),PostgreSQL,SQLServer)的通用数据采集工具。
Addax框架设计Addax本身作为离线数据同步框架,采用Framework+plugin架构构建。将数据源读取和写入抽象成为Reader/Writer插件,纳入到整个同步框架中。
Reader:Reader为数据采集模块,负责采集数据源的数据,将数据发送给Framework。
Writer:Writer为数据写入模块,负责不断向Framework取数据,并将数据写入到目的端。
Framework:Framework用于连接reader和writer,作为两者的数据传输通道,并处理缓冲,流控,并发,数据转换等核心技术问题。
AddaxFramework提供了简单的接口与插件交互,提供简单的插件接入机制,只需要任意加上一种插件,就能无缝对接其他数据源。
运行要求JDK1.8+Python2.7+/Python3.7+
评论