整合各个数据库,各个平台的数据,经过kettle 进行筛选和清洗,统一到同一个数据库,并对数据进行同步更新。对于一些api 提供的数据,可以进行数据的处理整理到表中。例如,json 数据解析成各种表格,导入到数据库中。速度很快。对于某些api 不提供历史数据的情况,可以添加自定义列时间,把每次取到的数据进行存储,为以后的数据挖掘做准备的工作。
评论