客户 B2B 平台站点一键搬家

我要开发同款
EdwardNewgate2022年11月19日
277阅读

作品详情

项目描述:为客户提供产品数据一键搬家服务,完成对公司全网通,视频官网,小渔夫等客户的建站需求
项目模块:数据加工,数据可视化,业务端数据清洗
技术描述:Elasticsearch+HBase+Celery+Python+Django+uWSGI+K8s+Docker+Redis
责任描述:搭建数据采集,数据加工,数据业务推送的分布式架构
1、搭建 Dockerfile 部署的镜像、容器启动执行指令、构建特殊业务环境,实现 K8s 集群弹性调动数据采集
容器和数据加工容器;
2、Redis 构建任务状态缓存,监听 Redis 状态达到数据采集,数据加工,数据推送,数据容灾等功能操
作;
3、优化 HBase 查询业务逻辑,业务 id(唯一)与任务 id(不唯一)关联,保证多平台业务任务并发进行,
Elasticsearch 全文索引引入搜索引擎解决查询,二级索引用于变换数据存储格式实现加速非主键查询;
4、数据采集端通过 HBase 的 ODS 层(数据准备层)去噪,去重,字段命名规范等一系列操作,到 DW
层(数据汇总层)进行字段合并、空值处理、脏数据处理、产品数据相似度处理、类型数据汇总等,数
据加工端通过 DM 层(数据集市层)进行宽表的多维度数据整合、根据 TTL 对产品过期数据进行删除、
多版本业务访问少数据访问时计算、存储各项目业务图片和视频本地化 url,最后数据推送服务给 APP
层(数据产品层);
5、根据不同项目需求做数据中转,用 Django 架构起服务业务特定需求的数据清洗推送,Celery 分布式处
理数据查询推送,uWSGI 部署任务回调接口,及任务 id 对业务 id 的关联查询接口。
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论