点击空白处退出提示
KYZ平台
我要开发同款作品详情
2. 负责通过HQL获取hive数据湖仓的上游数据,并利用Pandas、Numpy进行处理,对原始数据清洗、整理、格式化。根据业务需求创建ElasticSearch的index,使用jieba等NLP库对数据二次处理并创建ETL任务。开发ES查询语句并设定score、排序逻辑。应用K8s模板,配置docker镜像并部署容器。
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态
评论