proginn1615493931
1月前来过
全职 · 500/日  ·  10875/月
工作时间: 工作日00:00-24:00工作地点: 远程
服务企业: 1家累计提交: 1工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

我是程序员客栈的hujihu33, 一名大数据研发人员

我毕业于江西理工大学,担任过平安国际智慧城市的高级数据开发人员,技术经理等角色,也在深圳虾皮信息科技担任过高级数据研发工程师的角色

负责过深圳环境局的大数据中心的项目、环境大数据产品,互联网业务的audience manager等项目的数据研发工作

熟练使用 大数据相关组件 hadoop、spark、flink、azkaban、airflow、kafka、sqoop、datax 等

    对离线数据仓库、实时数据仓库

    语言方面,熟悉 java、python、scala

    etl工具 kettle datastage

    熟悉市场常用的olap数据库,greenplum、doris

工作经历

  • 2021-06-30 -2021-09-30深圳虾皮信息科技有限高级大数据开发工程师

    公司主要的业务是做全球的电商业务 我的主要职责是做大数据开发,数据治理,数据质量监控

  • 2018-12-28 -2021-06-30平安国际智慧城市高级数据开发工程师

    公司主要做政府项目信息化研发 本人主要是做数据仓库的研发,架构设计,数据建模,数据研发,数据治理,dba,运维相关

教育经历

  • 2007-09-01 - 2011-07-01江西理工大学计算机科学与技术本科

技能

postgres
爬虫
Hadoop
HDFS
0
1
2
3
4
5
0
1
2
3
4
5
作品
交通数据通过机器学习模型实时分析

项目分为1,通过sparksql 读取多个csv文件。2,建立机器学习模型。3,实时从kafka接收数据,使用模型进行预测 整个项目是我自己开发

0
2024-01-30 17:57
下载次数:0
¥150
scala spark 天气的数据分析

主要是通过scala 读取mysql 的数据,对读取的数据通过spark进行数据分析,把分析的数据写入到数据库 整个项目都是我负责的

0
2024-01-28 16:51
下载次数:0
¥50
爬取微博某话题下的评论数据

项目分为,通过模拟客户端向服务端发送请求的方式去获取数据。获取数据分第一层评论,第二层评论,在代码中都有涉及 整个项目自己完成

0
2024-01-28 16:51
下载次数:0
¥99
更新于: 01-30 浏览: 98