大数据开发沈阳
全职 · 500/日 · 10875/月信用正常
工作时间: 工作日9:00-22:00、周末9:00-22:30工作地点:
远程
服务企业:
1家累计提交:
0工时
联系方式:
********
********
********
查看联系方式
聊一聊个人介绍
本人从事Java后端大数据多年,之前在北京工作七年,在互联网大厂做后端及大数据开发工作,很多实战项目经验。Java后端的搭建,熟练应用常见的框架,大数据框架的搭建,大数据运维,数据仓库的搭建,自己能够熟练的搭建常见的大数据框架,Hadoop flink spark storm kafka datax等等,自己是一个自由职业者,时间比较充裕,本人对工作比较负责,期待你的选择。
工作经历
2020-01-01 -2023-01-01水滴大数据开发
主要从事Java后端,大数据开发工作。用springboot+mybatisplus搭建集群化调度系统。并实现全链路数据可视化
教育经历
2009-07-01 - 2013-07-01辽宁科技大学软件工程本科
本人在学校成绩优良,实习期间表现良好,得到实习单位的赏识,在工作中能够独立解决问题
技能
0
1
2
3
4
5
作品
分布式爬虫,每天处理上百万条数据,主机器主要是任务的建立,与下载队列的生成, 从机器从主机器获取下载任务,进行下载任务与网页处理,主从机器之间的交互用 thrift 框架,kafka 充当爬虫爬取的队列。利用 kafka storm 框架实现爬取数据与数据解析分离, 使爬虫更有效率,同时也更方便的维护爬虫。根据网站的特征对网站进行分析,制定网 站的更新策略。新闻是根据算法进行页面内容抽取,抽取正确率 90%以上,贴吧论坛根 据 搭 建 解 析 框 架 , 利 用 jsoup 与 xpath , 是 用 于 大 部 分 网 站 , 爬 虫 后 台 用 的 是 SpringMVC+mybatis 搭建,针对爬虫进行监控。方便操作员对爬虫的管理
0
2023-08-07 17:42
数据中台搭建,其中包括大数据框架的搭建、数据仓库搭建,使用ambari搭建hdp版本的hadoop,本系统有离线数据仓库与实时数据仓库,其中实时数据仓库用flink+kafka最终结果存入doris中。
0
2023-08-07 17:38