个人介绍
教育经历
中国传媒大学
电子信息大类 硕士 计算机与网络空间安全学院
2020年09月 - 2023年06月
北京
荣誉奖项:2020年 中国传媒大学学业奖学金二等奖。
主修课程:大数据系统构建技术、大数据分析技术及实践等。
东北林业大学
信息管理与信息系统 本科 信息与计算机工程学院
2015年09月 - 2019年06月
哈尔滨
主修课程:高级程序语言设计、数据结构、Java面向对象编程基础、计算机网络、操作系统、数据库系统概论等。
实习经历
脉脉
大数据开发实习
2021年04月 - 2021年05月
北京
参与招聘和内容业务需求的数据提取。
通过BI平台Redash来反馈给业务方,包括SQL、用户画像、dashboard。
协助mentor维护数仓表
项目经历
开源软件供应链点亮计划-华为CarbonData 2021年07月 - 2021年09月
任务:1、搭建基于CarbonData的高性能数据湖项目。 2. DEMO代码开发。
在用docker 部署的HDFS + YARN + SPARK 集群上跑通官方案例。提交性能测试对比PR,使用Spark SQL 测试 Parquet 、
Orc、Carbonta 三种文件格式在不同查询条件情况下的性能。
爬虫2021年01月 - 2021年02月
了解一些基本反爬措施及应对方式,能使用python+Selenium+Chrome爬取网页信息、会简单使用Scrapy框架爬取数据。
如爬取哔哩哔哩页面作者信息、用户评论、视频弹幕等基本信息。
基于发票进销项的报表系统2016年03月 - 2016年06月
同两位同学参加过第六届软件杯大学生软件设计大赛——选题为“基于发票进销项的报表系统”
在项目中参与后端JSP页面的开发,通过该比赛解了web开发的基本流程和技术体系。
项目为导向实战练习了HTML、CSS、Java、JavaScript、SQL等所学知识。
社团和组织经历
2020年09月 - 至今
中国传媒大学计算机学院的研会就业部干事。
参与组织院“就业经验分享大会”,在活动中负责联系优秀学长学姐参与活动来分享就业升学经验。
技能/证书及其他
技能: SQL(熟悉)、Java(熟悉)、python(了解)、scala(了解)、Docker(一般)
语言: 英语(CET-6)
活动: 数艺学苑公众号(运营)
工作经历
2021-04-01 -2021-05-28脉脉数据开发实习
参与招聘和内容业务需求的数据提取。 通过BI平台Redash来反馈给业务方,包括SQL、用户画像、dashboard。 协助mentor维护数仓表
教育经历
2020-09-12 - 2019-06-01中国传媒大学电子信息硕士研究生
2023毕业在校学生,擅长java,数据开发
技能
基于 springboot + mybatis + vue的物流管理系统 。包括用户管理、网上商城、后台物流管理三个模块。 用户管理采用独立的用户管理系统 网上商城和后代物流管理分离。
1、大致阅读 CarbonData 的官方文档,了解CarbonData这种新的数据格式,阅 读陈亮导师的文章《Spark+CarbonData(New File Format For Faster Data Analysis)》,更深入的理解项目开发的需求; 2、搭建部署项目开发环境,VMwareworkstation+ ubuntu20.04+CarbonData+Hadoop3.1.4+Spark2.4.5 + YARN; 3、前期技术准备的学习。 4、根据DEMO的具体需求进行代码开发: 与导师沟通DEMO开发所需数据获取的方式。 对数据清洗处理符合DEMO操作的要求。 依据DEMO实例的具体逻辑,进行代码开发。 5、提交初步开发结果给导师审核和下一步的完善。 项目产出要求 社区模块开发贡献 社区文档开发贡献 测试用例贡献 技术博客贡献 项目技术要求 Spark Hadoop Scala Java