个人介绍
我叫杜永杰,毕业于中国人民大学信息学院,研究方向是大数据管理和分析。精通 Spark、Hadoop、Flink,Hbase,和 Redis 等主流大数据系统 ,熟练使用 C/C++、Python、shell; 会使用 Scala、R、Java 等。工作作风 :积极向上,具有良好的团队合作精神和协调能力;有良好的逻辑思维能力、沟通力、学习力和创新力。
工作经历
2019-04-01 -2019-05-31中信建投大数据分析师
实时处理用户推荐行为信息。主要工作是从 kafka 埋点日志信息中读取并解析相关的用户行为,通关相关字段与 Redis 中用户推荐广告信息进行匹配,将相关的用户行为进行拼接实时写到 ES 数据库中。根据用户的这些实时行为优化用户推荐方案,推荐更加优质且符合用户个人标签的广告。
2018-06-01 -2019-12-31中国国家天文天系统开发
“面向特定领域的大数据管理系统” 参与完成AstroServ系统的设计和开发。AstroServ是国家天文台合作开发的实时异常行星发现系统。该系统由实时层和离线层两部分组成。实时层用于实时监控异常行星,离线层用于存储天文望远镜的数据以便于回溯。该系统每15s处理680万行数据,每天处理1.24TB数据,数据插入和查询能在秒级完成。
2017-09-01 -2020-06-30中国人民大学信息学院
面向大数据内存计算的计算机体系结构” 研究数据库数据搬移能耗。该项目主要研究CPU各级缓存的能耗。通过在Mysql、Sqlite和Postgresql数据库上运行TPCH查询,然后监控每个查询的性能,分析相应的查询能耗,分析数据库的相应特征。
教育经历
2017-09-01 - 2020-06-01中国人民大学计算机应用技术硕士
主要课程:计算社会学导论、智能信息检索、计算机科学研究方法概论、软件工程与方法、数据科学导论、运筹学、数据库管理系统原理与实现、网络与通信、高级操作系统、数据集成技术、商务智能
技能
在实验室学习研究中,参与“面向大数据内存计算的计算机体系结构” 研究数据库数据搬移能耗研究。通过阅读数据库架构设计,找到当前数据库设计的问题,并提出改进方案。在这个项目中编写实验代码,用python处理分析数据。
配合天文台开发astroserve系统,后台用C++程序编写核心数据处理,用大数据框架分布式处理,前台用html编写。该系统每15s处理680万行数据,每天处理1.24TB数据,数据插入和查询能在秒级完成。