个人介绍
1.
研究方向:机器学习,深度学习,推荐系统等;
2.
常用编程语言:python(熟练:使用 3 年)、JAVA(掌握:使用 5 年)、scala(掌握使
用半年)、C++(一般:使用 1 年)(熟悉 liunx 环境的开发:使用 4 年);
3.
掌握 python 数据处理,包括 numpy、pandas、scikit-learn 等;
4.
掌握 spark 框架以及 scala 语言,能通过两者进行数据处理,特征拼接,特征清洗。
5.
掌握 Lasso&Ridge&ElasticNet,KNN 和 XGboost,SVM 等算法;
6.
掌握协同过滤、矩阵分解(如 SVD)等,对推荐系统有实践开发经历;
7.
掌握梯度下降算法、正则化和 dropout,batchNormal 等,对模型的偏差和方
差有认识;
8.
了解 TensorFlow 和 kears,掌握 CNN,GAN 等神经网络,有一定开发经验
9.
熟练掌握 MYSQL,HIVESQL,掌握操作系统和计算机网络等计算机基础知识;
10.
掌握 shell,git,GitHub 托管代码,撰写 CSDN 技术博客等;
11.
了解 BI 系统。
工作经历
2019-04-23 -2020-06-24小米算法工程师
小米大数据部—数据中台精细化运营组:(实习:2019 年 4 月-2019 年 12 月) 1. 负责小米有品,小米米家的精细化推荐(定时推送,兜底推送,最优推送,自动推送,场 景推送)的指标的统计(包含:GMV,DAU,点击率,支付 uv/pv,发送 uv/pv,到达 uv/pv 等)并每天定时写入 mysql 与 hdfs 并进行维护工作,并将数据和小米 bi 系统看板 进行数据展现。以及给小米有品运营团队每天定时(crontab)发送相关推送方式详细数 据的邮件。(相关技术:sparkSQL,Hive,shell 脚本) 2. 负责小米有品各个推荐位指标统计(GMV,曝光 UV,点击 UV,定订单量等),每天定时 写入数据仓库展现到 bi 系统看板。 3. 小米有品 app 的推送工程:(springBoot+mybatis+Maven) 负责工程的管理模块(内容管理,计划管理,使用拦截器进行用户权限管理)。以及负责 下发模块从 zookeeper 读取 job batch 下发数据,下发分为(米 push,米 Iot,短信) 分别实现以上模块的 push 调用数据的服务接口以及
教育经历
2017-09-01 - 2020-01-10天津大学计算机技术硕士
天津大学(985) 智能与计算机学部 计算机系 硕士 2017.09 – 2020.01
技能
• 描述:根据已有用户对电影的打分数据集,对于某个用户按照最相似的用户进行电 影推荐;基于矩阵分解的打分评估。 • 技术: 1. 定义距离函数:欧氏距离,cosine 距离,皮尔逊相似度等; 2. 给定 username,计算该用户与其他用户的距离并排序与按近邻推荐; 3. 基于 TensorFlow 模型实现基于隐语义模型的推荐系统;
• 描述:实验室项目组(7 人),系统主要分三大模块,学生,教师,管理员。系统 的目的主要方便老师与学生进行学院发布的比赛信息的发布,报名,审核,项目主 要成员(产品 1 人,前端开发 3 人,后端开发 3 人)本人负责前端开发。 • 技术:运用 html, css, JavaScript, jQuery, Ruby on rails(Linux 系统编 程环境)等技术进行网站的前端页面开发。网站地址: http://jxycx.hhu.edu.cn/
描述:基于上千行,列维度为 303 的数据集进行数据处理、模型训练和预测测试 集 SalePrice 变量的值; • 职责:数据的基本处理(Matplotlib 可视化、缺失值处理等)、平滑化,特征工程 以及算法尝试、参数调试和模型的训练等 • 技术: 1. pandas 和 numpy 做数据处理,log1p()平滑化,(X-X’)/s 标准化; 2.调用 RF,Ridge,xgboost 模型等,训练调参,优化模型。 • 项目地址: https://www.kaggle.com/joshuasea/titanic?scriptVersionId=11739826