个人介绍
通过大学英语四级(CET-4),六级(CET-6)测试,并具备良好的文献阅读能力。 ⚫ 熟悉机器学习回归与分类模型的调用及适用场景,pytorch、tensorflow 的使用,有一定的竞赛经历,动手能力强。 ⚫ 了解常见的 linux 命令,有较多服务器,docker 镜像使用经验。 ⚫ 有大模型微调相关经验,主动了解 AI 前沿知识。
工作经历
2023-01-01 -至今小米测开
负责小米音箱日常监控,及时将出现的问题通过jira上传给开发部,通知相关垂域人员进行更改。对接其他部门工作,如手机部、ai部门。使用团队内部的自动化测试用例平台编写测试用例,
教育经历
2023-09-01 - 华南理工大学电子信息硕士
2019-09-01 - 中国地质大学(武汉)软件工程本科
gpa排名前10%,目前已经取得专业保研名额,成功保研至华南理工大学。
技能
项目描述:针对心电图数据(可扩展至多元时序数据),先进行数据增强操作,随后通过傅里叶变换将时序数据扩展至二维空间进行分 析,从而更加充分的学习时序数据周期内和周期间的变化。最后将得到的二维图像输入到优秀的视觉网络中进行分类。 负责任务: ➢ 对 PTB 诊断心电图数据库(PHYSIONET)中心电图的数据增强,包括随机频降、随机周期掩码等。 ➢ 通过傅里叶变换获取心电图一个波形的周期,根据周期对心电图切割将心电图转换为 2D 图像。 ➢ TIMESNET 中的 INCEPTION 网络替换为不同的视觉骨干网络尝试,例如 RESNET,CONVNEXT,SWIN TRANSFORMER 项目亮点: 通过数据增强后,TimesNet 在 PTB 心电数据集上的准确度达到了 93.5%,优秀于传统的 CNN 模型(90.1%)和基于 transformer 改进的 Gated-transformer 模型(91.2%),达到了最佳性能。相比之下,TimesNet 统一了 2D 空间中的时间 2D 变化,这便于通过 2D 内核学习信息表示,从而有利于需要分层表示的分类任务
下面是我从我参与的竞赛中选出的一个印象比较深刻的竞赛进行一个讲解。赛题是“二手车的价格预测”,首先对数据进行一个数据清洗,包括对日期等非数值数据类型进行转换,处理缺失值和异常。然后采用特征工程的方法对原始估价训练数据进行处理,包括对非正太分布的回归目标进行对数化转换,对数据中的连续值特征归一化,对数据中的分类特征进行特征编码,对原始数据进行特征构造并进行特征提取,以便增强模型的表达能力,获取更好的训练数据特征; 然后,基于提取的特征分别使用随机森林、LightGBM和XGBoost模型,采取五折交叉验证法对训练数据进行拟合,得到各特征与二手车价格的关系,最后采取Stacking模型融合的方法将上述三种模型的预测结果赋予不同权重,结合它们的优点建立最终二手车价格预测的模型; 结合实际情况和上述模型的输出,根据回归树模型的特征选择,选出影响二手车保值率的几个特征,并进行定量分析。 最后在答辩中入围特等奖,全国2687支队伍中综合排名第五。