个人介绍
编码:有多个项目编码经验,熟练使用Python、Java,熟练使用Numpy、Pandas、Matplotlib、scikit-learn、Pytorch等库,
熟练使用Linux;
理论基础:熟悉常见机器学习(聚类、GBDT、XGBoost等)、深度学习(CNN、LSTM、Transformer等)、迁移学习(TCA、DSAN等)算法原理;
发表SCI论文3篇
工作经历
2022-03-18 -至今清华大学四川研究院算法工程师
基于自主产权的相关因素大数据解决方案,采用电力系统物理解析模型与人工智能深度融合、双核驱动的预测方法,提供电力系统负荷预测、新能源发电功率预测、电力市场价格预测服务,为电力市场交易决策提供边界条件。主要做AI预测
教育经历
2019-09-13 - 2022-06-23云南大学软件工程硕士
技能
任务为利用给出的2016年到2017年60个车型在22个省份的每个月销量数据预测2018年 1-4月汽车销量,后通过手工特征提取获取结构化数据的方式进行建模 1.完成数据预处理、数据可视化、探索性分析等前期工作; 2.完成任务的建模、特征提取、特征选择、模型框架搭建与实现等中期工作; 3.完成两个模型(XGBoost和LightGBM)的模型融合、结果后处理等后期工作。
项目简介:该项目为和某为公司的横向合作项目,拟通过智能手表内置运动传感器数据结合 机器学习算法,推出一个帕金森 病情居家智能自诊系统。 负责工作与结果: 1.负责系统方案设计,实地数据采集; 2.利用基于BvSB采样的 主动学习算法, 降低80%-95%的数据标记需求; 3.利用子结构 迁移学习,缓解数据分布差异问题, 提高3%-5%的准确率; 4.采用多种 异常检测技术完成数据清洗,提高数据质量, 召回85%+的噪声。 关键字:移动健康、时间序列、Machine Learning、Active Learning、Transfer Learning、Anomaly Detection
根据历史污染和天气信息 预测污染物浓度。在前期的研究中,我们只关注污染物本身的时间状态变化,通过自回归移动平均模型(ARMA)+小波分解预测过一波,但这种方法没有考虑影响污染物浓度扩散的气象条件,而且也很难将空间因素考虑进去。我所用的LSTME模型考虑预测输入数据的多样性和多元化。做了如下工作(1)扩展了LSTM神经网络以捕获大气污染物浓度的长期时空依赖性,并提出了可预测未来24小时大气污染物浓度的多尺度预测框架; (2)该方法能够有效地自动提取大气污染物浓度数据中的时空相关性; (3)将辅助数据整合到传统的LSTM模型中,并且该综合模型表现出比传统方法更好的性能。