个人介绍
工作经历
2020-06-01 -2020-08-31百度网络技术有限公司视频内容理解算法工程师
参与完成百度“涉黄检测”项目,对小视频、短视频、图像以及直播等内容进行色情检测,包括手段为分类、检测等。本人负责百度特有的声音检测模型。应用的模型为 ESResnet 模型,使用 log_mel 特征形成频谱二维特征,然后送入卷积网络。通过分析误检与召回,发现 case 中极大部分问题为低声样本,对此针对低声样本在数据方面分别加入了 10000 个低声色情样本和正常样本,在模型方面加入 gamma 和 CQT 特征,最后达到 1.2%误检,30%的召回。
2019-07-01 -2019-11-30海信集团-国家重点实验室算法工程师
实现智慧家庭中的“垃圾分类”任务,使用 python 爬虫建立数据库,应用 resnext101 轻量级网络作为框架基 础。在数据库上识别率达到 93%左右,进一步增加负样本不断优化模型,达到高效识别的效果。 应用 Jetson Nano 开发板,实现了小车的自动避障功能、实时跟踪选中物体等,达到社区中的物件送达的目的。 实现智能相册中的“手势识别”任务,首先训练模型用于捕捉人脸,数据库识别率达到 95%以上。其次对得到 的结果捕捉手势并训练,手势设定为八类,每类 20000 张图片。最后采集负样本,增强网络泛化能力。
教育经历
2014-09-01 - 2018-07-01山东科技大学通信工程本科
掌握 Python 和 Linux,有机器学习 Pytorch 框架实践项目经历,能够使用 Tensorflow 掌握 C++语言,能够进行程序编写,掌握 python 爬虫技术,能够获取数据并对数据处理与分析
技能
赛题要求对酒瓶瓶身以及瓶盖等图片进行瑕疵检测,官方提供数据和标注并线上评测。本人使用"Cascade RCNN+ResNeXt+FPN"模型作为 Baseline,处理和微调后初赛第 37 名,进入复赛,复赛达到第 19 名的成绩。
赛题要求对多类西安主题图片进行分类,提供数据并线上评测,具有数据量小,类别区分度小,时间紧等难点。 本人针对图片特点选择“se_resnext101_32x4d”模型结构作为 Baseline。对三千多张图片进行数据清洗与扩 充,平衡数据并划分训练集与验证集。网络参数上,学习率采用分段常数衰减,优化函数为 sgd。最后提交达 到的分数为 0.978,历史最好成绩第 2 名,最终 34 名。在项目中提高了独立寻找问题和解决问题的能力。