个人介绍
熟悉Tensorflow、pytorch等开源框架熟悉常见深度学习算法模型,如VGG、ResNet、FasterRcnn、Yolo系列、U-nct等熟悉常见机器学习算法:如K-menas、LR、SVM、GBDT、XGBOOST等熟练掌握Python,使用numpy、pandas等科学计算库及Opencv、PIL等图像处理库。
工作经历
2021-08-05 -2023-08-22依图人工智能算法
负责前沿科研论文的复现工作,主要利用深度学习框架以及数学知识对机器视觉顶级会议的了论文进行算法推理以及代码实现
教育经历
2022-09-01 - 2023-08-04中国科学技术大学计算机科学与技术硕士
以第一作者发表SCI三篇,其中一篇为Top,两篇CCF-A,累积影响因子达到30.申请发表专利1个。
2017-09-09 - 2021-06-01华东理工大学计算机科学与技术本科
优秀毕业生,绩点排名10%,屡次获得特等奖学金,保研至中科大
技能
识别本项目目标是实现对自动生成的带有各种噪声的车牌识别。此次车牌识别是将车牌7个字符同时训练,字符包括31个省份简称、10个阿拉伯数字、2,共有65个类别,7个字符使用单独的loss函数进行训练。 添加了通过H(色调)和S(饱和度)来对车牌颜色进行判断,然后使用tkinter搭建了简单的GUI,可以实现打开摄像头拍摄照片然后再对照片进行识别
在语言级别的模态进行初步的情感识别并进行BERT的特征提取。 对于图片数据,利用CNN,Vi-Transformer进行特征提取,并利用Pytorch计算语言数据的对应程度,完成特征对其。 将对齐的数据进行特征融合,输出到Cross-Attention-Modality网络中进行前向传播与Loss计算。 针对不同的下游任务进行特定的超参数微调(Fine-Tuning).可将该模型迁移至任意给定的多模态任务。