个人介绍
我是程序员客栈的【卫杨】,一名【深度学习算法从业者】; 我毕业于【塔里木大学】; 负责过【视觉系统项目】,【语音合成项目】,【数字人项目】的开发; 熟练使用【torch】,【opencv】,【cmake】,【springboot】,【nginx】; 如果我能帮上您的忙,请点击“立即预约”或“发布需求”!
工作经历
2023-10-01 -2024-06-15某科技公司算法工程师
视觉系统:基于深度学习的目标检测、分割、人脸识别、OCR等算法在系统的集成。 数字人系统:基于深度学习的语音合成、语音驱动虚拟人物唇形和肢体动作。
2022-10-01 -2023-06-01山西智通时代信息技术有限公司研发岗
OA系统:包含市政信息化服务系统、档案数字化系统。 图像处理:OCR、人脸识别和目标检测。
教育经历
2021-09-01 - 2024-06-01塔里木大学农林经济管理硕士已认证
计算机从业6年
资质认证
技能
基于微服务的视觉系统,包含认证鉴权、标签管理、视觉算法(检测、分割、OCR)训练推理等模块。使用到的技术和工具:算法相关(YOLO系列、SSD、MaskRcnn、PaddleOCR、face_recognition、dlib)、Web相关(Springboot、Nacos、Mysql、Redis、Nginx、Maven)、C++工具(Opencv、Eigen、Cmake、GNU、Tesseract、TensorRT)、Python工具(Opencv、Flask、Numpy、Pytorch、Anaconda)
基于深度学习的文本驱动生成数字人系统,包含语音合成(自动音频标注、自定义语料训练、多音字和特殊字符识别)、文本驱动图像人物肢体动作、语音驱动人物唇形和肢体动作(音频驱动图像\视频唇形和肢体动作)。使用到的技术:语音合成算法相关(TTS、Paddlespeech、Spleeter、Whisper)、音频驱动人物唇形和肢体动作(MuseTalk、SadTalker、Video-Retalking、Audio2photoreal、Vlogger)、文本驱动人物肢体动作(MuseV)。