卫杨
1月前来过
全职 · 800/日  ·  17400/月
工作时间: 工作日08:00-20:00工作地点: 远程
服务企业: 0家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

我是程序员客栈的【卫杨】,一名【深度学习算法从业者】; 我毕业于【塔里木大学】; 负责过【视觉系统项目】,【语音合成项目】,【数字人项目】的开发; 熟练使用【torch】,【opencv】,【cmake】,【springboot】,【nginx】; 如果我能帮上您的忙,请点击“立即预约”或“发布需求”!

工作经历

  • 2023-10-01 -2024-06-15某科技公司算法工程师

    视觉系统:基于深度学习的目标检测、分割、人脸识别、OCR等算法在系统的集成。 数字人系统:基于深度学习的语音合成、语音驱动虚拟人物唇形和肢体动作。

  • 2022-10-01 -2023-06-01山西智通时代信息技术有限公司研发岗

    OA系统:包含市政信息化服务系统、档案数字化系统。 图像处理:OCR、人脸识别和目标检测。

教育经历

  • 2021-09-01 - 2024-06-01塔里木大学农林经济管理硕士已认证

    计算机从业6年

技能

C++
Nginx
CMake
深度学习
图像处理
Torch
0
1
2
3
4
5
0
1
2
3
4
5
作品
视觉系统

基于微服务的视觉系统,包含认证鉴权、标签管理、视觉算法(检测、分割、OCR)训练推理等模块。使用到的技术和工具:算法相关(YOLO系列、SSD、MaskRcnn、PaddleOCR、face_recognition、dlib)、Web相关(Springboot、Nacos、Mysql、Redis、Nginx、Maven)、C++工具(Opencv、Eigen、Cmake、GNU、Tesseract、TensorRT)、Python工具(Opencv、Flask、Numpy、Pytorch、Anaconda)

0
2024-07-10 16:18
数字人系统

基于深度学习的文本驱动生成数字人系统,包含语音合成(自动音频标注、自定义语料训练、多音字和特殊字符识别)、文本驱动图像人物肢体动作、语音驱动人物唇形和肢体动作(音频驱动图像\视频唇形和肢体动作)。使用到的技术:语音合成算法相关(TTS、Paddlespeech、Spleeter、Whisper)、音频驱动人物唇形和肢体动作(MuseTalk、SadTalker、Video-Retalking、Audio2photoreal、Vlogger)、文本驱动人物肢体动作(MuseV)。

1
2024-07-10 16:41
语音合成系统

语音合成系统开发的主要目的在于释放人力配音。因此系统的主要功能点包含:语料自动标注、语料训练和语音合成三大功能模块。注:语音合成效果逼真度接近90%,因此需要制定相应的规则保护语音所有权人的权利不受到非法侵害。

1
2024-07-10 17:30
更新于: 07-10 浏览: 64