卫杨-北京人工智能-程序员客栈

1月前来过

D级

算法工程师

北京

全职 · 800/日 · 17400/月信用正常

工作时间: 工作日08:00-20:00工作地点: 远程

服务企业: 0家累计提交: 0工时

联系方式:

********

查看联系方式

聊一聊

使用APP扫码聊一聊

去下载APP

个人主页

我是程序员客栈的【卫杨】，一名【深度学习算法从业者】；我毕业于【塔里木大学】；负责过【视觉系统项目】，【语音合成项目】，【数字人项目】的开发；熟练使用【torch】，【opencv】，【cmake】，【springboot】，【nginx】；如果我能帮上您的忙，请点击“立即预约”或“发布需求”！

2023-10-01 -2024-06-15某科技公司算法工程师
视觉系统：基于深度学习的目标检测、分割、人脸识别、OCR等算法在系统的集成。数字人系统：基于深度学习的语音合成、语音驱动虚拟人物唇形和肢体动作。
2022-10-01 -2023-06-01山西智通时代信息技术有限公司研发岗
OA系统：包含市政信息化服务系统、档案数字化系统。图像处理：OCR、人脸识别和目标检测。

2021-09-01 - 2024-06-01塔里木大学农林经济管理硕士已认证
计算机从业6年

Nginx

CMake

深度学习

图像处理

Torch

作品

视觉系统

基于微服务的视觉系统，包含认证鉴权、标签管理、视觉算法（检测、分割、OCR）训练推理等模块。使用到的技术和工具：算法相关（YOLO系列、SSD、MaskRcnn、PaddleOCR、face_recognition、dlib）、Web相关（Springboot、Nacos、Mysql、Redis、Nginx、Maven）、C++工具（Opencv、Eigen、Cmake、GNU、Tesseract、TensorRT）、Python工具（Opencv、Flask、Numpy、Pytorch、Anaconda）

2024-07-10 16:18

数字人系统

基于深度学习的文本驱动生成数字人系统，包含语音合成（自动音频标注、自定义语料训练、多音字和特殊字符识别）、文本驱动图像人物肢体动作、语音驱动人物唇形和肢体动作（音频驱动图像\视频唇形和肢体动作）。使用到的技术：语音合成算法相关（TTS、Paddlespeech、Spleeter、Whisper）、音频驱动人物唇形和肢体动作（MuseTalk、SadTalker、Video-Retalking、Audio2photoreal、Vlogger）、文本驱动人物肢体动作（MuseV）。

2024-07-10 16:41

语音合成系统

语音合成系统开发的主要目的在于释放人力配音。因此系统的主要功能点包含：语料自动标注、语料训练和语音合成三大功能模块。注：语音合成效果逼真度接近90%，因此需要制定相应的规则保护语音所有权人的权利不受到非法侵害。

2024-07-10 17:30

更新于: 2024-07-10 浏览: 200

个人介绍

工作经历

教育经历

资质认证

技能

相似推荐换一批

重点城市程序员兼职推荐

重点岗位程序员兼职推荐