个人介绍
2. 有桌面系统、网络爬虫、数据分析、后端api开发、网络通信以及语音合成与识别方面的工作经验;
3. 有深度学习工程化落地经验,熟悉pytorch、tensorrt等框架;
4. 有sse、avx向量指令集优化经验;
5. 编程能力强,获得过上海大学研究生程序设计与应用竞赛一等奖;
6. 为人诚实,学习能力强,工作认真负责。
工作经历
2019-08-27 -2022-10-01喜马拉雅软件开发工程师
工作内容:负责端到端语音合成、语音识别相关的工程化工作 使用的编程语言:C/C++/Python 相关技术:语音合成、语音识别、音频编码、深度学习、GPU 编程 主要业绩如下: 1) Wavernn 模型 pytorch 源码转 C++,并优化效率,实时率提升 2 倍; 2)使用 FFMPEG 库实现音频重采样以及 AAC 音频编码功能; 3)Kaldi 特征提取性能优化,实时率提升 3 倍; 4)端到端语音识别系统 python 代码转 C++,并优化效率,实时率提升 4 倍;
2017-08-01 -2019-06-01云知声语音合成工程师
工作内容:负责语音合成引擎的功能开发与维护 使用的编程语言:C/C++/Python 相关技术:语音合成,机器学习,深度学习 主要业绩如下: 1)负责语音合成引擎 bug 修复以及版本发布工作; 2)集成各种语言特征模型; 3)实现中英文文本归一化功能、多音字预测功能、英文文本 trie phone 信息的提取; 4)优化 world 合成器性能,提升 8 倍; 5)使用 Tensorrt C++ API 实现 Tacotron2 模型。
2016-07-01 -2017-08-01思科上海研发中心软件开发工程师
工作内容:参与思科路由器 ASR1K 平台网络第二层(数据链路层)软件开发工作; 使用的编程语言:C 相关技术:路由器、网络协议 主要业绩: 1)ERSPAN 添加 drop session 功能:ERSPAN 用于抓取网络数据包,本人的工作是支持配置 drop session,抓取被 drop 掉的数据包,发往给目的端口,通过在不同路由器上配置 drop sesseion,并将抓取的数据包发往同一目的端口,目的端口所在主机可以通过统计判定网络故障。 2)Endian Neutral:ASR1K 平台软件架构采用的是分层的思想,不同的层跑在不同的芯片上,不同的芯片可能对应不同的大小端模式,由于有些层一直使用的是特定的端模式,所以在这些层中存在大量的代码,没有对端模式做判断,当运行在另一种端模式时,代码不能正常工作。本人的工作是找到若干模块中存在大小端问题的代码,并修改为大小端都支持的代码。 3)bug 修复。
教育经历
2012-09-01 - 2016-04-01上海大学计算机软件与理论硕士研究生
必修课:模式识别、高性能计算机体系结构、软件测试与验证...... 研究课题是模型验证在软件系统中的应用