个人介绍
1、在stable diffusion、controlnet,3D数字人等AIGC方向有项目实战经验。
2、先后就职于爱立信、YY等多家业内领先企业,十多年以上工作经验,算法研发和落地经验丰富。
3、YY T3-2职级,负责多个算法研发项目上线,包括人体姿态估计、手势识别、视频质量评价、短视频检索、短视频去水印等。
4、拥有丰富的移动端、服务端计算机视觉算法研发和产品落地经验,可实现多项目统筹管理。
工作经历
2020-12-18 -2023-11-07北京数字力场算法工程师
算法开发: 1)负责单张照片生成数字名片、MetaX头发属性识别 2)基于stable diffusion的dreambooth微调模型,实现自动生产3D数字服装的平铺纹理和局部logo 3)基于stable diffusion、controlnet对网络结构和数据处理进行定制化改造,训练换发型大模型,实现姿态迁移和精准控制 项目职责: 1)算法效果调优,端到端交付; 2)协调美术外包,推进3D数字人美术流程和效果优化。
2017-09-27 -2020-11-20欢聚时代计算机视觉算法工程师
算法开发:1)手势识别和跟踪研发:手势识别精度和性能优于竞品商汤,手势识别SDK销售给趣头条、当当网、苏宁易购等客户。 2)人体姿态估计项目:通过优化人体姿态估计模型、改进后处理逻辑、微调模型结构等方法,实现动作识别策略,支持YY 直播间的“快速下蹲”、“原地跑步”、“性感扭腰”等欢乐斗互动玩法。可实现半身和全身检测,是市面上第一款人体姿态估计的成功落地场景应用。 3)视频质量评价项目:基于google NEMA算法框架,设计短视频场景下图像质量等级和标注策略,精度达到92%,大幅度提升视频审核的效率。 项目职责:带领4人算法小组进行需求分析、算法技术拆解、数据分析、算法性能优化,与产品、运营、测试协同推动项目上线部署。
教育经历
2002-09-01 - 2005-07-14华中科技大学模式识别与智能系统硕士
1998-09-01 - 2002-07-01哈尔滨工程大学模式识别与智能系统本科
技能
1. 手势识别精度和性能优于竞品商汤,手势识别SDK销售给趣头条、当当网、苏宁易购等客户。 2. 设计3阶段模型,包括检测,分类,跟踪模型;持续改进调优模型效果 3. 解决抖动问题和稳定性问题;
1. 改造latent diffusion源代码,添加多个条件,通过self attention和cross attention机制训练自定义的多个控制条件的扩散模型训练,实现发型的变形,融合,支持精确控制。 2. 基于50W头发数据训练VAE编码器和解码器模型,实现高清发型的生成