Snowball95
1月前来过
全职 · 500/日  ·  10875/月
工作时间: 工作日08:00-23:30工作地点: 远程
服务企业: 1家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

l 5年NLP算法工程师工作经验,能够独立完成项目从0-1的开发,熟悉分词、命名实体识别,知识图谱、关系抽取、实体链接、文本分类、机器学习建模等项目运作流程。

职业优势:拥有50+个项目实操经验,擅长问题诊断及处理,能够利用自然语言处理、机器学习相关技术,根据公司业务场景,结合模型算法,提出针对性的技术解决方案。

综合素质:自驱型,认真细致,较强问题解决能力,系统的逻辑思维,具备抗压及承压能力,善于沟通总结及换位思考,能够快速适应新的工作环境,具备良好的团队协作能力及服务意识。

l 编码能力:熟悉Linux操作系统、Python编程语言。

框架使用:熟悉机器学习相关库(sklearn、pandas和numpy),善于进行数据处理、特征工程、特征衍生、及基于sklearn的建模流程、模型融合等,熟悉NLP相关库(jieba、pyltp及gensim),善于对各类文本进行清洗、预处理及词向量训练;熟悉Pytorch框架;熟悉基于Django的Web服务开发

机器学习能力:熟悉线性回归、逻辑回归、决策树、支持向量机、随机森林、Adaboost、GBDT、XGBoost、lightgbm、catboost等算法的原理及使用,掌握特征工程中的特征衍生与特征筛选原理及使用,了解模型融合方法原理及使用。

自然语言处理能力:熟悉语言模型、HMM、CRF的原理及使用,熟悉RNN、LSTM等深度神经网络的原理及使用,熟悉Emlo、Transformers、Bert及Bert的多种变体的原理及使用,熟悉onnx推理加速、模型蒸馏等模型优化方法。

数据结构与算法:熟悉数据结构与算法,如动态规划、回溯、树等。

工作经历

  • 2018-04-15 -至今数控算法工程师

    5年NLP算法工程师工作经验,主要负责Python自动化、机器学习建模和自然语言处理方面的工作,能够独立完成项目从0-1的开发,熟悉分词、命名实体识别,知识图谱、关系抽取、实体链接、文本分类、机器学习建模等项目运作流程。 职业优势:拥有50+个项目实操经验,擅长问题诊断及处理,能够利用自然语言处理、机器学习相关技术,根据公司业务场景,结合模型算法,提出针对性的技术解决方案。

教育经历

  • 2013-07-01 - 2017-07-01内蒙古农业大学网络工程本科

技能

深度学习
机器学习
自然语言处理
0
1
2
3
4
5
0
1
2
3
4
5
作品
基于知识图谱的问答及全链路监测系统

项目背景:通过搭建知识图谱系统进行规整管理,提升工作效率的同时,完成数据信息统一化,进而实现资产关系快速检索及全链路关系查询,做到系统发生故障时的根因分析定位。 项目职责:主导命名实体任务开发及优化+关系抽取、实体链接模型设计与研发+KBQA问答服务。 效果提升:提出通过构造不同的标签序列标注方案进行训练,解决中英文混合输入等问题,提升使用 提升工作效率的同时,完成数据信息统一化,进而实现资产关系快速检索及全链路关系查询,做到系统发生故障时的根因分析定位。 项目职责:主导命名实体任务开发及优化+关系抽取、实体链接模型设计与研发+KBQA问答服务。 效果提升:提出通过构造不同的标签序列标注方案进行训练,解决中英文混合输入等问题,提升使用效果,f1 score最高达96%,较之前提升17%。 模型搭建:主导关系抽取模型及实体链接模型搭建,通过elasticsearch做倒排索引召回,解决实体命名不一致问题,通过Bert_Biaffine模型有效进行嵌套实体识别,提升工作效率。 项目成果:顺利完成项目落地,实现KBQA问答服务,满足业务需求。

0
2023-04-04 21:22
命名实体识别系统

项目背景:自研实体识别系统,保障实体识别质量及系统良好扩展性。 项目职责:独立完成项目从0-1设计,主要架构:模型识别+AC自动机词库匹配+正则后处理 实体类别问题处理:深入分析实体类别、标签分布不均匀原因,提出通过数据增强+EDA加噪+标签截断等方式,缩小实体类别差距,提升训练数据质量。 应用效果及速度提升:通过ONNX实现推理加速,同时实现模型蒸馏,有效提升模型运行时间,提升应用场景效果。 对内沟通协调:高效沟通,指导完成数据整改,增加正则的后处理,实现实体规范化管理。 项目成果:各模型在hdfs、apache等6个训练集的准确率基本保持93%+,完成1700+日志模板结构化,满足业务场景需求,在知识图谱中发挥重要作用。

0
2023-04-04 21:20
工业级中英文分词系统

项目职责:独立完成项目从0-1的设计工业级的中英文分词系统 算法筛选:深入分析项目难点,针对英文不能使用常规方法切分及新登陆词识别问题,提出采用制定提取模版、利用HMM模型和CRF模型进行序列标注的方式实现分词规范化,同时融入新词发现模型和NER词典,提升新登录词发现能力。 策划优化:通过CRF、BiLSTM_CRF等解码状态设置,降低计算难度,采用前缀词增加等方式,避免不必要搜索,提升运行速度。 词图构建:合理进行优先级布局,加入复合词典,由正则词典、专业领域词典、实体识别模型、序列标注模型、核心通用词典等,完成词图基础构建,基于此计算最佳路径,从根本解决问题

0
2023-04-04 21:18
更新于: 2023-04-04 浏览: 128