个人介绍
1. 基础技能:熟练运用 python, java,linux,pytorch,sklearn,TensorFlow,git, 正则, mysql,neo4j等等。
2. 专业技能:
① 掌握《李航 统计学习方法》,《周志华 机器学习》书中内容;
② 能够处理NLP中常见的任务,对其中的难点,如序列标注会涉及关系抽取,实体嵌套的难点做过了解。
3. 仅限了解:
①学习时对CV中比较有名backbone都有了解过;
② 对前后端了解,如php,html,css,js这些;
③ 对大数据知识如hadoop+spark生态,ElasticSearch技术栈也学习过;
④ 模型压缩(量化,剪枝,蒸馏),以及多模态(visual bert, vilbert),CTR任务等曾都有去了解。
工作经历
2021-07-15 -2021-12-01北京颐圣智能科技有限公司NLP机器学习工程师
公司的产品面向医院,对病案就行质控。 主要负责:公司的质控规则的开发,指标规则的开发。经过医学部统计,我开发的部分准确率在98%以上,开发语言为java和 groovy,另外围绕需求做出以下可展示成果: 1. 地址字符串的解析。一段为地址的字符串,解析出省市县,其中主要需要考虑到别名,简称,纠错,补全等。 2. 药品匹配工具。匹配出给定字符串中出现的药品,以及它的类别。其中主要需要考虑药品别名,简称,药品属于多种类型药 等。 3. 主诉判定模型。针对病案中的主诉,判定医生是否写错。其中主要用到损失叠加,加上了现病史与主诉是否相关的损失。 4. 诊断相似度模型。给定两个诊断写法之间的相似度,因为医学的诊断很多只差一个字但表达完全不同的意思等难题存在,最 终在大量的样本下,通过规则+模型的方法给出最后的模型。经过医学部检验准确率在95%以上。
教育经历
2017-09-01 - 2021-07-01齐齐哈尔大学计算机科学与技术本科
研究经历: 基于YOLO v3的车道流量统计与多目标跟踪系统设计与实现 (毕业论文 2021年03月 - 2021年07月) 1. 车道线检测:边缘提取和颜色阈值的方法提取车道线特征,直方图统计+最小二乘法拟合。 2. 车流检测:利用迁移学习模型 YOLO v3 实时车辆...
技能
基于*公众号作为客户端,是一个基于知识图谱自然语言理解方向的问答机器人。 1.基于大规模知识图谱技术与自然语言处理在医疗领域的应用场景 2.基于语音识别与语音生成技术的与患者语音沟通的交互方式 3.基于微服务架构的人工智能产品 4.基于端到端以及结合知识库的多轮多任务对话系统网络结构 5.数据清洗以及知识抽取、知识图谱构建 6.图数据库neo4j相关技术点及基本操作 7.Pipeline方式与end-to-end流程设计方式以及不同 8.mem2seq模型论文到代码实现方案 9.*公众号接口开发以及第三发api接口集成
主要负责: 公司的质控规则的开发,指标规则的开发。经过医学部统计,我开发的部分准确率在98%以上,开发语言为java和 groovy,另外围绕需求做出以下可展示成果: 1. 地址字符串的解析。一段为地址的字符串,解析出省市县,其中主要需要考虑到别名,简称,纠错,补全等。 2. 药品匹配工具。匹配出给定字符串中出现的药品,以及它的类别。其中主要需要考虑药品别名,简称,药品属于多种类型药 等。 3. 主诉判定模型。针对病案中的主诉,判定医生是否写错。其中主要用到损失叠加,加上了现病史与主诉是否相关的损失。 4. 诊断相似度模型。给定两个诊断写法之间的相似度,因为医学的诊断很多只差一个字但表达完全不同的意思等难题存在,最终在大量的样本下,通过规则+模型的方法给出最后的模型。经过医学部检验准确率在95%以上。