工作经历
2022-07-19 -2022-09-16广东蔚海数问大数据科技有限公司数据分析师
【项目概述】 对专利数据提取关键词和关键短语、文本分类和语义检索。 根据用户输入专利的摘要, 召回相似的专利 【责任描述】 负责利用 KeyBERT 思想提取专利文本中的关键词和关键短语 负责搭建 NLP 分类模型:对专利摘要数据根据主 IPC 字段进行分类 负责利用基于领域预训练和对比学习 SimCSE 方法增强模型语义表征能力 负责搭建基于 PaddlePaddle 与 Milvus 的通用语义检索系统框架 负责利用并行粒子群算法调整不同字段的向量权重, 合并为单一向量
教育经历
2023-09-04 - 2026-07-01中山大学计算机科学与技术硕士
2019-09-02 - 2023-07-01华南师范大学人工智能本科
技能
【项目概述】 对专利数据提取关键词和关键短语、文本分类和语义检索。根据用户输入专利的摘要, 召回相似的专利 【责任描述】 负责利用 KeyBERT 思想提取专利文本中的关键词和关键短语 负责搭建 NLP 分类模型:对专利摘要数据根据主 IPC 字段进行分类 负责利用基于领域预训练和对比学习 SimCSE 方法增强模型语义表征能力 负责搭建基于 PaddlePaddle 与 Milvus 的通用语义检索系统框架 负责利用并行粒子群算法调整不同字段的向量权重, 合并为单一向量
【项目概述】 对广州公共资源交易中心的数据进行知识挖掘, 负责该系统数据分析所有核心模块的开发 【责任描述】 对上传的文档进行相似文档检测及相似文档推荐 构建交易价格指数体系、市场运行指数体系