个人介绍
8年以上技术管理经验:包括项目管理,常规代码review,项目管理平台搭建,解决方案编写,投标,申报专利和软著,培训,前沿技术预研,核心架构搭建等。带领技术团队,规模10人以上。
10年以上linux开发和部署经验,10年嵌入式开发经验,10年网络协议开发经验。
擅长数学建模和利用Python搭建机器学习模型。
有GIS数据处理经验,有无人机飞控开发经验,熟悉ROS,熟悉常用的视觉slam算法,激光slam算法。
工作经历
2019-02-01 -2023-10-12武汉数美科技科技有限公司 技术总监
公司主营金融数据库和相关应用。 作为技术部负责人 :主要负责智能化资讯生产,包括解析PDF,利用自然语言处理工具hanlp对资讯打标签等; 基于知识图谱对资讯做智能推荐;提炼创新点和发表专利。 1. 在自动生产和分发资讯的内容管理系统中,定时爬取资讯自动生成html,转成word,然后自动发送给客户,后台使用Django。 2. 在预测股票价格的诊股系统中引入机器学习梯度提升回归(GBR) 算法,并且利用符号近似聚合技术(SAX) 对数据进行降维处理,大大提高了机器学习模型的训练和预测的时间效率;引入协整方法比较时间序列的相似度,然后利用相似度最高的多个股票的历史K线数据进行训练和预测,得到准确率很高的预测效果。申报专利。 3. 在PDF深度解析系统中利用研报中表格和曲线图稳定的坐标特征做聚类分析,自动定位表格,曲线图的范围,表格和曲线图的精准定位保证了主要文本内容的有序性和准确性。通过提取关键维度内容,研报自动发布,并且保留样式,保证质量的同时生产效率大大提高。申报专利。 4. 在智能资讯系统中:利用图数据库构建企业知识图谱;利用nlp工具给资讯打标签,匹配知识图谱的相关标签,加入图
2017-11-01 -2019-02-01湖北地信科技集团股份有限公司高级软件工程师
公司主营GIS相关解决方案包括智慧城市等。 负责维护老开源项目geotrellis:采用云计算技术对TIFF格式的影像瓦片切割,效率极低(时间太长,失败率太高)。 负责建设海量影像数据管理平台:主要包括海量影像管理、影像发布与预览。 1. 影像读写使用GDAL库接口;坐标范围等空间索引数据存储和检索使用C++ boost库中geometry相关接口。 2. 影像裁剪和镶嵌按照指定的元数据,动态提取数据,不生成静态影像文件或数据。 3. 新的动态提取影像架构简化了处理流程,发布效率提升10倍以上,而且基本无中间文件输出,基本无失败记录。
2015-06-01 -2017-10-10北京匡恩网络科技有限责任公司技术经理
公司主营工控网络安全产包括保护和审计产品。 开发语言 中间件使用Python,底层使用C,数据库使用MYSQL。 作为项目负责人,监测审计和保护审计产品的需求调研,设计方案,制定开发计划,发布版本和支持现场实施。包括: 1. 设计和实现域名检测功能以发现隐藏的蠕虫病毒:结合NLP的n‑gram方法,利用机器学习的算法SVM检测异常恶意域名请求,申报专利。 2. DPI解析:goose,sv,和利时,FTP,TELNET,HEXAGON等。 3. 上网行为审计和内容审计需求调研,设计和功能开发,申报专利。 4. 系统可靠性设计和实现,系统性能优化。
教育经历
2006-09-01 - 2008-07-01武汉大学材料物理硕士
2002-09-01 - 2006-07-01武汉大学物理学本科
技能
服务内容全部包含: DPI协议解析。 嵌入式linux系统定制。 利用机器学习进行数据分析。 数据库表设计和性能优化。 系统性能优化。 服务部署。 服务优势: 8年以上技术管理经验:包括项目管理,常规代码review,项目管理平台搭建,解决方案编写,投标,申报专利和软著,培训,前沿技术预研,核心架构搭建等。带领技术团队,规模10人以上。 10年以上linux开发和部署经验,10年嵌入式开发经验,10年网络协议开发经验。 擅长数学建模和利用Python搭建机器学习模型。
服务内容全部包含: 使用私有云盘管理大容量tiff格式影像数据。 tiff影像可以发布为标准的tms服务。 前端页面可以预览tms服务。 属于webgis功能。 服务优势: 曾任职GIS公司,负责维护老开源项目geotrellis:采用云计算技术对TIFF格式的影像瓦片切割,效率极低(时间太长,失败率太高)。负责建设海量影像数据管理平台:主要包括海量影像管理、影像发布与预览。
服务内容全部包含: 提取PDF关键维度的内容,生成结构化的段落。 对字符的字体和样式做聚类分析,生成样式和PDF高度一致的HTML页面。 生成html高度还原PDF。 服务优势: 1. 利用PDF解析得到的字符,线,矩形框,文本行等元素的位置信息做聚类分析,精确定位表格,提高了解析的准确度。 2. 通过语义分析得到关键维度的内容,以HTML形式展示时,保留关键样式信息,和PDF原文保持高度一致,改善了阅读体验。 服务前需客户提供的信息: PDF样例需要覆盖用到的所有PDF基本排版。 需求需要明确HTML还原哪些元素,比如是否需要样式信息等。 解析性能要求比如错误率要求。