工作经历
2023-06-05 -2023-09-24深圳回收宝科技有限公司数据运营
1、每日爬取竞品数据,对比平台产品价格,搭建BI报表,为运营部门分析人员提供数据,便于比对调价处理。 2、使用flask+react+dash技术,自研报表系统,设置管理模块供专有人员进行报表查看。
2023-02-10 -2023-04-30广州国家现代农业科技创新python开发
1、基于企业数据,负责花生种质资源信息管理项目初期开发。主要负责两个模块开发。数据录入模块:用户可以通过文件或者系统导入方式传入数据。花生种质推荐模块:根据用户种植地区,基于已有数据,为用户推荐适合种植的花生品质 2、运用生物信息学、机器学习等,构建水稻基因型分析平台,实现了PCA、进化树、遗传图谱模块设计。
教育经历
2019-09-01 - 2023-05-17惠州学院生物信息本科
大学主研生物信息方向,除生物专业自身内容,还学习过计算机基础,网络基础等课程。大学期间深入学习python编程语言,参与过泰迪杯数据分析、数据挖掘比赛,且获得省一,国二等奖项。
技能
Qtale是一款基于问卷数据的分析开源软件,Qtale的设计参考了python数据分析可视化工具Dtale。Qtale预期实现的模块包括结构方程模型构建、数据可视化、接入Chatgpt工具辅助分析等,采用插件化的开发方式,允许第三方开发者为该软件赋予额外功能。 当前完成模块包含了数据录入,数据统计功能。
抓取某科研机构一定的水稻数据。对数据进行存储、解析。 爬取难点: 该科研机构网页中嵌入了图片格式的数据,替代html文本。需要采用图形识别算法对图片格式的数据进行解析识别,再重新上传到数据库,避免数据污染。 对于非结构化数据,采用Mongodb存储。 技术栈:playwright+mysql+mongodb+orc文字识别
1、项目介绍: 基于企业提供的花生种质资源数据,构建信息数据库,打造包含了花生种质资源的父本、母本信息、其他研究机构区域实验数据的数据中枢平台,通过统一机构不同实验数据,为其他个体企业或商户提供种植品种推荐等定制方案。 此外,平台利用花生的基因信息数据,提供进化树、遗传距离矩阵热图、PCA等生物信息分析工具。 2、技术栈实现 基于项目背景,后端选用python语言Flask框架,前端采用React, Dash技术。数据库采用mysql、mongodb进行存储。使用celery+redis实现消息队列。数据分析工具基于python中sklearn以及r语言等进行开发。