飞天小喵
1月前来过
全职 · 300/日  ·  6525/月
工作时间: 工作日09:00-17:00工作地点: 远程
服务企业: 0家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

我是程序员客栈的飞天小喵,一名数据工程师; 我毕业于华中科技大学,担任过腾讯公司的高级运营开发工程师、高级数据科学家; 负责过服务器运营领域的数据仓库建设、指标体系搭建、AIOps***付业务的数据仓库建设、设备质量提升项目,内容安全领域的人效模型的研发创建; 熟练使用python,sql,hadoop生态工具,常用机器学习算法; 如果我能帮上您的忙,请点击“立即预约”或“发布需求”!

工作经历

  • 2012-07-06 -2023-03-31腾讯科技运营开发已认证

    主要负责过服务器运营数据的管理,服务器智能运维(AIOps),服务器指标体系建设,TB 级离线数据接入系统的设计实现等内容;刷脸支付业务相关的数据仓库建设、IoT 设备质量监控和唤活;内容安全业务相关的人力效能评估体系的研究创建及机器人力成本管理。

教育经历

  • 2012-09-01 - 2014-06-30华中科技大学计算机技术硕士已认证

  • 2008-09-01 - 2012-06-30华中科技大学计算机科学与技术本科已认证

技能

Hadoop
机器学习
Spark
MySQL
特征处理
0
1
2
3
4
5
0
1
2
3
4
5
作品
人效模型应用

1、项目分为三个部分:数据源获取和数据处理、人效模型构建、模型应用上线。 2、难点和解决方案:(1)数据源选取:用实际达成效率结合线下抽查压测数据做数据打标、结合主客观特征做特征加工;(2)特征工程:区分静态特征和动态特征,对非结构化特征做结构化处理,对信息稀疏型特征提炼多维度描述和统计特征进而做降维处理,通过线性、非线性特征评估方法评估特征重要程度做特征选取。

0
2024-03-21 12:21
硬盘故障预测模型应用

1、项目分为三个模块:数据源选取和数据处理、故障预测模型构建、模型运营上线。 2、难点及解决方案:(1)数据源选取:选用硬盘SMART,结合硬盘IO和机器部件配置及年限等;(2)模型构建:利用SVM算法结合机器部件配置信息给出硬盘健康度打分,根据核心特征项和运营维度设置运营策略;(3)模型上线:结合模型输出风险打分对高风险硬盘发起告警流程,提供运营操作界面,供运营策略配置及对中低风险硬盘提供手动激活故障流程的功能。

0
2024-03-21 12:01
内存故障预测模型应用

1、项目包括三大模块:数据采集和接入、故障建模和预测、数据服务。其中数据服务包括对接故障告警系统发起故障流程、提供BI报表提供可视化查询分析功能、提供数据查询接口供业务调用。 2、项目难点及解决方案:(1)设计选取反应内存故障的相关特征:利用EDAC日志中CE时空分布设计多种特征;(2)设计反映内存故障风险的模型:利用多种内存故障数据源弱化非平衡数据集问题,增加CE基线减少误报,对比多种机器学习算法选取随机森林回归建立健康度评估模型;(3)实现内存最大化利用:结合pageoffline技术对更细粒度的CE预测,对风险page做精准pageoffline而不是一刀切更换内存条,提高内存的使用寿命。

0
2024-03-21 11:37
更新于: 03-21 浏览: 141