个人介绍
本科毕业于内蒙古大学软件工程专业,从业软件开发工作8年,项目管理工作2年,曾就业于华为。工作项目涉及如公安、云计算、社交媒体、国家电网、医疗、数据库软件等领域,可提供网站搭建、数据分析、工具脚本开发等服务。在项目需求上比较注重用户体验细节,考虑问题较周到,长期或短期需求均接。技术方面特长丰富,JAVA/PYTHON/GO等主流语言均可,对常见的结构性数据库或非结构性数据库、缓存机制、容器、微服务、多并发编程、性能优化、版本控制、运维等都有丰富的开发经验。
工作经历
2022-12-14 -至今北京欢娱勇气网络有限公司开发工程师
1.使用阿里/腾讯等服务商的ASR服务,独立搭建公司全业务线质检服务项目,实现每天对几十万主播沟通话术、招待沟通的质检工作,查准率约在80%及以上。并支撑其他质检需求的ASR+文本展示+敏感词展示等服务工具开发。 2.使用易盾等第三方服务工具,实时对语音房进行风控检测,并开发智能审核平台按内部需求校准违规,如涉政涉黄违反其他条例等,并对房间或主播进行实时处罚,再通过申诉处理等达成风控闭环。 3.为了达成激励主播KPI的目的,根据送礼、上麦、互动等业务数据,敏捷开发活动文章推送、账户奖惩、进展通知等,促进增长业务。
2021-11-01 -2022-12-01北京志翔科技股份有限公司数据分析组长
项目概述: 专变异常用电分析项目主要用于协助国网公司营销部门实现反窃查违工作,通过10KV 线路为分析单元,结合电气业务以及能量守恒定律,构建误差分析模型或专家诊断模型,对线路上的计量点进行统一分析,从中筛选出疑似专变窃电用户,提升检出效率和准确度。 模型介绍: 1.误差分析模型: 误差失准分析模块通过接入用电信息采集系统的10kV 线路相关变电站关口出线侧计量点、联络开关计量点、专变用户计量点、公变用户计量点的日冻结、电能示值曲线、电压曲线、电流曲线、功率曲线、功率因素曲线等采集运行数据,采用中压线路供电分析应用模型、中压线路运行误差分析计算模型、数据异常检测分析模型分析线路相关计量点的运行情况,识别出误差超差和疑似故障电能表并及时预警,根据现场核查结果计算运行误差模型的识别准确率。 整个模型包含数据处理层、模型计算层、算法层和结果输出层四部分。数据处理层主要是针对各网省的数据做统一标准化以及数据校验和数据转换等功能;模型计算层主要做计算单元任务处理分发和资源控制;算法层为模型分析核心,利用用户负荷或电压电流等数据,结合聚类、数据归一化处理、曲线拟合、噪声过滤、线性回归等数据分析方法
2020-06-01 -2021-10-31华为技术有限公司全栈加交付
1.DWS现网及版内部版本问题管控面相关问题单修复,涉及安全、接口、权限以及管控面相关微服务的部署运维,对相关代码进行开发及重构 2.DWS内部用户的ServiceCM API的开发工作 3.DWS x86/arm集群的镜像制作 4. DWS内核及管控面版本备份恢复和跨region容灾场景的测试,备份介质区分OBS/DISK/NBU,包括功能、FIT测试、场景交互测试,根据grtmgr框架开发自动化测试脚本,参与容灾用例输出和测试复盘 5.参与荣耀搬迁方案制定,独立完成搬迁工具的开发工作,与客户共同完成测试搬迁环境演练和正式生产环境搬迁工作,指导客户进行业务验证。整个搬迁流程涉及元数据及业务数据的搬迁,利用脚本满足客户侧多并发、宽表拆分、异常处理、搬迁重入、索引序列等特殊数据库对象处理、obs/hdfs外表改造等需求 6.对客户现场持续观测集群状态,观察包括CN、DN的IO/内存/CPU/DISK各项指标情况,资源消耗过大时,判断是否有长语句查询/跑批业务/高并发查询的情况,及时规避其他业务对健康码业务的风险 7. 对一线同事做DWS培训,对SQL语句优化方法做赋能 8. 及时发现和记
2018-07-01 -2020-06-21北京志翔科技股份有限公司数据分析工程师
1.对审计系统产生的日志进行预处理(解析、处理、入库),利用公司分析工具(ruleng,对es分类聚类的实现)并根据用户所定义的审计规则进行日志分析,输出多类异常分析结果 2.对国网电能表进行电表寿命预测,对国网电表能数据进行数据预处理(处理不合规、缺失数据等),利用电表的型号、批次、规格等属性数据和生存分析算法进行数据分析,得出不同批次电表的寿命,区分为故障批次、待更换批次、正常批次等 3.对国网电能表数据进行分析,利用总供电量=总表用电量+分表用电量+线损+误差的能量守恒原理,并考虑现实中三相不平衡、热能电能转换等情况,计算电表的运行误差,预先分析出有问题电能表、可能窃电用户等,减少国网公司损失 4.根据国网其中十六类的电能表数据、批次数据、用电数据的逻辑关系以及现实用电的不同场景(窃电、相位、用电习惯、用户拓扑结构等)进行数据仿真,对功能性代码进行编写,设计简约配置实现快速生成不同需求的仿真数据,用于运行误差监测系统进行大数据分析
2016-07-01 -2018-07-01北京拓尔思信息技术股份有限公司JAVA开发工程师
1.为公安部科技信息化局制作数据处理分析平台,包含离线挖掘可视化应用组件、在线分析与服务可视化应用组件、证件号码数据库三部分。通过离线挖掘应用组件,可视化操作实现海量数据的提取、比对、统计和深度挖掘功能,定制个性化的数据处理任务;通过在线分析与服务可视化应用组件,方便、简单的操作实现在线实时分析、数据圈定、接口生成等功能;通过证件号码库实现相关证件、号码的查询,一组证件、号码的核查。 2.针对公安部科技化信息局的民警常用的检索平台完成一个定制化的安全审计平台,实现对公安网用户异常操作等风险行为的监测与管理,从单纯的日志搜索转向行为分析、趋势预测、人员预警等更深入和实战的需求,解决公安网数据盗取、越权访问、信息泄露的问题。具体实现方法是针对民警海量的操作日志(点击、登录、检索、其他操作),分析各类使用情况指标(常用IP/接触资源情况/操作量有异常/操作量突变/敏感词检索/夜间操作等),并给出风险指数,同时也提供各类指标的报表选择生成功能。数据是从Oracle原生日志进行每日的定时抽取,每日的数据为一个分区,抽取存储到ODPS平台,再进行去重、标识字段等数据清洗过程,将生成的日志数据及处理
教育经历
2012-08-25 - 2016-06-30内蒙古大学软件工程本科
内蒙古大学2012级本科软件工程专业,与2016年毕业。
技能
为中国医学科学院医学信息研究所(医科所)研发资源管理服务平台,为平台登记工作组提供平台资源存储及数据共享标准的统一性和规范性登记平台,并在此过程中完成资源管理、评价及反馈等内容,从而建立资源统一管理与评价的机制。
项目概述: 专变异常用电分析项目主要用于协助国网公司营销部门实现反窃查违工作,通过10KV 线路为分析单元,结合电气业务以及能量守恒定律,构建误差分析模型或专家诊断模型,对线路上的计量点进行统一分析,从中筛选出疑似专变窃电用户,提升检出效率和准确度。 模型介绍: 1.误差分析模型: 误差失准分析模块通过接入用电信息采集系统的10kV 线路相关变电站关口出线侧计量点、联络开关计量点、专变用户计量点、公变用户计量点的日冻结、电能示值曲线、电压曲线、电流曲线、功率曲线、功率因素曲线等采集运行数据,采用中压线路供电分析应用模型、中压线路运行误差分析计算模型、数据异常检测分析模型分析线路相关计量点的运行情况,识别出误差超差和疑似故障电能表并及时预警,根据现场核查结果计算运行误差模型的识别准确率。 整个模型包含数据处理层、模型计算层、算法层和结果输出层四部分。数据处理层主要是针对各网省的数据做统一标准化以及数据校验和数据转换等功能;模型计算层主要做计算单元任务处理分发和资源控制;算法层为模型分析核心,利用用户负荷或电压电流等数据,结合聚类、数据归一化处理、曲线拟合、噪声过滤、线性回归等数据分析方法,分析中压线路运行超差情况;结果输出层包含画图、数据存储、结果展示和数据推送等功能。 2.专家诊断模型: 专家诊断模型是根据单个用户用电特征以及相关用户档案、通信数据报告等信息,并结合国网反窃查违业务、电气原理分析用电异常,主要包含电流爬坡、接线错误、间歇性窃电、失压、断相、失流、三相用电不平、超容、高频电磁干扰、零度户、分相电量异常等单表分析模型。 1.在16个省公司或地市公司做专变异常分析服务或实验输出,共输出窃电、违约用电、接线错误、倍率错误、计量设备故障等异常用户1479户,其中下发核查815户,命中约525户,命中率约64.4%,追补费用约在4000万左右 2.参与设计和优化能量守恒模型和专家诊断模型,如滤波降噪选点分析、分相有功相关性分析、超容分析、错接线分析、电流爬坡分析等,模型检出率由千分之一提升约千分之三 3.梳理并解决国网各省业务数据差异性、来源平台差异性、数据关联计算差异性等,制定数据标准化方案,统一模型数据入口和数据质量检测需求,提升模型分析效率周期
项目功能介绍: 1.社交软件风控,分为实时音频检测、聊天内容检测、风控策略自动化配置、人工标记处理、自动标记处理、智能提醒及智能打击功能。风控策略由运营和技术针对社交软件特性共同设计,包含涉政、涉黄、未成年管控、欺诈、语言暴力识别等,对违规用户做提醒、管控、封号等处理。 2.BC端用户交流质检,分为离线ASR、文字策略配置、自动化质检(智能策略配置、GPT识别)并进行合规性标记、人工标记审核功能。 涉及技术: 1.风控实时处理系统为kratos框架,实时处理部分使用rockermq进行通信,数据存储方面主要使用mongo、mysql、redis,离线数据会存储在odps做数据分析 2.质检系统使用python开发,ASR服务链包含音频上传、音频剪辑、语音识别,主要使用ffmpeg、openai-whisper或阿里云和腾讯云的相关识别接口,识别系统根据社交软件特性支持不同语音房、上麦场景配置,自定义策略通过文字正则、用户画像、谈话内容、时间要求上对用户进行行为分析,比如平台内部工作人员有没有一起打游戏聊天等,聊天内容是否有激励用户活跃和积极态度等。汇总分析结果给运营进行标注并根据结果规范内部工作,达成优化平台内部工作人员行为,优化用户体验的目的。