个人介绍
央企科研单位工作,接单兼职,熟悉python、c++等,有丰富开发经验,可承接规模较小的个人开发算法或项目。
◊ 熟悉常用路径规划算法,轨迹细化算法, LQR及MPC控制
◊ 熟悉遗传模糊树算法,强化学习算法,常用的机器学习算法及小样本处理方法
◊ 熟悉C++及Python语言
◊ 熟悉Linux基本指令,了解Shell脚本编程,ROS操作系统
◊ 熟悉常用的设计模式及UML建模
◊ 了解Spark生态体系,消息队列中间件,gRPC等网络中间件
工作经历
2020-01-01 -2020-11-01北京第五维科技软件开发工程师(兼职)
承接美国雅思教育类公司、SecureFund等开发的线上教学、移动支付等接口适配、配合主要团队进行功能维护等。主要框架是SpringCloud。
2016-10-01 -2017-06-30北京久其软件股份有限公司大数据工程师
项目描述 项目以全国第三次农业普查为背景,由于普查数据分布在各分支乡县,需要对各种数据进行ETL到数据仓库,并实现流式查询任务的批量执行。 工作内容 ◊ 使用Kafka实现上层平台大量的查询汇总命令的消息流式调度,并做低阶API优化处理及容错管理; ◊ 使用EBNF范式对平台查询语句进行翻译,生成SparkSQL查询语句提交到Hive数据仓库中进行查询; ◊ 使用Sqoop作为核心工具,开发ETL可视化调度前端,将异地关系型数据库数据可增量抽取到Hive中并以ORC模式存储; ◊ 使用Graphite与Grafana构建数据引擎监控系统; ◊ 基于MUI框架设计并实现内蒙古精准扶贫项目移动端原型开发;
1970-01-01 -至今某单位研发
项目描述 项目以未来无人机智能空战为背景,主要是利用遗传模糊树、强化学习等技术对无人机自主空战决策进行学习,对手可以是自博弈或成熟的固定规则对手,通过分布式仿真训练优化遗传模糊树的模糊规则,实现无人机较高的自主智能空战水平。其中飞控模型基于真实六自由度飞机模型,具备完善的雷达、火控导弹、电子告警等模型。 工作内容 ◊ 构建分布式可视化仿真平台,实现模型解算,仿真回放,态势评估,二、三维可视化等功能; ◊ 基于Flask及RabbitMQ构建分布式遗传算法训练平台; ◊ 构建遗传模糊树算法,设计模糊树结构及推理机实现模糊推理算法,针对模糊系统隶属度函数及规则设计遗传算法; ◊ 针对空战仿真环境及态势评估方法设计适用于强化学习的回报值体系; ◊ 构建快速仿真环境,提供gRPC接口,供多家参研单位算法进行交互学习; ◊ 构建适用于离散及连续动作空间的强化学习算法,其中离散动作空间基于机动库序列,连续动作空间基于过载指令控制,并结合导弹发射决策构建动作空间。基于攻击区理论构建强化学习所需状态空间; ◊ 算法测试过经典基于值函数(DQN系列)及策略梯度(PPO、DDPG系列)的强化学习算
1970-01-01 -至今某单位研发
项目描述 项目以无人机故障预测与无人机智能辅助规划为场景研究故障预测算法及智能辅助规划算法,主要涉及到故障样本难以获取的情况下,如何提取故障特征以及预测故障行为,给出相应的告警信息,必要时进行重规划,并研究动态威胁下的避障规划方法。 工作内容 ◊ 基于QT构建决策系统前端,后端使用Python兼容CLIPS专家系统及神经网络预测模型; ◊ 使用SMOTE、KMeans WGAN-GP等算法处理小样本数据,对样本进行生成; ◊ 构建CLIPS专家系统,划分故障等级及故障处理方案,使用SVM等算法对故障指标进行分类,使用双层LSTM算法对样本较多的正常样本进行学习预测,将预测结果与实际线上实时数据进行误差检测,判定长期超差时故障可能性较大;
教育经历
2017-06-01 - 2020-01-01北京航空航天大学自动化科学与技术硕士
2013-01-01 - 2017-06-01哈尔滨工程大学计算机科学与技术学院(软件工程)本科
◊ 国家奖学金一次,校一等奖学金8次,博创杯十佳优秀志愿者 ◊ 微软创新杯中国赛区优胜奖,博创杯省赛特等奖及国家二等奖等奖项。
技能
最近在做一些强化学习方面的工作,这里对一些传统的强化学习算法做一个总结,不断整理。 本repo提供的代码,参考莫烦和baseline进行实现,实验环境基于openai gym, 不涉及图像处理相关,较为纯净的强化学习部分实现。 实验结果主要以gym的实验结果为主,有一些实验是在自己实现的一套1v1 6DoF飞行器博弈仿真环境做的实验,该环境较为复杂,对各种算法也有更加全面的验证。