个人介绍
我是一名刚毕业的硕士研究生,毕业于贵州师范大学,计算机科学与技术专业,研究方向为深度学习(主要是深度强化学习)。在校期间为课题组搭建过深度强化学习仿真训练框架,具有一些深度学习开发经验,对深度学习算法及其原理有一定的理解,精通PPO、DQN等强化学习算法。熟悉多种主流linux发行版本、熟悉各种深度学习开发环境工具的部署(ProxmoxVE虚拟化平台、cuda工具包、docker、torch、tensorflow等),精通计算机网络,在校期间还负责实验室的网络和服务器维护工作。导师对我的评价是工程能力强。由于刚毕业,工作经验稍弱,但我的学习能力了很强,希望多给我机会尝试,一定不会让你们失望。
工作经历
2020-09-01 -2023-06-01贵州师范大学课题组成员
学习深度学习原理、算法,搭建翼伞飞行仿真训练系统并进行部署、实验,参加课题组学术交流讨论
教育经历
2020-09-01 - 2023-06-01贵州师范大学计算机科学与技术硕士
2015-06-01 - 2019-06-01邵阳学院机械制造及其自动化本科
资质认证
技能
使用python搭建道路环境仿真上位机,驾驶员通过方向盘和脚踏板操控仿真环境中的汽车 stm32单片机接受上位机的传感器数据,计算安全距离,在不同情况下发出警报或做发出制动信号到仿真环境进行主动干预
在本项目中,我负责将原先基于MATLAB的翼伞飞行仿真系统成功迁移至Python平台。这项工作的主要目的是为了更便捷地进行强化学习Agent的训练,通过使用Python作为开发语言以及gym框架的引入,使仿真环境更加灵活、易于集成,并为后续的强化学习算法提供了良好的支持。 首先,我分析了原有MATLAB仿真系统的框架结构和各部分功能。通过仔细了解其算法和模型,我将matlab代码按照功能划分成多个模块,并制定了详细的计划,以确保在迁移过程中仿真系统的稳定性和完整性不受损。 在迁移的过程中,我使用了Python中广泛使用的科学计算库scipy,确保了各个模块与MATLAB版本具有相同的仿真结果。 利用gym框架,我将仿真环境封装成一个可重用的Python类,使其符合gym接口规范。这不仅使得仿真环境可以被轻松地与强化学习算法集成,还使得系统更容易扩展和与其他gym兼容的环境进行交互。 在gym框架的基础上,为了更直观地观察仿真过程和代理的行为,我们引入了可视化模块。该模块可以让用户实时监视仿真环境的状态、代理的行为以及奖励的变化。这不仅提供了对系统运行的可视反馈,还有助于更深入地理解Agent的决策与环境的交互。 除了可视化模块外,我们还引入了其他一些模块,以进一步提升仿真系统的功能性。例如,我们可能添加了一个日志记录模块,用于详细记录仿真过程中的各种数据,以便后续分析和调试。加入了一个配置模块,使用户可以方便地调整仿真环境的参数,以适应不同的实验需求等。 通过这次迁移,我们成功地实现了在Python平台上进行翼伞飞行仿真的目标,并将仿真环境嵌入gym框架中,为强化学习Agent的训练提供了便利。这一迁移不仅提高了系统的灵活性和可扩展性,也为后续的研究和开发工作打下了坚实的基础。
参数模块:方便调整仿真环境参数、训练参数 环境模块:进行被控对象的运动仿真,定义了与环境的交互方式,包括状态的获取、动作的执行以及奖励的反馈 代理模块:代理(Agent)即强化学习中的被训练的控制器,定义了代理的决策策略,通常是一个神经网络。 学习算法库模块:包含PPO、DDPG、DQN等多种强化学习算法,用户可以调用不同的算法来训练代理(Agent) 并行化模块:使用多线程或多进程的方式,定义了多个仿真环境异步并行采样训练数据的策略和不同进程之间的通信规则等。使用户能够充分利用多核cpu的优势,加速训练。 可视化模块:使用matplotlib等工具可视化仿真环境,方便用户实时监控仿真环境中被控对象的状态 监控和日志模块:记录强化学习训练过程,使用可视化工具(tensorboard、visdom等)直观地展示训练过程中策略网络的性能指标、奖励曲线等