工作经历
2023-07-10 -至今农村信用社软件开发工程师
银行核心系统或者前置系统的需求分析、设计、开发工作; 按照用户需求进行软件模块的设计; 按照设计文档进行应用模块的编码; 负责完成所编写模块的测试上线工作
教育经历
2020-09-01 - 2023-07-01广东工业大学计算机学院硕士
技能
强化学习是试错的艺术,通过不断的尝试来学习更好的策略。近年来,强化 学习在游戏、棋牌、机器人等领域展现出了强大的潜力,是机器人领域一个研究热点[2],基本思想是通过智能体(Agent)在环境中不断尝试,学习完成目标的更优策略,以达到从环境中获得奖励值更多的目的。强化学习算法被许多人认为是走向通用人工智能道路的关键算法。 本文针对DQN强化学习算法[1]在贪吃蛇路径规划中这一具体问题的应用中,对其状态空间、奖励函数、动作空间、网络结构等方面的设计进行了一系列的探索。贪吃蛇机器人通过DQN网络结构对其三个动作的值函数进行估计,并更新网络参数,通过训练网络得到相应的 Q 值。移动贪吃蛇采用ε-greedy的探索策略,选择一个最优动作,到达下一个观察。贪吃蛇机器人将通过学习收集到的数据采用改进的重采样优选机制存储到缓存记忆单元中,并利用小批量数据训练网络。实验数据证明,贪吃蛇在多变环境中可以很好地获取最优路径去寻觅果实。
信息中心 信息通知 用户私信通知 视频收藏通知 用户中心 用户管理(添加、修改、删除) 用户关注 用户私信 好友动态 视频管理 视频推荐 视频搜索 视频播放 实时弹幕 视频点赞 视频点评 视频管理(上架,下降,修改,收藏,删除,审核) 后台管理 视频管理(视频审核,视频播放,视频删除) 用户管理(用户新增,用户修改,用户删除) 角色管理(角色添加、角色删除) 视频类型管理(类型添加、类型删除)
java、vue,python、rabbitmq 该系统主要由三大模块构建而成:离线检测模块、在线检测模块和算法模块,系统模块如图5-3所示。离线检测模块包含前端界面、用户权限管理模块、文件管理模块和转换任务模块。前端界面主要提供文件管理界面和任务管理界面,在界面中提供显示结果窗口以及其他功能按键,界面是可交互且人性化设计。用户权限管理模块主要提供用户管理和权限管理,当创建用户时,为用户指定特定角色以具备特定权限;当用户进行操作时,利用用户所具有的权限限制用户操作,仅允许被赋予的操作。文件管理模块为文件提供上传、下载、查看、转码以及删除的功能。转换任务模块主要为任务提供任务创建、查看、下发、通知以及删除的功能。文件系统是用户创建转换任务的前提,用户通过从文件系统选择文件创建转换任务并以提交。在线检测模块主要包含实时视频帧传输协议、服务端和客户端。用户在客户端界面选择指定网络摄像头进行算法检测,客户端会将从网络摄像头拉取的视频帧推流至服务端,服务端在检测完毕之后将检测结果推送至客户端显示。