基于多目标强化学习的任务快速分配项目

我要开发同款
wang1312024年03月23日
236阅读
开发技术torch、算法设计、深度学习、python

作品详情

建立能够按照不同的用户偏好生成Pareto解的encoder-decoder结构的深度神经网络模型,并基于REINFORCE算法、A2C算法、PPO算法进行模型训练,对比不同训练算法下智能体性能,最终获得优于传统运筹优化算法和进化算法的智能体模型。
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论