黑白六子折线棋博弈系统

我要开发同款
手持两把锟斤拷2022年02月20日
231阅读

作品详情

深入分析六子折线棋的特征,以 AlphaZero 模型为参考,基于深度强化学习理论,将深度学习和强化学习相结合。本次实验将尝试用蒙特卡洛树自我对弈得到棋谱,并用于训练策略价值网络,以此做到不依赖已有知识进行自我学习。同时本文将在 AlphaZero 的模型基础上,结合六子折线棋本身的特点对模型进行改进和完善。
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论