基于强化学习的贪吃蛇游戏(一)——强化学习基础 最近在帮导师完成他教材的编纂,其中我的部分是使用强化学习来完成贪吃蛇游戏。在博客里记录下整个过程。 2024-12-19 科研摘录 #理论学习 #强化学习
使用线性规划求解Minimax问题 最近工作中涉及到一个在零和博弈中求解Minimax的问题,算出的纯策略解效果并不好,于是想试试用线性规划来求解混合策略均衡解。 2024-11-29 科研摘录 #理论学习