0%

NVIDIA(英伟达)凭借其强大的GPU算力,构建了一套行业标准的仿真全家桶。

3D Deep Reinforcement Learning (3D Deep RL)是一个巨大的交叉研究领域。本质上是将计算机视觉/3D几何(感知环境)与强化学习(决策制定)结合在一起,通常被归类在具身智能和机器人学习的大范畴下。

简单来说,PettingZoo就是多智能体版本的Gym。

OpenSpiel 的核心在于让AI学会思考、博弈和策略。它主要用于研究通用强化学习算法在不同类型的游戏(Games)中的表现。

博弈论中的游戏可按照信息完备性分为 完全信息博弈 与 不完全信息博弈。两者在规则、信息透明度、决策模型和算法选择上有显著不同,这也直接决定了我们在 AI 开发中应选择的算法和框架。

本篇探讨了如何用强化学习训练一个双人对抗类游戏AI。

Stable-Baselines3是一个基于PyTorch的强化学习算法库。