”RL“ 的搜索结果

     主要介绍的算法有:Q Learning、Sarsa、Sarsa(lamda)、TD、Policy Gradient、AC、A3C、DQN、DoubleDQN、DuelingDQN、DDPG、MCTS、UCT (1)Q Learning:建立Q值表,根据当前state预测Q值,用查表的方式选择action。...

     RL基线动物园:预先训练的强化学习代理的集合 使用,具有经过调整的超参数的训练有素的强化学习(RL)代理的集合。 我们正在寻找有助于完成收藏的贡献者! 该存储库的目标: 提供一个简单的界面来训练和享受RL...

     RL Baselines3 Zoo:稳定的Baseline3强化学习代理的培训框架 RL Baselines3 Zoo是使用强化学习(RL)的培训框架。 它提供了用于训练,评估代理,调整超参数,绘制结果和录制视频的脚本。 此外,它还包括针对常见环境...

     使用OpenAI Gym和TensorFlow结合广泛的数学知识来掌握经典RL,深度RL,分布式RL,逆RL等关于这本书 近年来,随着算法质量和数量的显着提高,《 Python上的动手强化学习》第二版已完全改编为示例丰富的指南,用于学习...

     (RL)是一个独立的C ++库,用于刚体运动学和动力学,运动计划和控制。 它涵盖了空间矢量代数,多体系统,硬件抽象,路径规划,碰撞检测和可视化。 它已用于研究项目和教育中,已获得BSD许可,可免费用于商业应用。 ...

     D4RL:用于深度数据驱动的强化学习的数据集 D4RL是用于离线强化学习的开源基准。它为培训和基准测试算法提供了标准化的环境和数据集。还提供了补充和。设置可以通过以下方式克隆存储库来安装D4RL: git clone ...

     D2RL D2RL的官方PyTorch代码:强化学习中的深度密集架构。 下面列出了有关独立复制的TF2实现的详细信息。 论文: : 博客: : 该代码包括训练SAC-D2RL,TD3-D2RL和CURL-D2RL代理的代码。 如果有任何与代码...

     Easy-RL 李宏幽默老师的《深度强化学习》是强化学习领域经典的中文视频之一。李老师幽默风趣的上课风格让晦涩难懂的强化学习理论变得轻松易懂,他会通过很多有趣的例子例证解强化学习理论。某些老师经常会用玩Atari...

     贡献者:Datawhale开源项目组 作为人工智能里最受关注的领域之一,强化学习的热度一直居高不下,但它的学习难度也同样不低。 在学习强化学习的过程中,遇到了有无数资料却难以入门的问题,于是发起了Datawhale强化...

     RL-algorithms 更新一些基础的RL代码 离散的动作空间 DQN 可用于入门深度强化学习,使用一个Q Network来估计Q值,从而替换了 Q-table,完成从离散状态空间到连续状态空间的跨越。Q Network 会对每一个离散动作的Q值...

     相扑SUMO-RL通过用于交通信号控制的提供了一个简单的界面来实例化强化学习环境。 主类继承了的 。 如果使用参数'single-agent = True'实例化,则其行为类似于来自的常规 。 负责使用 API检索信息并在交通信号灯上。 ...

     matlab信任模型代码RL-脑血流 该代码在两个无基线模型的算法之上实现了RL-CBF算法:信任区域策略优化(TRPO)和深度确定性策略梯度(DDPG)。 RL-CBF算法在学习过程中提供了安全保证,有关该算法的详细信息,请参见...

     CARLA中的RL-frnet轨迹规划该存储库是一个框架,可为自动驾驶汽车模拟器CARLA创建OpenAI Gym环境,以便利用先进的深度强化算法和frenet轨迹规划。安装模拟充当服务器-客户端。 CARLA作为服务器启动,并默认使用2000...

10  
9  
8  
7  
6  
5  
4  
3  
2  
1