Antkillerfarm Hacking V8.0

DRL » 深度强化学习（十一）——DRL参考资源（2）

2024-06-24 :: 6617 Words

DRL参考资源

DRL参考资源

https://mp.weixin.qq.com/s/AI3i3ZLZ-fynavbeNAMKgA

强化学习应用介绍，41页报告带你快速了解RL的最新应用价值

https://mp.weixin.qq.com/s/-Cd7rQY3c3CINjtB99UZWw

自动驾驶领域中的强化学习，附18页论文下载

https://mp.weixin.qq.com/s/UBWN4_Sem8W1WcjsLAnjjQ

强化学习，路在何方？

https://book.yunzhan365.com/iths/nahn/mobile/index.html

强化学习和最优控制的《十个关键点》81页PPT汇总

https://zhuanlan.zhihu.com/p/107143378

Learning SR for Text Classification via RL

https://mp.weixin.qq.com/s/6c8imZFRAoxgs18rk_tlEw

炼丹感悟：On the Generalization of RL

https://mp.weixin.qq.com/s/PpBMu-5ozc9UOBbFhjsf3A

漫谈强化学习中的引导搜索策略（GPS方法）

https://mp.weixin.qq.com/s/TUk1PWT9CfPGEW77UKxpjw

三招武林绝学带你玩转“强化学习”

https://mp.weixin.qq.com/s/Uin1gOmJEa6cvkiFJm6cHw

你当年没玩好的《愤怒的小鸟》，AI现在也犯难了

https://mp.weixin.qq.com/s/YY1FIMjDIMABdwRC5x9w4g

17种深度强化学习算法用Pytorch实现

https://mp.weixin.qq.com/s/lxnyoo46tS7-MXAB7HNouA

人工智能在电网管理中的应用

https://mp.weixin.qq.com/s/ZYIfzk1kZ4azpmxWagkQuw

强化学习如何用于模型量化？

https://mp.weixin.qq.com/s/w4m4fG-a30AgulNPhBVC5w

基于强化学习的自动交易系统研究与发展综述

https://mp.weixin.qq.com/s/oyWyb58l4ztqIEyrk0g01A

强化学习在美团“猜你喜欢”的实践

https://mp.weixin.qq.com/s/oA98YyLqn1B22QZ5b_iDVA

IJCAI 2018：聚焦强化学习的学习效率

https://mp.weixin.qq.com/s/FtHJCXniVne2TGKfgCeS9w

Pieter Abbeel：深度强化学习加速方法

https://mp.weixin.qq.com/s/xlnwB9e1ks-4M4djnyIAyQ

解读72篇DeepMind深度强化学习论文

https://mp.weixin.qq.com/s/VYIyWRykREjOyLu4YDhLeA

61篇NIPS2019深度强化学习论文及部分解读

https://zhuanlan.zhihu.com/p/48186354

robot浅谈

https://mp.weixin.qq.com/s/f-rmdWq3kJUJGhuPwU8JtQ

深度策略梯度算法是真正的策略梯度算法吗？

https://mp.weixin.qq.com/s/SiVUmjHyw8ztiaSWNSZ-qA

多任务深度强化学习综述

https://zhuanlan.zhihu.com/p/51202503

强化学习在视觉上的应用（RL for computer Vision）

https://mp.weixin.qq.com/s/Dq4HsRg05bVMjvrsrxfOOQ

从这篇YouTube论文，剖析强化学习在工业级场景推荐系统中的应用

https://mp.weixin.qq.com/s/cyaQt-SO7sgG49kuUyPJbQ

旷视开源的深度强化学习绘画智能体论文解读

https://mp.weixin.qq.com/s/curzH8WrFyl5WWT4lDfpwQ

Chrome暗藏的恐龙跳一跳，已经被AI轻松掌握了

https://www.cnblogs.com/massquantity/p/13842139.html

Flink+强化学习搭建实时推荐系统

https://mp.weixin.qq.com/s/zfVrmErz3ZaGz7Ha7qGoIw

要提升微信看一看推荐混排的长期收益？试试深度强化学习

https://mp.weixin.qq.com/s/RLEuaiRdq6AbTSUcYQ5O3A

深度强化学习在NLP怎么用？看清华黄民烈老师这一份120页《自然语言处理和搜索中的深度强化学习应用》讲义

https://mp.weixin.qq.com/s/S2eGPTON3XmfN830m4vaaA

腾讯AI Lab：可自适应于不同环境和任务的强化学习方法

https://mp.weixin.qq.com/s/dlOFM7LuOF2npDP_EaITvg

效率提高50倍！谷歌提出从图像中学习世界的强化学习新方法（PlaNet）

https://mp.weixin.qq.com/s/3qWN6DjuGUZgCpxH7XF4fg

谷歌重磅开源RL智能体Dreamer，仅靠图像学习从机器人到Atari的控制策略，样本效率暴增20倍

https://mp.weixin.qq.com/s/Maoy2feVWj5hpn4Ysh_47A

你追踪，我逃跑：一种用于主动视觉跟踪的对抗博弈机制

https://mp.weixin.qq.com/s/4w3wIyy4H0UGeqOGhNcIbA

强化学习落地！京东等发布综述《深度强化学习在搜索，推荐和在线广告中的应用》

https://mp.weixin.qq.com/s/F_GsfAJRFJ_o8PETqUL35g

谷歌大脑AI飞速解锁雅达利，训练不用两小时：预测能力“前所未有”

https://mp.weixin.qq.com/s/CCQOHRCAolsorm8FEPdjoQ

什么时候强化学习未必好用？

https://mp.weixin.qq.com/s/Ctn1Wr68lph1UK_wjfCY1Q

策略梯度搜索：不使用搜索树的在线规划和专家迭代

https://mp.weixin.qq.com/s/78ir-Z4ch8_aVpjC6aCPGg

DeepMind综述深度强化学习中的快与慢，智能体应该像人一样学习

https://mp.weixin.qq.com/s?__biz=MzU1NTMyOTI4Mw==&mid=2247494226&idx=1&sn=a96ea0ad8961ec3698301cf0c4514843

以YouTube论文学习如何在推荐场景应用强化学习

https://mp.weixin.qq.com/s/SpCorsAiTWGYGiohT_gZtg

如何训练智能体Agent玩毁灭战士ViZDoom？

https://mp.weixin.qq.com/s/ewC2_8O29Gg0blxK7mHsYA

比TD、MC、MCTS指数级快，性能超越A3C、DDQN等模型，这篇RL算法论文在Reddit上火了

https://mp.weixin.qq.com/s/Q9QzXo_M3jYKjBWSsLYwgQ

强化学习+树搜索：一种新型程序合成方法

https://mp.weixin.qq.com/s/l46yJdRaftMlwr6odiSiHg

Yoshua Bengio团队基于深度强化学习打造聊天机器人MILABOT

https://mp.weixin.qq.com/s/6_cW22DCzSw3DpUDrLXLcA

OpenAI提出强化学习近端策略优化，可替代策略梯度法

http://mp.weixin.qq.com/s/S4jhpNKYZP5YQWaiiOQGFA

DeepMind：“预测地图”海马体催生强化学习新算法

https://mp.weixin.qq.com/s/KZHidOi5KYgg393R_JspBA

DeepMind都拿不下的游戏，刚刚被OpenAI玩出历史最高分

https://mp.weixin.qq.com/s/aVWHlwOmNIqOlu3025_RXQ

DeepMind提出多任务强化学习新方法Distral

https://mp.weixin.qq.com/s/gFHbLF-q91sddMAX1CRbEQ

俞扬：“审时度势”的高效强化学习

https://mp.weixin.qq.com/s/lstCIiNs_qA6k7GCYUBv2w

阿尔伯塔大学提出新型多步强化学习方法，结合已有TD算法实现更好性能

https://mp.weixin.qq.com/s/ybyZpaHr-JJg7CCdXGOl5A

Seq2seq强化学习实战

https://mp.weixin.qq.com/s/vYDb1rTdPxO1sIS38VX5xA

DeepMind的AI学会了画画，利用强化学习完全不需人教：SPIRAL

https://mp.weixin.qq.com/s/rpPN2rgru6krRz2fr1RhsQ

模拟世界的模型：谷歌大脑与Jürgen Schmidhuber提出“人工智能梦境”

https://mp.weixin.qq.com/s/AelAD57G4GOh7qm-_rvYsg

伯克利提出DeepMimic：使用强化学习练就18般武艺

https://mp.weixin.qq.com/s/W9yhj7_frLYWJocoBR1TMQ

避免AI错把黑人识别为大猩猩：伯克利大学提出协同反向强化学习

https://mp.weixin.qq.com/s/p2hlc2PsLgrvxOF8wBZANg

李飞飞高徒范麟熙解析强化学习在游戏和现实中的应用

http://mp.weixin.qq.com/s/EPbKE-TAnAPugJDhXHEyNA

DeepMind开源Psychlab平台——搭建AI和认知心理学的桥梁

https://mp.weixin.qq.com/s/xJ_g3BvbM-WaIyLthHdhEw

DeepMind发布通用强化学习新范式，自主机器人可学会任何任务

https://mp.weixin.qq.com/s/3HYELsdYwCJeUmXDBXx8NQ

这款超火的游戏，AI只用4小时，就秀出了人类花1年才能达到的水平

https://mp.weixin.qq.com/s/aEXi3XqcrWpAtdcMkFhBxw

强化学习中的调参经验与编程技巧（on policy篇）

https://mp.weixin.qq.com/s/VpvgNhktLBl_p9gkanp4Pw

2020格斗游戏AI冠军方案：基于强化学习对手建模的滚动时域演化算法

https://mp.weixin.qq.com/s/hb7iiJDWnNAXXUJmYKbqaw

强化学习帮我通关了超级玛丽！

https://mp.weixin.qq.com/s/BoZQ8aMF2Aohj536qhfWPg

Nature重磅：OpenAI科学家提出全新增强学习算法，玩游戏可完胜人类，或推动AI向真正智能学习体进化（Go-Explore）

https://mp.weixin.qq.com/s/HBqX6pz4EzO70YpmQ8xtRw

世界上最难的“沙雕”游戏被AI攻破了

https://mp.weixin.qq.com/s/teBlXXw4JQ8k3olCDOKXyw

量化金融自动交易的深度强化学习库。哥大开源“FinRL”

https://mp.weixin.qq.com/s/8UX65PGZkRokguLTnoGVFA

强化学习组合优化综述论文

https://mp.weixin.qq.com/s/Cfim24MSmClvo2HjW7thTw

最强原创综述！当强化学习邂逅组合优化

https://mp.weixin.qq.com/s/nNTag_D_qN7WcE7DEMJFaA

横扫6个SOTA，吊打强化学习！谷歌最强行为克隆算法登CoRL顶会，机器人干活10倍速

https://mp.weixin.qq.com/s/0AM4eASolsPZ7GtPYVBqDQ

伯克利今年大热的DeepMimic开源了~

https://zhuanlan.zhihu.com/p/35567591

强化学习在关系抽取、QA场景的应用

https://mp.weixin.qq.com/s/zWo2iSiJBEBwnFF478xxfQ

DeepMind：探索人类行为中的强化学习机制

https://mp.weixin.qq.com/s/oOslkEklaZSbRb8eDDCRBw

天津大学、东京大学等研究：用深度强化学习检测模型缺陷

https://mp.weixin.qq.com/s/DNT9rMynbN4Th0AVDHeY_w

BAIR提出人机合作新范式：教你如何高效安全地在月球着陆

https://mp.weixin.qq.com/s/KqLCTSYk1C0wYpJw-hpc1g

论强化学习和概率推断的等价性：一种全新概率模型

https://mp.weixin.qq.com/s/zRXs3BCEqXUruw746rZusw

牛津大学联合7家单位发布AutoRL综述，还在手动调参吗？你已经落后了

https://mp.weixin.qq.com/s/wPWV6kxkRlYb9dMf6ADWkQ

史上首次，强化学习算法控制核聚变登上Nature：DeepMind让人造太阳向前一大步

https://mp.weixin.qq.com/s/U0K79ELLj4wsOR4sd5G4Vw

Vicarious详解新型图式网络：赋予强化学习泛化能力

https://mp.weixin.qq.com/s/C8hsGkHGtoaS9Vzm6Ub4tw

Berkeley提出“随机搜索”训练线性策略，提高RL的性能

https://mp.weixin.qq.com/s/uppNSwxNrw4_8NGBQv85xw

今日头条首次改进DQN网络，解决推荐中的在线广告投放问题

https://mp.weixin.qq.com/s/JtUuFdTK4Q5YwnVj3BFU2w

全参数化分布，提升强化学习中的收益分布拟合能力

https://mp.weixin.qq.com/s/amXiNKJPEkAnu2m5NAERVw

Top-K Off-Policy Correction

https://mp.weixin.qq.com/s/kNtzy9-6GbsRhlL-mxksew

基于强化学习的人机对话

https://mp.weixin.qq.com/s/w3SsadgKaL8-tlzYLvMm-A

讲真？一天就学会了自动驾驶——强化学习在自动驾驶的应用

https://mp.weixin.qq.com/s/nnWuIPk_6mI9IAKIUbx6KQ

深度强化学习解决交通控制问题

https://mp.weixin.qq.com/s/RNJonPJL9JY5OH2-1sZMQw

中山大学HCP实验室：基于树状结构策略的渐进强化学习

https://mp.weixin.qq.com/s/G2sFkuvSeYmhkFjjPRGI-Q

强化学习如何用于推荐？新南威尔士首篇《深度强化学习推荐系统》综述论文

https://mp.weixin.qq.com/s/fMjjGCzef-3SVIOlUf2EFA

强化学习如何用于推荐？厦大最新《强化学习推荐系统》综述论文

https://mp.weixin.qq.com/s/8cV3Z_vkC0_cyfO2nVKoSw

华人博士用强化学习回收了SpaceX火箭

https://mp.weixin.qq.com/s/_-WSoeOqXMhR7S0PtyYixQ

深度强化学习探索算法最新综述，近200篇文献揭示挑战和未来方向

您的打赏，是对我的鼓励

DRL » 深度强化学习（十一）——DRL参考资源（2）

DRL参考资源

Recent Posts in DRL

Recent Posts in All Blogs