https://mp.weixin.qq.com/s/S2eGPTON3XmfN830m4vaaA
腾讯AI Lab:可自适应于不同环境和任务的强化学习方法
https://mp.weixin.qq.com/s/dlOFM7LuOF2npDP_EaITvg
效率提高50倍!谷歌提出从图像中学习世界的强化学习新方法(PlaNet)
https://mp.weixin.qq.com/s/3qWN6DjuGUZgCpxH7XF4fg
谷歌重磅开源RL智能体Dreamer,仅靠图像学习从机器人到Atari的控制策略,样本效率暴增20倍
https://mp.weixin.qq.com/s/Maoy2feVWj5hpn4Ysh_47A
你追踪,我逃跑:一种用于主动视觉跟踪的对抗博弈机制
https://mp.weixin.qq.com/s/4w3wIyy4H0UGeqOGhNcIbA
强化学习落地!京东等发布综述《深度强化学习在搜索,推荐和在线广告中的应用》
https://mp.weixin.qq.com/s/F_GsfAJRFJ_o8PETqUL35g
谷歌大脑AI飞速解锁雅达利,训练不用两小时:预测能力“前所未有”
https://mp.weixin.qq.com/s/CCQOHRCAolsorm8FEPdjoQ
什么时候强化学习未必好用?
https://mp.weixin.qq.com/s/Ctn1Wr68lph1UK_wjfCY1Q
策略梯度搜索:不使用搜索树的在线规划和专家迭代
https://mp.weixin.qq.com/s/78ir-Z4ch8_aVpjC6aCPGg
DeepMind综述深度强化学习中的快与慢,智能体应该像人一样学习
https://mp.weixin.qq.com/s?__biz=MzU1NTMyOTI4Mw==&mid=2247494226&idx=1&sn=a96ea0ad8961ec3698301cf0c4514843
以YouTube论文学习如何在推荐场景应用强化学习
https://mp.weixin.qq.com/s/SpCorsAiTWGYGiohT_gZtg
如何训练智能体Agent玩毁灭战士ViZDoom?
https://mp.weixin.qq.com/s/ewC2_8O29Gg0blxK7mHsYA
比TD、MC、MCTS指数级快,性能超越A3C、DDQN等模型,这篇RL算法论文在Reddit上火了
https://mp.weixin.qq.com/s/Q9QzXo_M3jYKjBWSsLYwgQ
强化学习+树搜索:一种新型程序合成方法
https://mp.weixin.qq.com/s/l46yJdRaftMlwr6odiSiHg
Yoshua Bengio团队基于深度强化学习打造聊天机器人MILABOT
https://mp.weixin.qq.com/s/6_cW22DCzSw3DpUDrLXLcA
OpenAI提出强化学习近端策略优化,可替代策略梯度法
http://mp.weixin.qq.com/s/S4jhpNKYZP5YQWaiiOQGFA
DeepMind:“预测地图”海马体催生强化学习新算法
https://mp.weixin.qq.com/s/KZHidOi5KYgg393R_JspBA
DeepMind都拿不下的游戏,刚刚被OpenAI玩出历史最高分
https://mp.weixin.qq.com/s/aVWHlwOmNIqOlu3025_RXQ
DeepMind提出多任务强化学习新方法Distral
https://mp.weixin.qq.com/s/gFHbLF-q91sddMAX1CRbEQ
俞扬:“审时度势”的高效强化学习
https://mp.weixin.qq.com/s/lstCIiNs_qA6k7GCYUBv2w
阿尔伯塔大学提出新型多步强化学习方法,结合已有TD算法实现更好性能
https://mp.weixin.qq.com/s/ybyZpaHr-JJg7CCdXGOl5A
Seq2seq强化学习实战
https://mp.weixin.qq.com/s/vYDb1rTdPxO1sIS38VX5xA
DeepMind的AI学会了画画,利用强化学习完全不需人教:SPIRAL
https://mp.weixin.qq.com/s/rpPN2rgru6krRz2fr1RhsQ
模拟世界的模型:谷歌大脑与Jürgen Schmidhuber提出“人工智能梦境”
https://mp.weixin.qq.com/s/AelAD57G4GOh7qm-_rvYsg
伯克利提出DeepMimic:使用强化学习练就18般武艺
https://mp.weixin.qq.com/s/W9yhj7_frLYWJocoBR1TMQ
避免AI错把黑人识别为大猩猩:伯克利大学提出协同反向强化学习
https://mp.weixin.qq.com/s/p2hlc2PsLgrvxOF8wBZANg
李飞飞高徒范麟熙解析强化学习在游戏和现实中的应用
http://mp.weixin.qq.com/s/EPbKE-TAnAPugJDhXHEyNA
DeepMind开源Psychlab平台——搭建AI和认知心理学的桥梁
https://mp.weixin.qq.com/s/xJ_g3BvbM-WaIyLthHdhEw
DeepMind发布通用强化学习新范式,自主机器人可学会任何任务
https://mp.weixin.qq.com/s/3HYELsdYwCJeUmXDBXx8NQ
这款超火的游戏,AI只用4小时,就秀出了人类花1年才能达到的水平
https://mp.weixin.qq.com/s/aEXi3XqcrWpAtdcMkFhBxw
强化学习中的调参经验与编程技巧(on policy篇)
https://mp.weixin.qq.com/s/VpvgNhktLBl_p9gkanp4Pw
2020格斗游戏AI冠军方案:基于强化学习对手建模的滚动时域演化算法
https://mp.weixin.qq.com/s/hb7iiJDWnNAXXUJmYKbqaw
强化学习帮我通关了超级玛丽!
https://mp.weixin.qq.com/s/BoZQ8aMF2Aohj536qhfWPg
Nature重磅:OpenAI科学家提出全新增强学习算法,玩游戏可完胜人类,或推动AI向真正智能学习体进化(Go-Explore)
https://mp.weixin.qq.com/s/HBqX6pz4EzO70YpmQ8xtRw
世界上最难的“沙雕”游戏被AI攻破了
https://mp.weixin.qq.com/s/teBlXXw4JQ8k3olCDOKXyw
量化金融自动交易的深度强化学习库。哥大开源“FinRL”
https://mp.weixin.qq.com/s/8UX65PGZkRokguLTnoGVFA
强化学习组合优化综述论文
https://mp.weixin.qq.com/s/Cfim24MSmClvo2HjW7thTw
最强原创综述!当强化学习邂逅组合优化
https://mp.weixin.qq.com/s/nNTag_D_qN7WcE7DEMJFaA
横扫6个SOTA,吊打强化学习!谷歌最强行为克隆算法登CoRL顶会,机器人干活10倍速
https://mp.weixin.qq.com/s/0AM4eASolsPZ7GtPYVBqDQ
伯克利今年大热的DeepMimic开源了~
https://zhuanlan.zhihu.com/p/35567591
强化学习在关系抽取、QA场景的应用
https://mp.weixin.qq.com/s/zWo2iSiJBEBwnFF478xxfQ
DeepMind:探索人类行为中的强化学习机制
https://mp.weixin.qq.com/s/oOslkEklaZSbRb8eDDCRBw
天津大学、东京大学等研究:用深度强化学习检测模型缺陷
https://mp.weixin.qq.com/s/DNT9rMynbN4Th0AVDHeY_w
BAIR提出人机合作新范式:教你如何高效安全地在月球着陆
https://mp.weixin.qq.com/s/KqLCTSYk1C0wYpJw-hpc1g
论强化学习和概率推断的等价性:一种全新概率模型
https://mp.weixin.qq.com/s/zRXs3BCEqXUruw746rZusw
牛津大学联合7家单位发布AutoRL综述,还在手动调参吗?你已经落后了
https://mp.weixin.qq.com/s/wPWV6kxkRlYb9dMf6ADWkQ
史上首次,强化学习算法控制核聚变登上Nature:DeepMind让人造太阳向前一大步
https://mp.weixin.qq.com/s/U0K79ELLj4wsOR4sd5G4Vw
Vicarious详解新型图式网络:赋予强化学习泛化能力
https://mp.weixin.qq.com/s/C8hsGkHGtoaS9Vzm6Ub4tw
Berkeley提出“随机搜索”训练线性策略,提高RL的性能
https://mp.weixin.qq.com/s/uppNSwxNrw4_8NGBQv85xw
今日头条首次改进DQN网络,解决推荐中的在线广告投放问题
https://mp.weixin.qq.com/s/JtUuFdTK4Q5YwnVj3BFU2w
全参数化分布,提升强化学习中的收益分布拟合能力
https://mp.weixin.qq.com/s/amXiNKJPEkAnu2m5NAERVw
Top-K Off-Policy Correction
https://mp.weixin.qq.com/s/kNtzy9-6GbsRhlL-mxksew
基于强化学习的人机对话
https://mp.weixin.qq.com/s/w3SsadgKaL8-tlzYLvMm-A
讲真?一天就学会了自动驾驶——强化学习在自动驾驶的应用
https://mp.weixin.qq.com/s/nnWuIPk_6mI9IAKIUbx6KQ
深度强化学习解决交通控制问题
https://mp.weixin.qq.com/s/RNJonPJL9JY5OH2-1sZMQw
中山大学HCP实验室:基于树状结构策略的渐进强化学习
https://mp.weixin.qq.com/s/G2sFkuvSeYmhkFjjPRGI-Q
强化学习如何用于推荐?新南威尔士首篇《深度强化学习推荐系统》综述论文
https://mp.weixin.qq.com/s/fMjjGCzef-3SVIOlUf2EFA
强化学习如何用于推荐?厦大最新《强化学习推荐系统》综述论文
https://mp.weixin.qq.com/s/8cV3Z_vkC0_cyfO2nVKoSw
华人博士用强化学习回收了SpaceX火箭
https://mp.weixin.qq.com/s/_-WSoeOqXMhR7S0PtyYixQ
深度强化学习探索算法最新综述,近200篇文献揭示挑战和未来方向
https://mp.weixin.qq.com/s/xr-2cNoSYpCftLI3dV6zEw
如何使用深度强化学习帮助自动驾驶汽车通过交叉路口?
https://mp.weixin.qq.com/s/R_pfTXDMaLHmiCaSV2t_YA
英特尔Nervana发布强化学习库Coach:支持多种价值与策略优化算法
https://mp.weixin.qq.com/s/AyW7oOC7yxVtmswaMT1DGQ
腾讯AI Lab获得计算机视觉权威赛事MSCOCO Captions冠军
https://mp.weixin.qq.com/s/4aENmxUMEEPVPnexLKrg7Q
新型强化学习算法ACKTR
https://mp.weixin.qq.com/s/5PzTiPoXPC1gH3xszzT2dQ
邓力等人提出BBQ网络:将深度强化学习用于对话系统
https://mp.weixin.qq.com/s/pM8oykHmtu5O5jYJBZjO_w
伯克利研究人员使用内在激励,教AI学会好奇
https://mp.weixin.qq.com/s/3WI3QgfHXcrCPbvmHWOEkg
强化学习在生成对抗网络文本生成中的作用
https://mp.weixin.qq.com/s/IvR0O6dpz2GJCG7UQb5kUQ
清华大学冯珺:基于强化学习的关系抽取和文本分类
https://zhuanlan.zhihu.com/p/31579144
让我们从零开始做一个机械手臂(强化学习)
https://mp.weixin.qq.com/s/FiR_GRYqJYpJRO-2p44-Cg
伯克利强化学习新研究:机器人只用几分钟随机数据就能学会轨迹跟踪
https://mp.weixin.qq.com/s/_dHjZQ_7_7H34PHhV_lC3w
全新强化学习算法详解,看贝叶斯神经网络如何进行策略搜索
https://mp.weixin.qq.com/s/YCPXkFzYdC1gMfnprZsVXg
如何让机器人多技能?通过最大熵强化学习
https://mp.weixin.qq.com/s/dbtdNsT3nvLt4UKsrNsn_Q
量化深度强化学习算法的泛化能力
https://mp.weixin.qq.com/s/K-z_dX2-NepkEHbr45QlvQ
微软研究院开源项目TextWorld:可用于强化学习训练的文本游戏
https://mp.weixin.qq.com/s/K2DW_ntSWrlySpxgorF9dA
Python强化学习实战,Anaconda公司的高级数据科学家讲解
https://zhuanlan.zhihu.com/p/32089849
概要:NIPS 2017 Deep Learning for Robotics Keynote
https://mp.weixin.qq.com/s/6wPtb9Qdhr9FiMk15xrUsQ
强化跨模态匹配和自监督模仿学习
https://mp.weixin.qq.com/s/lU3_ONAIGDUv_AVv2Xn14w
仅需2小时学习,基于模型的强化学习方法可以在Atari上实现人类水平
https://mp.weixin.qq.com/s/w0_g5FlC6vx2MRAhADPq2g
深度强化学习在智能对话上的应用
https://mp.weixin.qq.com/s/4SZ1NN5hUUcO_dSe4Bv0NQ
利用鲁棒控制实现深度强化学习驾驶策略的迁移
https://mp.weixin.qq.com/s/rwqtw5b2Nap5UPU9DWBXqg
强化学习与文本生成
https://mp.weixin.qq.com/s/VPCtsv2Q73qVcNAa4Xufag
从虚拟到现实,北大等提出基于强化学习的端到端主动目标跟踪方法
https://mp.weixin.qq.com/s/6Sj2QIELQvI28Rpp7A39Fg
如何通过结构化智能体完成物理构造任务?
https://mp.weixin.qq.com/s/lR6BSa_pJzcinkSaSWsM2A
伯克利提出强化学习新方法,可让智能体同时学习多个解决方案
https://mp.weixin.qq.com/s/P-iSI80IVmb5s-Q15Re2HQ
All In!我学会了用强化学习打德州扑克
https://zhuanlan.zhihu.com/p/36322095
最前沿:从虚拟到现实,DRL让小狗机器人跑起来了!
您的打赏,是对我的鼓励