Antkillerfarm Hacking V7.0

深度强化学习(十)——DRL参考资源(2)

2020-12-25

DRL参考资源

https://mp.weixin.qq.com/s/AI3i3ZLZ-fynavbeNAMKgA

强化学习应用介绍,41页报告带你快速了解RL的最新应用价值

https://mp.weixin.qq.com/s/-Cd7rQY3c3CINjtB99UZWw

自动驾驶领域中的强化学习,附18页论文下载

https://mp.weixin.qq.com/s/UBWN4_Sem8W1WcjsLAnjjQ

强化学习,路在何方?

https://book.yunzhan365.com/iths/nahn/mobile/index.html

强化学习和最优控制的《十个关键点》81页PPT汇总

https://zhuanlan.zhihu.com/p/107143378

Learning SR for Text Classification via RL

https://mp.weixin.qq.com/s/6c8imZFRAoxgs18rk_tlEw

炼丹感悟:On the Generalization of RL

https://mp.weixin.qq.com/s/PpBMu-5ozc9UOBbFhjsf3A

漫谈强化学习中的引导搜索策略(GPS方法)

https://mp.weixin.qq.com/s/TUk1PWT9CfPGEW77UKxpjw

三招武林绝学带你玩转“强化学习”

https://mp.weixin.qq.com/s/Uin1gOmJEa6cvkiFJm6cHw

你当年没玩好的《愤怒的小鸟》,AI现在也犯难了

https://mp.weixin.qq.com/s/YY1FIMjDIMABdwRC5x9w4g

17种深度强化学习算法用Pytorch实现

https://mp.weixin.qq.com/s/lxnyoo46tS7-MXAB7HNouA

人工智能在电网管理中的应用

https://mp.weixin.qq.com/s/ZYIfzk1kZ4azpmxWagkQuw

强化学习如何用于模型量化?

https://mp.weixin.qq.com/s/w4m4fG-a30AgulNPhBVC5w

基于强化学习的自动交易系统研究与发展综述

https://mp.weixin.qq.com/s/oyWyb58l4ztqIEyrk0g01A

强化学习在美团“猜你喜欢”的实践

https://mp.weixin.qq.com/s/oA98YyLqn1B22QZ5b_iDVA

IJCAI 2018:聚焦强化学习的学习效率

https://mp.weixin.qq.com/s/FtHJCXniVne2TGKfgCeS9w

Pieter Abbeel:深度强化学习加速方法

https://mp.weixin.qq.com/s/xlnwB9e1ks-4M4djnyIAyQ

解读72篇DeepMind深度强化学习论文

https://mp.weixin.qq.com/s/VYIyWRykREjOyLu4YDhLeA

61篇NIPS2019深度强化学习论文及部分解读

https://zhuanlan.zhihu.com/p/48186354

robot浅谈

https://mp.weixin.qq.com/s/f-rmdWq3kJUJGhuPwU8JtQ

深度策略梯度算法是真正的策略梯度算法吗?

https://mp.weixin.qq.com/s/SiVUmjHyw8ztiaSWNSZ-qA

多任务深度强化学习综述

https://zhuanlan.zhihu.com/p/51202503

强化学习在视觉上的应用(RL for computer Vision)

https://mp.weixin.qq.com/s/Dq4HsRg05bVMjvrsrxfOOQ

从这篇YouTube论文,剖析强化学习在工业级场景推荐系统中的应用

https://mp.weixin.qq.com/s/cyaQt-SO7sgG49kuUyPJbQ

旷视开源的深度强化学习绘画智能体论文解读

https://mp.weixin.qq.com/s/curzH8WrFyl5WWT4lDfpwQ

Chrome暗藏的恐龙跳一跳,已经被AI轻松掌握了

https://www.cnblogs.com/massquantity/p/13842139.html

Flink+强化学习搭建实时推荐系统

https://mp.weixin.qq.com/s/zfVrmErz3ZaGz7Ha7qGoIw

要提升微信看一看推荐混排的长期收益?试试深度强化学习

https://mp.weixin.qq.com/s/RLEuaiRdq6AbTSUcYQ5O3A

深度强化学习在NLP怎么用?看清华黄民烈老师这一份120页《自然语言处理和搜索中的深度强化学习应用》讲义

https://zhuanlan.zhihu.com/p/29019246

基于策略的增强学习

https://mp.weixin.qq.com/s/OY56lJ_NFf5vVAgKfKyx2A

利用强化学习自动搜索最优化方法

https://mp.weixin.qq.com/s/nYOOwVoijl1p4V0A7yaI3w

机遇与挑战:用强化学习自动搜索优化算法

http://mp.weixin.qq.com/s/TBVVdX3erOpXNjXmhLmxOw

学“深度强化学习”,看懂DeepMind这篇文章就够了!

https://mp.weixin.qq.com/s/7BsXPQ8wC6_fHulU63ZQiQ

当强化学习遇见泛函分析

https://mp.weixin.qq.com/s/uDFsWebfLmka-zZX3Y_8kg

深度强化学习在面向任务的对话管理中的应用

https://zhuanlan.zhihu.com/p/41467058

Policy Optimization with Demonstrations

https://openreview.net/pdf?id=rJzoujRct7

深度学习之斗地主

https://mp.weixin.qq.com/s/qWuoo6cGLWLk4OKlunR-Og

滴滴KDD 2018论文详解:基于强化学习技术的智能派单模型

https://zhuanlan.zhihu.com/p/43496459

解决Sparse Reward RL任务的简单回顾

https://mp.weixin.qq.com/s/tuEhP3CDZ4PW7S66yP8AbA

如何解决稀疏奖励下的强化学习?

https://mp.weixin.qq.com/s/GUyZ0U5_JlXCI-5mO796SA

超越DQN和A3C:深度强化学习领域近期新进展概览

https://zhuanlan.zhihu.com/p/43843955

BAIR:基于人类演示&RL的夹爪训练——高效、通用、低成本

https://mp.weixin.qq.com/s/ADZlLx6gMTFU6IoBCF669g

快1万倍!伯克利提出用深度RL优化SQL查询

https://mp.weixin.qq.com/s/G99vqIYeWzgQ4kL4p77cKA

用强化学习做神经机器翻译:中山大学&MSRA填补多项空白

https://mp.weixin.qq.com/s/FROyReDu7i5amGv-J4cmtg

“世界模型”实现,一步步让机器掌握赛车和躲避火球的技能

https://mp.weixin.qq.com/s/oyxqA_LYtze1f_YDwDZziQ

从零开始自学设计新型药物,UNC提出结构进化强化学习

https://mp.weixin.qq.com/s/1b3_AiFhwXqxb7FozdRYIQ

最in强化学习+NLP技术分享会

https://mp.weixin.qq.com/s/RKQb7-mQ-ELRRq18db02Pg

DeepMind大突破!AI模拟大脑导航功能,学会像动物一样“抄近路”

https://mp.weixin.qq.com/s/qBwszD9rn4gKazXdwqexSQ

MIT提出使用“深度强化学习”帮助智能体在运动中做出“动作决策”

https://mp.weixin.qq.com/s/i-udn1M4kiJpF8U7u5Uepg

专家解读DeepMind最新论文:深度学习模型复现大脑网格细胞

https://mp.weixin.qq.com/s/AS1VFjBFnSk19QJ28tBVWA

NIPS 2017斯坦福赛题大公开:强化学习模拟人类肌肉骨骼模型

https://mp.weixin.qq.com/s/TWjFWe6-dZWDoTi5gN1BxA

深度强化学习在指代消解中的一种尝试

https://mp.weixin.qq.com/s/YnMgJDAh3XhyyNdI8RXmtw

腾讯知文等提出新型生成式摘要模型:结合主题信息和强化训练生成更优摘要

https://mp.weixin.qq.com/s/VrVdsxn94ux_46mIyS8f0w

谷歌大脑实现更宽广的智能体视野,在Atari2600上可持续超越人类玩家!

https://mp.weixin.qq.com/s/P5EysBHBaR6L3IfeSgo6fw

强化学习20分钟,剑桥博士教汽车学会自动驾驶!

https://mp.weixin.qq.com/s/ij3bf61Pu7lrX0WijhbDeA

骑驴找马:利用深度强化学习模型定位新物体

https://mp.weixin.qq.com/s/iYxijHlE3sLJgKnwwd8Tgg

使用深度强化学习和贝叶斯优化获得巨额利润

https://mp.weixin.qq.com/s/_QkxCrQlyRM10eZK8aNCKA

强化学习在携程酒店推荐排序中的应用探索

https://mp.weixin.qq.com/s/fWySZWsYEKBRwYaFL3J2Xg

强化学习大规模应用还远吗?Youtube推荐已强势上线

https://mp.weixin.qq.com/s/nHBczPlffhZrJy4G4oJ1Ag

让神经网络懂得黄金法则

https://mp.weixin.qq.com/s/0dUlVC9I8qmv3f2BB0IFew

强化学习介绍及自动驾驶汽车应用

https://mp.weixin.qq.com/s/_Di73PkEWJV1-OLLHfz7yQ

组合在线学习:实时反馈玩转组合优化

https://mp.weixin.qq.com/s/NkrPfitZ6o75XaGxGC0eZw

谷歌发布离线强化学习新范式,克服RL智能体只能在线训练难题,训练集相当于200多个ImageNet

https://mp.weixin.qq.com/s/nEw0Vem-aL9D6w-1lEAsBQ

字节跳动基于深度强化学习的广告推荐模型DEAR

https://mp.weixin.qq.com/s/xG7IboDg6tn13rRIgKSICg

强化学习中从仿真器到现实环境的迁移

https://mp.weixin.qq.com/s/CcJrsbYO70GwOcedUXnHdg

除了网红,强化学习也能带货?

https://mp.weixin.qq.com/s/u44neSzF2Iqyv-i1Fc4lsQ

脱胎换骨的生成模式:强化学习重排

https://mp.weixin.qq.com/s/oZDDP59o-1qwfz8prK3nJQ

伯克利最新研究:如何用目标图像进行机器视觉强化学习?

https://mp.weixin.qq.com/s/00zHwpw2xWP2fR9sDHE2Xw

BAIR讲述如何利用深度强化学习控制灵活手

https://mp.weixin.qq.com/s/V7RESEm4xzhW8tXEjKjn1Q

层次强化学习、记忆与预测模型

https://mp.weixin.qq.com/s/aNskPERmekw9yQVb7A3GPQ

Google大脑最新研究成果:使用强化学习实现动态系统的韧性计算

https://mp.weixin.qq.com/s/pJkCOCl6o70le1WsE9p3pg

在全景视频中预测头部运动:一种深度强化学习方法

https://mp.weixin.qq.com/s/fodjmmh_jJMh4hD3m2OrLg

凭借幻想的目标进行视觉强化学习

https://mp.weixin.qq.com/s/6HVSh7_9Akmf6OE8PGNy6Q

怎样让AI完成人类搞不定的任务?OpenAI提出迭代扩增法给AI设目标

https://mp.weixin.qq.com/s/JpZimrHALjuc-H9WF8sPZg

智能体只想看电视?谷歌新型好奇心方法让智能体离开电视继续探索

https://mp.weixin.qq.com/s/dic_ssebe32L30pAUxlP6w

谷歌AI-强化学习中的好奇和拖延

https://mp.weixin.qq.com/s/tieGV_tDWkVVW2YFes4AqA

学习何时做分类决策,深度好奇提出强化学习模型Jumper

https://mp.weixin.qq.com/s/THgo4YzhUN2PUkyI5sSnpw

开源啦:连DeepMind也捉急的游戏,OpenAI给你攻破第一关的高分算法

https://mp.weixin.qq.com/s/loH6M0_U1DVrod0Drkl4eg

深度强化学习教机器人自己穿衣服!

https://mp.weixin.qq.com/s/VqPPQnH22Y-XeojNEZn3YQ

CoRL 2018最佳系统论文:如此鸡贼的机器手,确定不是人在控制?

https://mp.weixin.qq.com/s/eEQhwV1cA4nEgEBcOKDenA

将逆向课程生成用于强化学习:伯克利新研究让智能体掌握全新任务

https://mp.weixin.qq.com/s/cO1VlYGwdRBAbPs7IgvcAA

超越传统强化学习的价值分布方法

https://mp.weixin.qq.com/s/s7c0oleKCmdI2Kh9pDPsXw

强化学习需要批归一化(Batch Norm)吗?

https://mp.weixin.qq.com/s/2nn56lpWe7YYU0CrRYrvbA

强化学习在智能交通灯中的应用

https://mp.weixin.qq.com/s/nk-X88bF6LiAywnqRz3REQ

Youtube推荐RL首弹,基于Top-K的Off-Policy矫正解决推荐中的信息茧房困境

https://mp.weixin.qq.com/s/EPLvdQFiT1MiGgG7u4Qoqg

基于强化学习的无地图机器人导航,Reinforcement Learning Based MRN

https://mp.weixin.qq.com/s/X8STHGKlJYN2Qizz4t8Llg

Accelerating DRL via Human knowledge

https://zhuanlan.zhihu.com/p/145983063

大规模深度强化学习的发展

https://zhuanlan.zhihu.com/p/53326459

深度强化学习中的好奇心

https://zhuanlan.zhihu.com/p/79712897

动态环境下基于DRL的无人车自适应路径规划方法

https://mp.weixin.qq.com/s/LdkPnm8vo8oeYzIC0Imlvw

俞扬:强化学习真实环境不好用?那就模拟器来凑!

https://mp.weixin.qq.com/s/GcjoZfasWNZWlTC_xP1_wg

通用强化学习用算法发现算法:DeepMind 数据驱动“价值函数”自我更新,14款Atari游戏完虐人类!

https://mp.weixin.qq.com/s/IFIXvZ_9oEzHJI34_dFI8g

训练DQN模型,loss出现nan,要怎么解决?

https://mp.weixin.qq.com/s/RE43jNFKbOj0DcLpGnAY7g

Distributional Soft Actor-Critic (DSAC)强化学习算法的设计与验证

https://mp.weixin.qq.com/s/Sxrp3EZ8LCA3d06Zm5meKQ

《深度强化学习中的迁移学习》2020综述论文,22页pdf

https://mp.weixin.qq.com/s/ylavFA_MXLUhIBLCqxAjLQ

阿里强化学习重排实践

https://mp.weixin.qq.com/s/0o-dNtmafC2paA6gqTRkKA

一步步详解用TD3算法通关BipedalWalkerHardcore-v2环境

Fork me on GitHub