虽然,DRL似乎生来就是为了Robotics,然而现实中的无人系统,目前基本还是使用传统的控制方法。
例如:
https://www.zhihu.com/question/50050401
如何看待百度无人车, 三千多个场景,一万多个if?
不止国内,就连业界标杆Boston Dynamics也是这样:
https://www.zhihu.com/question/29871410
波士顿动力Boston Dynamics的大狗Big Dog用的了哪些控制、估计等算法?
直到最近才终于有了改观:
https://mp.weixin.qq.com/s/xSODAGf3QcJ3A9oq6xP11A
真的超越了波士顿动力!深度强化学习打造的ANYmal登上Science子刊
此外,还有一些论文:
《Learning to Drive in a Day》
强化学习和模仿学习,本质都是在任务层面的(Task-level Control),而传统的机器人控制都是在动作级(Action-level)和伺服级(Servo-level)。
https://www.zhihu.com/question/504142198
现有的控制器已经能完成对于机械臂的控制了,将深度强化学习应用到机械臂的控制上还有什么实际意义吗?
参考:
https://zhuanlan.zhihu.com/p/59197798
那些个端到端的自动驾驶研发系统
https://mp.weixin.qq.com/s/yU-6r-7l50y5msw8gUWnUQ
美团技术部解析:无人车端到端驾驶模型概述
MPC(Model Predictive Control)+WBC (Whole-Body Control)是典型的做腿足类机器人用的算法。
机械臂+灵巧手+移动小车,一般被称为AMR(Autonomous Mobile Robot)。
教程:
http://cse.lab.imtlucca.it/~bemporad/mpc_course.html
Model Predictive Control
https://www.syscop.de/teaching/ss2021/model-predictive-control-and-reinforcement-learning
Model Predictive Control and Reinforcement Learning
http://web.mit.edu/dimitrib/www/LessonsfromAlphazero.pdf
Lessons from AlphaZero for Optimal, Model Predictive, and Adaptive Control
参考:
https://mp.weixin.qq.com/s/pMnbVWDDVgIdFpzkfSUd5Q
时延MPC自主车辆协同控制算法与仿真
https://mp.weixin.qq.com/s/UAPbNq_KNWCFd7p8U8HnYQ
模型预测控制(MPC)
https://zhuanlan.zhihu.com/p/99409532
模型预测控制简介(model predictive control)
https://zhuanlan.zhihu.com/p/507623074
Model Based + MPC + Planning + RL相关
https://mp.weixin.qq.com/s/BFNaEBa8KwvRBK_mSunXjw
MPC与LQR比较
https://www.zhihu.com/question/424186342
模型预测控制(MPC)和基于模型的强化学习(Model-based RL)之间的联系是什么?
https://mp.weixin.qq.com/s/ruAAQEjPIDPWPiuPepKU6Q
Deep Reinforcement Learning: An Overview
https://mp.weixin.qq.com/s/FjmlXqlpaRVLdAbjqspOJA
这是一份你必须学习的强化学习算法清单
https://mp.weixin.qq.com/s/GISY-FvV1Vml3CNLInjgYg
Tensorflow2.0实现29种深度强化学习算法大汇总
https://mp.weixin.qq.com/s/lfXQqllfFPtuNIrQZiD-NQ
深度强化学习十大原则
https://mp.weixin.qq.com/s/I8IwPCY6-zocJKFXMr6rUg
深度强化学习的18个关键问题
https://mp.weixin.qq.com/s/_lmz0l1vP_CQ6p6DdFnHWA
谷歌大脑工程师的深度强化学习劝退文
https://zhuanlan.zhihu.com/p/39999667
强化学习路在何方?
https://zhuanlan.zhihu.com/p/25239682
深度强化学习(Deep Reinforcement Learning)入门
https://mp.weixin.qq.com/s/Ns5AUGfDoTeTwnBD-pYdLA
详解强化学习当前进展及未来方向
https://mp.weixin.qq.com/s/VIMX63zBaZ5ji70UmHHajg
强化学习入门知识超全梳理
https://mp.weixin.qq.com/s/e6QOz-MQSn7n53EPtpw64w
DeepMind强化学习综述:她可以很快,但快从慢中来
https://zhuanlan.zhihu.com/p/72642285
基于模型的强化学习论文合集
https://zhuanlan.zhihu.com/p/77976582
强化学习并行训练论文合集
https://mp.weixin.qq.com/s/sHP03DAeZvdBxwVPuSNRPg
如何丝滑地入门神经网络?写个AI赛车游戏,只训练4代就能安全驾驶
https://mp.weixin.qq.com/s/1SZKhG1ZbD1pl-3YQD_umg
6行代码搞定基本的RL算法,速度围观Reddit高赞帖
https://mp.weixin.qq.com/s/6n5HawyR4AgH8Dq0gJMw2g
强化学习的基本概念与代码实现
https://mp.weixin.qq.com/s/AI3i3ZLZ-fynavbeNAMKgA
强化学习应用介绍,41页报告带你快速了解RL的最新应用价值
https://mp.weixin.qq.com/s/-Cd7rQY3c3CINjtB99UZWw
自动驾驶领域中的强化学习,附18页论文下载
https://mp.weixin.qq.com/s/UBWN4_Sem8W1WcjsLAnjjQ
强化学习,路在何方?
https://book.yunzhan365.com/iths/nahn/mobile/index.html
强化学习和最优控制的《十个关键点》81页PPT汇总
https://zhuanlan.zhihu.com/p/107143378
Learning SR for Text Classification via RL
https://mp.weixin.qq.com/s/6c8imZFRAoxgs18rk_tlEw
炼丹感悟:On the Generalization of RL
https://mp.weixin.qq.com/s/PpBMu-5ozc9UOBbFhjsf3A
漫谈强化学习中的引导搜索策略(GPS方法)
https://mp.weixin.qq.com/s/TUk1PWT9CfPGEW77UKxpjw
三招武林绝学带你玩转“强化学习”
https://mp.weixin.qq.com/s/Uin1gOmJEa6cvkiFJm6cHw
你当年没玩好的《愤怒的小鸟》,AI现在也犯难了
https://mp.weixin.qq.com/s/YY1FIMjDIMABdwRC5x9w4g
17种深度强化学习算法用Pytorch实现
https://mp.weixin.qq.com/s/lxnyoo46tS7-MXAB7HNouA
人工智能在电网管理中的应用
https://mp.weixin.qq.com/s/ZYIfzk1kZ4azpmxWagkQuw
强化学习如何用于模型量化?
https://mp.weixin.qq.com/s/w4m4fG-a30AgulNPhBVC5w
基于强化学习的自动交易系统研究与发展综述
https://mp.weixin.qq.com/s/oyWyb58l4ztqIEyrk0g01A
强化学习在美团“猜你喜欢”的实践
https://mp.weixin.qq.com/s/oA98YyLqn1B22QZ5b_iDVA
IJCAI 2018:聚焦强化学习的学习效率
https://mp.weixin.qq.com/s/FtHJCXniVne2TGKfgCeS9w
Pieter Abbeel:深度强化学习加速方法
https://mp.weixin.qq.com/s/xlnwB9e1ks-4M4djnyIAyQ
解读72篇DeepMind深度强化学习论文
https://mp.weixin.qq.com/s/VYIyWRykREjOyLu4YDhLeA
61篇NIPS2019深度强化学习论文及部分解读
https://zhuanlan.zhihu.com/p/48186354
robot浅谈
https://mp.weixin.qq.com/s/f-rmdWq3kJUJGhuPwU8JtQ
深度策略梯度算法是真正的策略梯度算法吗?
https://mp.weixin.qq.com/s/SiVUmjHyw8ztiaSWNSZ-qA
多任务深度强化学习综述
https://zhuanlan.zhihu.com/p/51202503
强化学习在视觉上的应用(RL for computer Vision)
https://mp.weixin.qq.com/s/Dq4HsRg05bVMjvrsrxfOOQ
从这篇YouTube论文,剖析强化学习在工业级场景推荐系统中的应用
https://mp.weixin.qq.com/s/cyaQt-SO7sgG49kuUyPJbQ
旷视开源的深度强化学习绘画智能体论文解读
https://mp.weixin.qq.com/s/curzH8WrFyl5WWT4lDfpwQ
Chrome暗藏的恐龙跳一跳,已经被AI轻松掌握了
https://www.cnblogs.com/massquantity/p/13842139.html
Flink+强化学习搭建实时推荐系统
https://mp.weixin.qq.com/s/zfVrmErz3ZaGz7Ha7qGoIw
要提升微信看一看推荐混排的长期收益?试试深度强化学习
https://mp.weixin.qq.com/s/RLEuaiRdq6AbTSUcYQ5O3A
深度强化学习在NLP怎么用?看清华黄民烈老师这一份120页《自然语言处理和搜索中的深度强化学习应用》讲义
https://zhuanlan.zhihu.com/p/29019246
基于策略的增强学习
https://mp.weixin.qq.com/s/OY56lJ_NFf5vVAgKfKyx2A
利用强化学习自动搜索最优化方法
https://mp.weixin.qq.com/s/nYOOwVoijl1p4V0A7yaI3w
机遇与挑战:用强化学习自动搜索优化算法
http://mp.weixin.qq.com/s/TBVVdX3erOpXNjXmhLmxOw
学“深度强化学习”,看懂DeepMind这篇文章就够了!
https://mp.weixin.qq.com/s/7BsXPQ8wC6_fHulU63ZQiQ
当强化学习遇见泛函分析
https://mp.weixin.qq.com/s/uDFsWebfLmka-zZX3Y_8kg
深度强化学习在面向任务的对话管理中的应用
https://zhuanlan.zhihu.com/p/41467058
Policy Optimization with Demonstrations
https://openreview.net/pdf?id=rJzoujRct7
深度学习之斗地主
https://mp.weixin.qq.com/s/qWuoo6cGLWLk4OKlunR-Og
滴滴KDD 2018论文详解:基于强化学习技术的智能派单模型
https://zhuanlan.zhihu.com/p/43496459
解决Sparse Reward RL任务的简单回顾
https://mp.weixin.qq.com/s/tuEhP3CDZ4PW7S66yP8AbA
如何解决稀疏奖励下的强化学习?
https://mp.weixin.qq.com/s/GUyZ0U5_JlXCI-5mO796SA
超越DQN和A3C:深度强化学习领域近期新进展概览
https://zhuanlan.zhihu.com/p/43843955
BAIR:基于人类演示&RL的夹爪训练——高效、通用、低成本
https://mp.weixin.qq.com/s/ADZlLx6gMTFU6IoBCF669g
快1万倍!伯克利提出用深度RL优化SQL查询
https://mp.weixin.qq.com/s/G99vqIYeWzgQ4kL4p77cKA
用强化学习做神经机器翻译:中山大学&MSRA填补多项空白
https://mp.weixin.qq.com/s/FROyReDu7i5amGv-J4cmtg
“世界模型”实现,一步步让机器掌握赛车和躲避火球的技能
https://mp.weixin.qq.com/s/oyxqA_LYtze1f_YDwDZziQ
从零开始自学设计新型药物,UNC提出结构进化强化学习
https://mp.weixin.qq.com/s/1b3_AiFhwXqxb7FozdRYIQ
最in强化学习+NLP技术分享会
https://mp.weixin.qq.com/s/RKQb7-mQ-ELRRq18db02Pg
DeepMind大突破!AI模拟大脑导航功能,学会像动物一样“抄近路”
https://mp.weixin.qq.com/s/qBwszD9rn4gKazXdwqexSQ
MIT提出使用“深度强化学习”帮助智能体在运动中做出“动作决策”
https://mp.weixin.qq.com/s/i-udn1M4kiJpF8U7u5Uepg
专家解读DeepMind最新论文:深度学习模型复现大脑网格细胞
https://mp.weixin.qq.com/s/AS1VFjBFnSk19QJ28tBVWA
NIPS 2017斯坦福赛题大公开:强化学习模拟人类肌肉骨骼模型
https://mp.weixin.qq.com/s/TWjFWe6-dZWDoTi5gN1BxA
深度强化学习在指代消解中的一种尝试
https://mp.weixin.qq.com/s/YnMgJDAh3XhyyNdI8RXmtw
腾讯知文等提出新型生成式摘要模型:结合主题信息和强化训练生成更优摘要
https://mp.weixin.qq.com/s/VrVdsxn94ux_46mIyS8f0w
谷歌大脑实现更宽广的智能体视野,在Atari2600上可持续超越人类玩家!
https://mp.weixin.qq.com/s/P5EysBHBaR6L3IfeSgo6fw
强化学习20分钟,剑桥博士教汽车学会自动驾驶!
https://mp.weixin.qq.com/s/ij3bf61Pu7lrX0WijhbDeA
骑驴找马:利用深度强化学习模型定位新物体
https://mp.weixin.qq.com/s/iYxijHlE3sLJgKnwwd8Tgg
使用深度强化学习和贝叶斯优化获得巨额利润
https://mp.weixin.qq.com/s/_QkxCrQlyRM10eZK8aNCKA
强化学习在携程酒店推荐排序中的应用探索
您的打赏,是对我的鼓励