Antkillerfarm Hacking V8.0

DRL » 深度强化学习(十二)——DRL参考资源(3)

2024-10-13 :: 4899 Words

DRL参考资源

https://mp.weixin.qq.com/s/AS1VFjBFnSk19QJ28tBVWA

NIPS 2017斯坦福赛题大公开:强化学习模拟人类肌肉骨骼模型

https://mp.weixin.qq.com/s/TWjFWe6-dZWDoTi5gN1BxA

深度强化学习在指代消解中的一种尝试

https://mp.weixin.qq.com/s/YnMgJDAh3XhyyNdI8RXmtw

腾讯知文等提出新型生成式摘要模型:结合主题信息和强化训练生成更优摘要

https://mp.weixin.qq.com/s/VrVdsxn94ux_46mIyS8f0w

谷歌大脑实现更宽广的智能体视野,在Atari2600上可持续超越人类玩家!

https://mp.weixin.qq.com/s/P5EysBHBaR6L3IfeSgo6fw

强化学习20分钟,剑桥博士教汽车学会自动驾驶!

https://mp.weixin.qq.com/s/ij3bf61Pu7lrX0WijhbDeA

骑驴找马:利用深度强化学习模型定位新物体

https://mp.weixin.qq.com/s/iYxijHlE3sLJgKnwwd8Tgg

使用深度强化学习和贝叶斯优化获得巨额利润

https://mp.weixin.qq.com/s/_QkxCrQlyRM10eZK8aNCKA

强化学习在携程酒店推荐排序中的应用探索

https://mp.weixin.qq.com/s/fWySZWsYEKBRwYaFL3J2Xg

强化学习大规模应用还远吗?Youtube推荐已强势上线

https://mp.weixin.qq.com/s/nHBczPlffhZrJy4G4oJ1Ag

让神经网络懂得黄金法则

https://mp.weixin.qq.com/s/0dUlVC9I8qmv3f2BB0IFew

强化学习介绍及自动驾驶汽车应用

https://mp.weixin.qq.com/s/_Di73PkEWJV1-OLLHfz7yQ

组合在线学习:实时反馈玩转组合优化

https://mp.weixin.qq.com/s/NkrPfitZ6o75XaGxGC0eZw

谷歌发布离线强化学习新范式,克服RL智能体只能在线训练难题,训练集相当于200多个ImageNet

https://mp.weixin.qq.com/s/nEw0Vem-aL9D6w-1lEAsBQ

字节跳动基于深度强化学习的广告推荐模型DEAR

https://mp.weixin.qq.com/s/xG7IboDg6tn13rRIgKSICg

强化学习中从仿真器到现实环境的迁移

https://mp.weixin.qq.com/s/CcJrsbYO70GwOcedUXnHdg

除了网红,强化学习也能带货?

https://mp.weixin.qq.com/s/u44neSzF2Iqyv-i1Fc4lsQ

脱胎换骨的生成模式:强化学习重排

https://mp.weixin.qq.com/s/oZDDP59o-1qwfz8prK3nJQ

伯克利最新研究:如何用目标图像进行机器视觉强化学习?

https://mp.weixin.qq.com/s/00zHwpw2xWP2fR9sDHE2Xw

BAIR讲述如何利用深度强化学习控制灵活手

https://mp.weixin.qq.com/s/V7RESEm4xzhW8tXEjKjn1Q

层次强化学习、记忆与预测模型

https://mp.weixin.qq.com/s/aNskPERmekw9yQVb7A3GPQ

Google大脑最新研究成果:使用强化学习实现动态系统的韧性计算

https://mp.weixin.qq.com/s/pJkCOCl6o70le1WsE9p3pg

在全景视频中预测头部运动:一种深度强化学习方法

https://mp.weixin.qq.com/s/fodjmmh_jJMh4hD3m2OrLg

凭借幻想的目标进行视觉强化学习

https://mp.weixin.qq.com/s/6HVSh7_9Akmf6OE8PGNy6Q

怎样让AI完成人类搞不定的任务?OpenAI提出迭代扩增法给AI设目标

https://mp.weixin.qq.com/s/JpZimrHALjuc-H9WF8sPZg

智能体只想看电视?谷歌新型好奇心方法让智能体离开电视继续探索

https://mp.weixin.qq.com/s/dic_ssebe32L30pAUxlP6w

谷歌AI-强化学习中的好奇和拖延

https://mp.weixin.qq.com/s/tieGV_tDWkVVW2YFes4AqA

学习何时做分类决策,深度好奇提出强化学习模型Jumper

https://mp.weixin.qq.com/s/THgo4YzhUN2PUkyI5sSnpw

开源啦:连DeepMind也捉急的游戏,OpenAI给你攻破第一关的高分算法

https://mp.weixin.qq.com/s/loH6M0_U1DVrod0Drkl4eg

深度强化学习教机器人自己穿衣服!

https://mp.weixin.qq.com/s/VqPPQnH22Y-XeojNEZn3YQ

CoRL 2018最佳系统论文:如此鸡贼的机器手,确定不是人在控制?

https://mp.weixin.qq.com/s/eEQhwV1cA4nEgEBcOKDenA

将逆向课程生成用于强化学习:伯克利新研究让智能体掌握全新任务

https://mp.weixin.qq.com/s/cO1VlYGwdRBAbPs7IgvcAA

超越传统强化学习的价值分布方法

https://mp.weixin.qq.com/s/s7c0oleKCmdI2Kh9pDPsXw

强化学习需要批归一化(Batch Norm)吗?

https://mp.weixin.qq.com/s/2nn56lpWe7YYU0CrRYrvbA

强化学习在智能交通灯中的应用

https://mp.weixin.qq.com/s/nk-X88bF6LiAywnqRz3REQ

Youtube推荐RL首弹,基于Top-K的Off-Policy矫正解决推荐中的信息茧房困境

https://mp.weixin.qq.com/s/EPLvdQFiT1MiGgG7u4Qoqg

基于强化学习的无地图机器人导航,Reinforcement Learning Based MRN

https://mp.weixin.qq.com/s/X8STHGKlJYN2Qizz4t8Llg

Accelerating DRL via Human knowledge

https://zhuanlan.zhihu.com/p/145983063

大规模深度强化学习的发展

https://zhuanlan.zhihu.com/p/53326459

深度强化学习中的好奇心

https://zhuanlan.zhihu.com/p/79712897

动态环境下基于DRL的无人车自适应路径规划方法

https://mp.weixin.qq.com/s/LdkPnm8vo8oeYzIC0Imlvw

俞扬:强化学习真实环境不好用?那就模拟器来凑!

https://mp.weixin.qq.com/s/GcjoZfasWNZWlTC_xP1_wg

通用强化学习用算法发现算法:DeepMind 数据驱动“价值函数”自我更新,14款Atari游戏完虐人类!

https://mp.weixin.qq.com/s/IFIXvZ_9oEzHJI34_dFI8g

训练DQN模型,loss出现nan,要怎么解决?

https://mp.weixin.qq.com/s/RE43jNFKbOj0DcLpGnAY7g

Distributional Soft Actor-Critic (DSAC)强化学习算法的设计与验证

https://mp.weixin.qq.com/s/Sxrp3EZ8LCA3d06Zm5meKQ

《深度强化学习中的迁移学习》2020综述论文,22页pdf

https://mp.weixin.qq.com/s/ylavFA_MXLUhIBLCqxAjLQ

阿里强化学习重排实践

https://mp.weixin.qq.com/s/0o-dNtmafC2paA6gqTRkKA

一步步详解用TD3算法通关BipedalWalkerHardcore-v2环境

中东+

麦德莱赛是伊斯兰教传统教育机构,即附设于清真寺的书院,塔利班要求其高级干部必须从麦德莱赛毕业成为毛拉。

塔利班2021年8月夺取权力后在9月组建内阁,当时其成员曾自豪“本届内阁里没有人拥有大学学历,甚至连高中学历都没有,学历并不重要”云云,给人以渲染知识无用论的感觉;然而其实这句话的本意是说塔利班高层人员没有西式高等教育的学历,并不是真标榜自己无知;其实,塔利班的高级干部必须要拥有相当于高中毕业的神学学历,而且大部分都拥有相当于大学毕业的神学学历。可见,从传统意识形态领域社会地位的角度,塔利班这个概念相当于明清的“诸生”。从这个意义上来说,塔利班也可以被视为“秀才造反”。

https://zhuanlan.zhihu.com/p/399849812

当代塔利班要人传

https://www.zhihu.com/answer/2123650538

塔利班


汇丰银行出来检举揭发,说巴沙尔目前在他家存了5500万英镑现金!经过这么多年这么多事,巴沙尔和阿斯玛还是爱着英国的。俩大殖子! ​​​

就跟唐玄宗安史之乱出逃一样。除了少数几个心腹,连住在宫外的子女和满朝文武都没有通知,还放了个烟雾弹说自己要御驾亲征。直到日常早朝发现皇帝不见了,才知原来自己被抛弃在长安等死了。

阿萨德这个姓氏的来源,有几个说法。

其中一个,说是哈菲兹的父亲扶危济困,锄强扶弱,仗义疏财,荒年放赈,在乡里威望极高。当地老百姓给他上尊号“狮子”,读音就是阿萨德。

原先阿萨德权贵故意制造稀缺,大饼都在巴沙尔军手里,隔两天发一次。现在被革命群众找到了,敞开供应,不缺了。


今日世界最大的看点有三,泽连斯基的抵抗运动,米莱的社会实验,祖拉尼的伊斯兰变革。


叙利亚媒体提到临时政府总理巴希尔的时候,标准称呼都是临时总理巴希尔工程师,好像工程师在叙利亚不仅是个职业,还是个头衔,就仿佛博士、教授一样。

在中东,工程师muhadis(a)是非常令人尊敬的头衔和称呼,就是engineer才行。师傅一般用osda,称呼工人,司机等。一般称呼labor worker。


巴沙尔医生幸亏没听这帮国师的话,果断润了。不然他现在全家估计都被反对派吊路灯了。

事实再次证明了,他们的话你反着听就行了。

中国B站上有一个给巴沙尔洗地的视频,题目是《这么快就后悔了?叙利亚民众哀求巴沙尔回来》,有人把这个发给叙利亚人,结果人家说:

“对,是真的,我们都盼着他回来,——回来之后绞死他!”


戈兰尼委员长出身叙利亚南部豪族——沙里亚家族,其祖先曾是知名教士,领地横跨叙利亚、约旦、巴勒斯坦三国(当然那会儿都是奥斯曼帝国)。曾祖父是叙利亚抗土、抗法独立斗士,祖父是戈兰高地菲克镇(该镇在1967年被以色列占领后废弃,土地被以色列开拓团占据)的大地主,父亲是纳赛尔主义者、巴解组织成员、石油企业大买办、大资本家。戈兰尼的族叔法鲁克.沙里亚是复兴党政权的要人,担任外交部长超过20年,2006~2014年间还曾出任过巴沙尔的副总统(有趣的是,当时的另一位副总统则是叙利亚穆兄会领袖的姐姐,也就是说对垒的双方阵营领导人,有着直接亲戚关系)。

https://www.zhihu.com/pin/1852197431388794880

救官、编遣、不抵抗:戈委员长的执政三策


泽子的所谓大反攻,你们吹了一年,别人还以为打到莫斯科了呢,仔细一看还差十万八千里。

反观阿萨德,开战三天就到莫斯科了。

高下立判。

Fork me on GitHub