Antkillerfarm Hacking V7.5

DRL » 深度强化学习(十二)——DRL参考资源(3)

2024-10-13 :: 4892 Words

DRL参考资源

https://mp.weixin.qq.com/s/fWySZWsYEKBRwYaFL3J2Xg

强化学习大规模应用还远吗?Youtube推荐已强势上线

https://mp.weixin.qq.com/s/nHBczPlffhZrJy4G4oJ1Ag

让神经网络懂得黄金法则

https://mp.weixin.qq.com/s/0dUlVC9I8qmv3f2BB0IFew

强化学习介绍及自动驾驶汽车应用

https://mp.weixin.qq.com/s/_Di73PkEWJV1-OLLHfz7yQ

组合在线学习:实时反馈玩转组合优化

https://mp.weixin.qq.com/s/NkrPfitZ6o75XaGxGC0eZw

谷歌发布离线强化学习新范式,克服RL智能体只能在线训练难题,训练集相当于200多个ImageNet

https://mp.weixin.qq.com/s/nEw0Vem-aL9D6w-1lEAsBQ

字节跳动基于深度强化学习的广告推荐模型DEAR

https://mp.weixin.qq.com/s/xG7IboDg6tn13rRIgKSICg

强化学习中从仿真器到现实环境的迁移

https://mp.weixin.qq.com/s/CcJrsbYO70GwOcedUXnHdg

除了网红,强化学习也能带货?

https://mp.weixin.qq.com/s/u44neSzF2Iqyv-i1Fc4lsQ

脱胎换骨的生成模式:强化学习重排

https://mp.weixin.qq.com/s/oZDDP59o-1qwfz8prK3nJQ

伯克利最新研究:如何用目标图像进行机器视觉强化学习?

https://mp.weixin.qq.com/s/00zHwpw2xWP2fR9sDHE2Xw

BAIR讲述如何利用深度强化学习控制灵活手

https://mp.weixin.qq.com/s/V7RESEm4xzhW8tXEjKjn1Q

层次强化学习、记忆与预测模型

https://mp.weixin.qq.com/s/aNskPERmekw9yQVb7A3GPQ

Google大脑最新研究成果:使用强化学习实现动态系统的韧性计算

https://mp.weixin.qq.com/s/pJkCOCl6o70le1WsE9p3pg

在全景视频中预测头部运动:一种深度强化学习方法

https://mp.weixin.qq.com/s/fodjmmh_jJMh4hD3m2OrLg

凭借幻想的目标进行视觉强化学习

https://mp.weixin.qq.com/s/6HVSh7_9Akmf6OE8PGNy6Q

怎样让AI完成人类搞不定的任务?OpenAI提出迭代扩增法给AI设目标

https://mp.weixin.qq.com/s/JpZimrHALjuc-H9WF8sPZg

智能体只想看电视?谷歌新型好奇心方法让智能体离开电视继续探索

https://mp.weixin.qq.com/s/dic_ssebe32L30pAUxlP6w

谷歌AI-强化学习中的好奇和拖延

https://mp.weixin.qq.com/s/tieGV_tDWkVVW2YFes4AqA

学习何时做分类决策,深度好奇提出强化学习模型Jumper

https://mp.weixin.qq.com/s/THgo4YzhUN2PUkyI5sSnpw

开源啦:连DeepMind也捉急的游戏,OpenAI给你攻破第一关的高分算法

https://mp.weixin.qq.com/s/loH6M0_U1DVrod0Drkl4eg

深度强化学习教机器人自己穿衣服!

https://mp.weixin.qq.com/s/VqPPQnH22Y-XeojNEZn3YQ

CoRL 2018最佳系统论文:如此鸡贼的机器手,确定不是人在控制?

https://mp.weixin.qq.com/s/eEQhwV1cA4nEgEBcOKDenA

将逆向课程生成用于强化学习:伯克利新研究让智能体掌握全新任务

https://mp.weixin.qq.com/s/cO1VlYGwdRBAbPs7IgvcAA

超越传统强化学习的价值分布方法

https://mp.weixin.qq.com/s/s7c0oleKCmdI2Kh9pDPsXw

强化学习需要批归一化(Batch Norm)吗?

https://mp.weixin.qq.com/s/2nn56lpWe7YYU0CrRYrvbA

强化学习在智能交通灯中的应用

https://mp.weixin.qq.com/s/nk-X88bF6LiAywnqRz3REQ

Youtube推荐RL首弹,基于Top-K的Off-Policy矫正解决推荐中的信息茧房困境

https://mp.weixin.qq.com/s/EPLvdQFiT1MiGgG7u4Qoqg

基于强化学习的无地图机器人导航,Reinforcement Learning Based MRN

https://mp.weixin.qq.com/s/X8STHGKlJYN2Qizz4t8Llg

Accelerating DRL via Human knowledge

https://zhuanlan.zhihu.com/p/145983063

大规模深度强化学习的发展

https://zhuanlan.zhihu.com/p/53326459

深度强化学习中的好奇心

https://zhuanlan.zhihu.com/p/79712897

动态环境下基于DRL的无人车自适应路径规划方法

https://mp.weixin.qq.com/s/LdkPnm8vo8oeYzIC0Imlvw

俞扬:强化学习真实环境不好用?那就模拟器来凑!

https://mp.weixin.qq.com/s/GcjoZfasWNZWlTC_xP1_wg

通用强化学习用算法发现算法:DeepMind 数据驱动“价值函数”自我更新,14款Atari游戏完虐人类!

https://mp.weixin.qq.com/s/IFIXvZ_9oEzHJI34_dFI8g

训练DQN模型,loss出现nan,要怎么解决?

https://mp.weixin.qq.com/s/RE43jNFKbOj0DcLpGnAY7g

Distributional Soft Actor-Critic (DSAC)强化学习算法的设计与验证

https://mp.weixin.qq.com/s/Sxrp3EZ8LCA3d06Zm5meKQ

《深度强化学习中的迁移学习》2020综述论文,22页pdf

https://mp.weixin.qq.com/s/ylavFA_MXLUhIBLCqxAjLQ

阿里强化学习重排实践

https://mp.weixin.qq.com/s/0o-dNtmafC2paA6gqTRkKA

一步步详解用TD3算法通关BipedalWalkerHardcore-v2环境

拉丁美洲+

西班牙在美洲的四大殖民地中白人男女比例经常是十比一。但西班牙白人殖民者懒得讨好本国的女人,根本不给本国的女人天价彩礼,因为他们可以直接收纳印第安小妾,可以用“黑珍珠”们暖床,在16、17世纪平均每个白人殖民者都有近十个土著小妾以及若干黑人女仆。

https://www.zhihu.com/question/605262653

亚裔女和白人男会创造出一个新的混血种族吗?


巴蒂斯塔被推翻后,卡斯特罗政府又联系上了流亡的他,让他帮忙组织古巴人去美国打工赚钱。这哥们儿立刻答应了,完全不介意自己是被推翻的,帮忙组织古巴人去海外打工赚汇。

去年古巴黑市上比索兑美元的汇率到了1:240,较2021年货币改革之初的汇率下跌了十倍,但是某些机构依然按照最初的汇率进行计算,这就出现了一个非常搞笑的事情,古巴在经济崩溃,人员大量外逃的情况下,gdp总额上涨了650%(名义GDP6334亿比索),人均gdp超过6万美元,进入了世界前十的水平。


古巴以风俗业为卖点的旅游收入得到了大幅度的增加。早在1990年,《花花公子》就在古巴著名的海滩度假胜地巴拉德罗拍摄一组风格大胆古巴女性照片。到1995年时,意大利的一份旅游杂志已经公开声称古巴是“性旅游的天堂”,这点从赴古巴游客的性别比上就足以看出——25-60岁年龄阶段的男性游客几乎是女性的两倍。

弗朗西斯卡和加布里埃拉是两个18岁的穆拉托女孩。她们白天在医学院学习护理,晚上在街上工作。如果她们每月与一个客户睡觉,她们的收入将是当护士的两倍多。“我们只是为了好玩才学习护理。我们当护士赚不到足够的钱来生活。”

而一位来自美国的退休高中教师则对古巴妓女的教育水平感慨不已:

“我昨晚和一个漂亮女孩在一起。我们完事后,她告诉我她是一名建筑师。你还能在哪里找到妓女是建筑师!”

https://www.zhihu.com/question/490686282

为什么苏联解体后,古巴没有出现朝鲜那样的大饥荒?


小政府,反计划,反中央集权,反绝对国家主权,反主权货币,反社会救济,反公有制,投美,投犹,自由化,无政府倾向…每一个政策和口号简直无比精准的踩着中国人治国思维的对立面。许多人难以接受这些政策有效,无非在于这种反中国治国政策的政策,如果让一个国家好了,那自己的认知岂不是…


著名的朗姆酒百加得家族,由法孔多·百加得于19世纪创立,总部位于古巴的圣地亚哥,在二十年代的美国就家喻户晓,现在更是享誉全球。古巴的Cuba Libre,波多黎各的Pina Colada这两款经典鸡尾酒,以及海明威最爱的Hemingway‘s Daiquiri,都会用到Bacardi朗姆酒作为基酒。

古巴革命后,卡斯特罗签署国有化法令,受到百加得等大企业的抵制。于是其被驱逐出境,百加得家族带着配方和一部分设备逃离古巴,最终在波多黎各继续发展,延续至今。

而古巴政府利用法律漏洞收购了百加得曾经的一个子品牌,哈瓦那俱乐部,并作为古巴朗姆酒的新招牌。非常有趣的是,今天哈瓦那俱乐部可以在全世界销售,除了美国和波多黎各,而百加得也可以在全世界销售,除了古巴,双方互不认可。

美西战争后,拉丁美洲精英必须在美国、西班牙和印第安三种文化认同中做出选择。(这里不讨论圭亚那地区)

曾经,大多数拉美精英选择了美国,而由于美国强硬的干涉,很多国家纷纷失望,并最终选择了西班牙-印第安认同(这也构成了今天拉美的格局)。

古巴革命成功后,美国意识到加勒比后院起火,于是开始大力扶持波多黎各,在当地投资工业和基础设施,打造出一个模范样板,以吸引东加勒比诸国。事实证明这政策非常成功,加勒比那些小国除格林纳达出现动荡外,其余都稳稳成为了美国跟班,而苏联插入的古巴-尼加拉瓜-格林纳达三角也很快被粉碎。今天,波多黎各已经成为美国的一个准州,算是加勒比最发达的地区,而这恰恰是波多黎各早期独立运动失败的“意外收获”。

https://www.zhihu.com/answer/9123677664

在一众拉美革命中,为何有且只有古巴取得了胜利?


https://mp.weixin.qq.com/s/TSGqmKKrWsMGT9BeIhoLBw

小国骨气!一生就想要一张毛主席签名照的他,是如何被美国暗杀的?(奥马尔·托里霍斯)

https://www.zhihu.com/answer/3363368237

哥斯达黎加

https://zhuanlan.zhihu.com/p/704022818

嘲笑原始部落沉迷黄色,反而显得我们很没见识

https://www.zhihu.com/question/24246919

为什么印第安人没有进化出更先进的文明,而还停留在原始社会?

https://www.zhihu.com/question/4136793152

紫金矿业被贩毒集团掠夺3.2吨黄金,价值约2亿美元,具体情况如何?

Fork me on GitHub