寫(xiě)文章

首頁(yè) 手記從“小”培養(yǎng)AI安全意識(shí)：Op...

從“小”培養(yǎng)AI安全意識(shí)：OpenAI開(kāi)源最新強(qiáng)化學(xué)習(xí)訓(xùn)練工具，安全約束自由定制，開(kāi)箱即用

標(biāo)簽：

人工智能

强化学习（RL）很强，能训练出会用鸡贼策略的星际宗师级玩家。

△AlphaStar打出cannon rush

但强化学习也很危险，因为它的套路是无限制探索，常常会出现一些疯狂危险的尝试。

但在现实环境中，有些试错是不可接受的。没有人希望看到，AI通过反复撞车来学会避免事故发生。

要让强化学习从虚拟环境走向现实生活，强化学习界的高玩OpenAI说：安全意识要从“小”抓起。

于是，他们开源了Safety Gym。

这是一套具有安全约束的训练环境和工具，能够评估强化学习智能体在训练过程中是否遵循安全原则，把AI在训练过程中产生的奇奇怪怪的想法都“扼杀”在摇篮里。

也就是说，在训练过程中，就约束AI，让它们明白，有些禁忌是不可触犯的。

Safety Gym

想要培养安全意识，就得给出安全规范。而在强化学习中，能做到这一点的就是约束强化学习（Constrained RL）。

约束强化学习，除了像普通的强化学习那样最大化奖励功能，还添加了约束智能体的成本函数（cost function）。

以自动驾驶举例，AI的任务是尽快从A点到达B点，所用时间越短，获得的奖励就最大。

这就导致，只要奖励够高，撞不撞车什么的会完全被AI忽视。

而在约束强化学习中，增加了一重惩罚：如果出现不可接受的危险行为，就惩罚智能体，直到它不再这么干为止。

而Safety Gym的诞生，就是为了方面约束强化学习的安全研究。

在Safety Gym环境中，预设了三种机器人：

点（Point）：一个被约束在二维平面上的简单机器人，能够转弯、前进或后退。

车（Car）：有两个独立驱动的平行车轮和一个自由滚动的后轮。车在转弯、向前或向后移动时，需要协调两个驱动器。

狗狗（Doggo）：一只四足机器人，每条腿跟躯干接触的位置都有两个控件，分别控制相对于躯干的方位角和仰角；膝盖上也有一个控制角度的控制器。

以及三个主要任务，每个任务都有两个难度级别：

目标任务（Goal）：让机器人移动到一系列目标位置。

按钮任务（Button）：让机器人按一系列目标按钮。

△在有干扰的情况下按按钮

推箱子任务（Push）：让机器人把箱子推到一系列目标位置。

另外，在Safety Gym中还有五种主要的安全约束元素：危险区域，易碎花瓶，按钮，柱子和小怪兽。

这些元素可以自由组合，用户可以在训练环境中添加任意数量的任意元素，并设置针对性的约束条件。

每个时间步长，环境都会为每一种不安全元素提供单独的成本信号，并提供反应整体的总成本信号。

与现有训练环境相比，Safety Gym环境更丰富，任务更难且更复杂。

基准测试

为了让Safety Gym变成一个开箱即用的工具，OpenAI还在其基础上提出了一种标准化方法，评估了一系列标准强化学习算法和约束强化学习算法：PPO，TRPO，PPO和TRPO的拉格朗日罚分版，以及约束策略优化（CPO）。

△基准环境

结果表明：在Safety Gym里，最简单的任务易于解决，并且可以快速迭代。而最困难的任务，对当前的技术而言还是颇具挑战性。

OpenAI希望，未来，Safety Gym能被集成到开发人员用来测试系统的评估方案中，成为安全标准。

— 完 —

點(diǎn)擊查看更多內(nèi)容

為 TA 點(diǎn)贊

若覺(jué)得本文不錯(cuò)，就分享一下吧！

評(píng)論

評(píng)論

共同學(xué)習(xí)，寫(xiě)下你的評(píng)論

評(píng)論加載中...

展開(kāi)查看更多評(píng)論

作者其他優(yōu)質(zhì)文章

正在加載中

量子位

產(chǎn)品經(jīng)理

手記
篇

粉絲

5269

獲贊與收藏

376

關(guān)注作者，訂閱最新文章

閱讀免費(fèi)教程

后端通用面試教程

41個(gè)小節(jié) 32194 359

網(wǎng)絡(luò)編程入門(mén)教程

20個(gè)小節(jié) 13289 250

Pandas 入門(mén)教程

25個(gè)小節(jié) 19886 373

推薦

評(píng)論

收藏

共同學(xué)習(xí)，寫(xiě)下你的評(píng)論



感謝您的支持，我會(huì)繼續(xù)努力的～

掃碼打賞，你說(shuō)多少就多少

贊賞金額會(huì)直接到老師賬戶(hù)

支付方式

打開(kāi)微信掃一掃，即可進(jìn)行掃碼打賞哦

今天注冊(cè)有機(jī)會(huì)得

100積分直接送

付費(fèi)專(zhuān)欄免費(fèi)學(xué)

大額優(yōu)惠券免費(fèi)領(lǐng)

立即參與放棄機(jī)會(huì)

點(diǎn)擊
抽獎(jiǎng)

慕課手記新用戶(hù)專(zhuān)享福利

恭喜你，你的運(yùn)氣太好了，居然抽中了 100個(gè)積分！

恭喜你，抽中了價(jià)值元的專(zhuān)欄！

太棒了，直接落到你賬戶(hù)里！

積分商城里的羅技鼠標(biāo)、機(jī)械鍵盤(pán)、
Kindle 閱讀器、小米平衡車(chē)
Apple iPad （10.2英寸）、大額優(yōu)惠券
在等著你去兌換了噢

作者：

免費(fèi)贈(zèng)送

兌換碼：1111222211 復(fù)制

優(yōu)惠券可用于購(gòu)買(mǎi)實(shí)戰(zhàn)課、體系課
無(wú)門(mén)檻使用

先去看看，有什么好東西馬上兌換


第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

從“小”培養(yǎng)AI安全意識(shí)：OpenAI開(kāi)源最新強(qiáng)化學(xué)習(xí)訓(xùn)練工具，安全約束自由定制，開(kāi)箱即用