奇酷教育-Python培训|UI培训|WEB大前端培训|Unity3D培训|HTML5培训|人工智能培训|JAVA开发的教育品牌

您現在所在的位置:首頁 >關于奇酷 > 行業動態 > OpenAI機械右手玩轉魔方!人類也難以做到!

OpenAI機械右手玩轉魔方!人類也難以做到!

來源:奇酷教育 發表于:

OpenAI官方為這只AI機械手玩轉魔方!

  OpenAI官方為這只AI機械手激動了:
 
  “機器人的前所未有之境,就算人類也難以做到。”
 
  說的啥新進展?單手玩魔方。
 
  相比之下,人類新手能穩穩拿住魔方都不容易:
 
  而且不僅玩得轉魔方,捆綁Play也不在話下。
 
  沒人告訴它該怎么調配手指,還需要克服人類強行使的各種絆子,但AI機械手可以隨時調整不斷學習,最后最短時間內完成魔方翻轉。
 
  這就是OpenAI用強化學習最新訓練出的AI系統。
 
  并且,還是單手操作。
 
  視頻一經放出,迅速躥紅推特,攬下6000+點贊,網友驚呼:
 
  AI玩魔方都玩得比我好了!
  這事兒不簡單
 
  且不說量子位這樣的手殘黨,單手恢復魔方,對于普通人類而言也并不簡單。
 
  不信的話,隨便拿起身邊一個直徑6厘米的塊狀物體,單手轉起來。小心拿穩了,砸到腳還挺疼的(別問我怎么知道的)。
 
  而對機械手來說,問題就更復雜了。
 
  機械手遠沒有人手這樣靈活,抓取力度控制也挑戰不小。
 
  就算是“媲美”人手,能使用的場景或泛化遷移能力,也道阻且長。
 
  比如這位MIT工程師,就吃過大虧:
 
  △生活大爆炸
 
  而更大的挑戰,是現實世界中復雜的物理參數。
 
  在玩魔方這個任務當中,機械手跟魔方之間的摩擦力、彈性和其他動力學因素都很難測量,更別說精細建模了。
 
  并且,在模擬仿真環境中訓練出來的AI,面對復雜多變的真實物理世界,是否能保持魯棒,也是一個大問題。
 
  比如說帶個橡膠手套,摩擦力就變了:
 
  兩個手指被綁住,難度也會與模擬訓練時大大不同:
 
  甚至可能會跑出來一只長頸鹿,試圖叼走魔方:
  如此種種,使得sim2real(從模擬環境到現實環境)變得非常困難,僅憑過去的域隨機化(Domain Randomization)算法(見注)已經不足以解決。
 
  注:域隨機化(Domain Randomization)由OpenAI提出,能夠創建具有隨機屬性的各種模擬環境,并訓練可在任何環境中工作的模型。
 
  所以機械手玩轉魔方,真真是一次力與美的結合、靈與器的共舞。
 
  而OpenAI的核心秘訣,在于進一步開發了一種新的算法,稱為自動域隨機化(ADR)。
 
  當然,機械手的構造也來頭不小。
 
  先看神奇之手的硬件結構
 
  OpenAI的機械手,裝載一個巨大的支架中。
 
  在這個支架里,包含一個PhaseSpace運動捕捉系統、一個RGB相機。機械手的每個指尖上都有一個LED燈,系統就是通過這一組燈來捕捉機械手的動作。
  操縱魔方的機器人手來自影子機器人公司(Shadow Robot Company),基于旗下 Dextrous E系列機械手打造。
 
  這原本是一家想做雙足機器人的公司,因為發現自己的水平遠不及本田已經造出的機器人,于是棄腳從手,轉而去開發機械手,并造出了世界上第一臺擬真機械手。
  △ 影子機器人公司開發的機器人
 
  具體結構上,Dextrous有20個可驅動的關節:中指和無名指各有3個驅動關節和1個非驅動關節,小指和拇指有5個驅動關節,以及一個有2個驅動關節的腕部。
 
  為了“玩轉魔方”,OpenAI和影子機器人公司,還合作提高了機器手組件的堅固性和可靠性。增加了手的握力,并減小了肌腱應力,并且調整了關節之間的交聯,最大程度地減小了扭矩的限制。
  與人類“十指連心”類似,他們除了在機械手上安裝了位置和力傳感器,還在指尖上安裝了超靈敏的觸摸傳感器,以達到接近人手的效果。
 
  實驗中用到的魔方也不是普通的魔方。
 
  不少米粉或許也會覺得眼熟,它是小米的計客超級魔方(GiiKER cube),內部有可感應方向的藍牙與運動傳感器。
 
  計客超級魔方具有90度的面角分辨率,但OpenAI團隊對其進行了修改,將精度提高到了大約5度。
  再看軟件算法功力:從模擬到現實
 
  雖然我們看到擰魔方是在實際的機械手上發生的,但實際上這一過程主要發生在模擬軟件中,然后將AI從模擬中學習到的東西轉移到了現實世界中。
 
  OpenAI在機械手上用到了兩大法寶:
 
  一個是曾經打敗Dota 2世界冠軍團隊的AI系統OpenAI Five;
  另一個是自動域隨機化(ADR,Automatic Domain Randomization)。
 
  ADR會不斷在仿真中生成越來越困難的環境,使系統擺脫精確模型對現實的束縛,從而使模擬環境中的神經網絡能夠遷移到真實世界。
 
  這里提到的環境中的隨機化是什么呢?
 
  其中包括模擬器考慮到的物理特性(如幾何形狀、摩擦和重力),以及模擬器未能考慮到的一些物理效應。
 
  比如魔方的大小,就是隨機化參數之一。
  △ADR在魔方大小上的應用
 
  此外,還有照明條件之類的視覺元素、相機位置和角度、物體的材料和外觀、背景紋理甚至是渲染圖像的后處理效果。
 
  研究人員表示,這項研究的重要意義在于:一旦弄清楚如何在仿真中訓練這些模型,就可以有效地獲取無窮數據,然后將模型遷移到機器人上,在現實世界中利用它們。
 
  既然是用強化學習,必然會涉及到獎勵機制,OpenAI團隊在這個實驗中定義了三個:
 
  系統當前狀態與目標狀態之間的差異;
 
  達成目標時給予獎勵;
 
  每當手中魔方掉落時就受到懲罰。
 
  為了系統測試每次翻轉魔方成功時間,OpenAI還測量了神經網絡在不同擾動下的結果,比如重置網絡的內存、重置力或斷開關節等等。
  而且這種“訓練”以虛擬仿真為主,能夠在受控的環境中平均進行1萬多次試驗。
 
  最初,隨著神經網絡成功實現更多翻轉,成功的時間會不斷縮短,神經網絡學會了適應。
 
  從結果上來看,機械手成功翻轉魔方的時間,會越來越短。
 
  即便添加新干擾、環境有變化,機械手也會調整策略,重新學習后迅速達到最佳基準。
 
  所以這支神奇之手,現在究竟達到啥水平?
 
  最最最難情況下——一方面是需要旋轉26次魔方才能完成,另一方面加入最大外部擾動,機械手成功率20%。
 
  但如果是旋轉15次就能完成魔方復原的“平均情況”,機械手成功率就能穩定在60%。
 
  值得一提的是,這也是人類在該方向上的新嘗試、新紀錄,打開了新前景。
 
  騰訊AI也挑戰過魔方
 
  OpenAI挑戰魔方,倒不是突發奇想。
 
  從去年開始,他們就已經在推進前序工作,當時開發過一個靈巧的機械手系統,叫做Dactyl。
 
  不過那時OpenAI用它“盤”木塊,尺寸比現在的魔方小一些,而且也沒有轉動部件。
  只要告訴機械手目標,不必告訴它具體操作步驟,它就能給你把木塊轉到指定的方向上,而且這套系統也是是在模擬器里訓練出來的強化學習算法。
 
  除了OpenAI,還有來自中國的玩家。
 
  最知名的是騰訊。今年年初,騰訊AI與香港中文大學合作,進行了一項模擬實驗。
  實驗有點類似OpenAI的“軟件”部分:在虛擬環境中,用一只機械手解決魔方問題。
 
  在騰訊其后發表的論文結果里:1400次試驗過程中平均成功率達到了90.3%,而對AI模型再訓練3萬次,成功率會提高到95.2%。
 
  而現在OpenAI更進一步。
 
  在不犧牲準確性和魯棒性的情況下,成功地將模擬實驗轉移到了現實世界的機械手上。
 
  比喻來說,就是騰訊AI在這件事上核心練了口訣和心法,而OpenAI現在把拳腳也練完了,軟硬結合,下一步會更有想象空間。
 
  OpenAI自己也坦承,這只神奇之手,會推動通用機器人。
 
  一開始也介紹過,這項研究結果一發布,就引起網絡熱議。
 
  這樣一只靈活又機智的機械手,首先讓網友紛紛聯想到了終結者。
  有網友說:
 
  它讓我感到鵝妹子嚶/瑟瑟發抖的,是它用一種讓人感覺既熟悉又完全陌生的方式,在執行人類活動。
  不過,比起這些,OpenAI這次的訓練投入,更是每一秒都在讓經費熊熊燃燒。
 
  他們使用了64個V100和920臺32核CPU的主機,并且連續訓練了好幾個月,這樣的訓練成本,就夠讓人瑟瑟發抖的了。
 
  如果有人開心,那也是英偉達老板黃教主。
 
  所以你又怎么看這項酷酷的新進展?
主站蜘蛛池模板: 播音主持培训-中影人教育播音主持学苑「官网」-中国艺考界的贵族学校 | 浇钢砖,流钢砖_厂家价低-淄博恒森耐火材料有限公司 | 电镀标牌_电铸标牌_金属标贴_不锈钢标牌厂家_深圳市宝利丰精密科技有限公司 | ★店家乐|服装销售管理软件|服装店收银系统|内衣店鞋店进销存软件|连锁店管理软件|收银软件手机版|会员管理系统-手机版,云版,App | 钢衬四氟管道_钢衬四氟直管_聚四氟乙烯衬里管件_聚四氟乙烯衬里管道-沧州汇霖管道科技有限公司 | 济南律师,济南法律咨询,山东法律顾问-山东沃德律师事务所 | 粉末包装机,拆包机厂家,价格-上海强牛包装机械设备有限公司 | WTB5光栅尺-JIE WILL磁栅尺-B60数显表-常州中崴机电科技有限公司 | 高光谱相机-近红外高光谱相机厂家-高光谱成像仪-SINESPEC 赛斯拜克 | 干式磁选机_湿式磁选机_粉体除铁器-潍坊国铭矿山设备有限公司 | 诺冠气动元件,诺冠电磁阀,海隆防爆阀,norgren气缸-山东锦隆自动化科技有限公司 | 威客电竞(vk·game)·电子竞技赛事官网 | 电采暖锅炉_超低温空气源热泵_空气源热水器-鑫鲁禹电锅炉空气能热泵厂家 | 小型单室真空包装机,食品单室真空包装机-百科| 精密五金冲压件_深圳五金冲压厂_钣金加工厂_五金模具加工-诚瑞丰科技股份有限公司 | 拉力机-拉力试验机-万能试验机-电子拉力机-拉伸试验机-剥离强度试验机-苏州皖仪实验仪器有限公司 | 活性氧化铝球|氧化铝干燥剂|分子筛干燥剂|氢氧化铝粉-淄博同心材料有限公司 | 铝板冲孔网,不锈钢冲孔网,圆孔冲孔网板,鳄鱼嘴-鱼眼防滑板,盾构走道板-江拓数控冲孔网厂-河北江拓丝网有限公司 | 北京模型公司-工业模型-地产模型-施工模型-北京渝峰时代沙盘模型制作公司 | 东莞动力锂电池保护板_BMS智能软件保护板_锂电池主动均衡保护板-东莞市倡芯电子科技有限公司 | 立式硫化罐-劳保用品硫化罐-厂家直销-山东鑫泰鑫硫化罐厂家 | 天长市晶耀仪表有限公司 | 天津拓展_天津团建_天津趣味运动会_天津活动策划公司-天津华天拓展培训中心 | 波纹补偿器_不锈钢波纹补偿器_巩义市润达管道设备制造有限公司 | 粉丝机械,粉丝烘干机,粉丝生产线-招远市远东粉丝机械有限公司 | 周口市风机厂,周鼓风机,河南省周口市风机厂 | 美名宝起名网-在线宝宝、公司、起名平台 | 西装定制/做厂家/公司_西装订做/制价格/费用-北京圣达信西装 | 德州网站开发定制-小程序开发制作-APP软件开发-「两山开发」 | 进口便携式天平,外校_十万分之一分析天平,奥豪斯工业台秤,V2000防水秤-重庆珂偌德科技有限公司(www.crdkj.com) | 薪动-人力资源公司-灵活用工薪资代发-费用结算-残保金优化-北京秒付科技有限公司 | 破碎机_上海破碎机_破碎机设备_破碎机厂家-上海山卓重工机械有限公司 | 铝板冲孔网,不锈钢冲孔网,圆孔冲孔网板,鳄鱼嘴-鱼眼防滑板,盾构走道板-江拓数控冲孔网厂-河北江拓丝网有限公司 | 上海小程序开发-小程序制作-上海小程序定制开发公司-微信商城小程序-上海咏熠 | 中医治疗皮肤病_潍坊银康医院「山东」重症皮肤病救治平台 | 臻知网大型互动问答社区-你的问题将在这里得到解答!-无锡据风网络科技有限公司 | 【ph计】|在线ph计|工业ph计|ph计厂家|ph计价格|酸度计生产厂家_武汉吉尔德科技有限公司 | 卷筒电缆-拖链电缆-特种柔性扁平电缆定制厂家「上海缆胜」 | 防水套管厂家_刚性防水套管_柔性防水套管_不锈钢防水套管-郑州中泰管道 | 电缆隧道在线监测-智慧配电站房-升压站在线监测-江苏久创电气科技有限公司 | 槽钢冲孔机,槽钢三面冲,带钢冲孔机-山东兴田阳光智能装备股份有限公司 |