天堂呦呦成人AV片国产,精品黄网在线,国产亚洲精品无码,久久99精品色欲国产天美

您現(xiàn)在所在的位置:首頁 >關(guān)于奇酷 > 行業(yè)動態(tài) > OpenAI機械右手玩轉(zhuǎn)魔方!人類也難以做到!

OpenAI機械右手玩轉(zhuǎn)魔方!人類也難以做到!

來源:奇酷教育 發(fā)表于:

OpenAI官方為這只AI機械手玩轉(zhuǎn)魔方!

  OpenAI官方為這只AI機械手激動了:
 
  “機器人的前所未有之境,就算人類也難以做到。”
 
  說的啥新進展?單手玩魔方。
 
  相比之下,人類新手能穩(wěn)穩(wěn)拿住魔方都不容易:
 
  而且不僅玩得轉(zhuǎn)魔方,捆綁Play也不在話下。
 
  沒人告訴它該怎么調(diào)配手指,還需要克服人類強行使的各種絆子,但AI機械手可以隨時調(diào)整不斷學(xué)習(xí),最后最短時間內(nèi)完成魔方翻轉(zhuǎn)。
 
  這就是OpenAI用強化學(xué)習(xí)最新訓(xùn)練出的AI系統(tǒng)。
 
  并且,還是單手操作。
 
  視頻一經(jīng)放出,迅速躥紅推特,攬下6000+點贊,網(wǎng)友驚呼:
 
  AI玩魔方都玩得比我好了!
  這事兒不簡單
 
  且不說量子位這樣的手殘黨,單手恢復(fù)魔方,對于普通人類而言也并不簡單。
 
  不信的話,隨便拿起身邊一個直徑6厘米的塊狀物體,單手轉(zhuǎn)起來。小心拿穩(wěn)了,砸到腳還挺疼的(別問我怎么知道的)。
 
  而對機械手來說,問題就更復(fù)雜了。
 
  機械手遠(yuǎn)沒有人手這樣靈活,抓取力度控制也挑戰(zhàn)不小。
 
  就算是“媲美”人手,能使用的場景或泛化遷移能力,也道阻且長。
 
  比如這位MIT工程師,就吃過大虧:
 
  △生活大爆炸
 
  而更大的挑戰(zhàn),是現(xiàn)實世界中復(fù)雜的物理參數(shù)。
 
  在玩魔方這個任務(wù)當(dāng)中,機械手跟魔方之間的摩擦力、彈性和其他動力學(xué)因素都很難測量,更別說精細(xì)建模了。
 
  并且,在模擬仿真環(huán)境中訓(xùn)練出來的AI,面對復(fù)雜多變的真實物理世界,是否能保持魯棒,也是一個大問題。
 
  比如說帶個橡膠手套,摩擦力就變了:
 
  兩個手指被綁住,難度也會與模擬訓(xùn)練時大大不同:
 
  甚至可能會跑出來一只長頸鹿,試圖叼走魔方:
  如此種種,使得sim2real(從模擬環(huán)境到現(xiàn)實環(huán)境)變得非常困難,僅憑過去的域隨機化(Domain Randomization)算法(見注)已經(jīng)不足以解決。
 
  注:域隨機化(Domain Randomization)由OpenAI提出,能夠創(chuàng)建具有隨機屬性的各種模擬環(huán)境,并訓(xùn)練可在任何環(huán)境中工作的模型。
 
  所以機械手玩轉(zhuǎn)魔方,真真是一次力與美的結(jié)合、靈與器的共舞。
 
  而OpenAI的核心秘訣,在于進一步開發(fā)了一種新的算法,稱為自動域隨機化(ADR)。
 
  當(dāng)然,機械手的構(gòu)造也來頭不小。
 
  先看神奇之手的硬件結(jié)構(gòu)
 
  OpenAI的機械手,裝載一個巨大的支架中。
 
  在這個支架里,包含一個PhaseSpace運動捕捉系統(tǒng)、一個RGB相機。機械手的每個指尖上都有一個LED燈,系統(tǒng)就是通過這一組燈來捕捉機械手的動作。
  操縱魔方的機器人手來自影子機器人公司(Shadow Robot Company),基于旗下 Dextrous E系列機械手打造。
 
  這原本是一家想做雙足機器人的公司,因為發(fā)現(xiàn)自己的水平遠(yuǎn)不及本田已經(jīng)造出的機器人,于是棄腳從手,轉(zhuǎn)而去開發(fā)機械手,并造出了世界上第一臺擬真機械手。
  △ 影子機器人公司開發(fā)的機器人
 
  具體結(jié)構(gòu)上,Dextrous有20個可驅(qū)動的關(guān)節(jié):中指和無名指各有3個驅(qū)動關(guān)節(jié)和1個非驅(qū)動關(guān)節(jié),小指和拇指有5個驅(qū)動關(guān)節(jié),以及一個有2個驅(qū)動關(guān)節(jié)的腕部。
 
  為了“玩轉(zhuǎn)魔方”,OpenAI和影子機器人公司,還合作提高了機器手組件的堅固性和可靠性。增加了手的握力,并減小了肌腱應(yīng)力,并且調(diào)整了關(guān)節(jié)之間的交聯(lián),最大程度地減小了扭矩的限制。
  與人類“十指連心”類似,他們除了在機械手上安裝了位置和力傳感器,還在指尖上安裝了超靈敏的觸摸傳感器,以達(dá)到接近人手的效果。
 
  實驗中用到的魔方也不是普通的魔方。
 
  不少米粉或許也會覺得眼熟,它是小米的計客超級魔方(GiiKER cube),內(nèi)部有可感應(yīng)方向的藍(lán)牙與運動傳感器。
 
  計客超級魔方具有90度的面角分辨率,但OpenAI團隊對其進行了修改,將精度提高到了大約5度。
  再看軟件算法功力:從模擬到現(xiàn)實
 
  雖然我們看到擰魔方是在實際的機械手上發(fā)生的,但實際上這一過程主要發(fā)生在模擬軟件中,然后將AI從模擬中學(xué)習(xí)到的東西轉(zhuǎn)移到了現(xiàn)實世界中。
 
  OpenAI在機械手上用到了兩大法寶:
 
  一個是曾經(jīng)打敗Dota 2世界冠軍團隊的AI系統(tǒng)OpenAI Five;
  另一個是自動域隨機化(ADR,Automatic Domain Randomization)。
 
  ADR會不斷在仿真中生成越來越困難的環(huán)境,使系統(tǒng)擺脫精確模型對現(xiàn)實的束縛,從而使模擬環(huán)境中的神經(jīng)網(wǎng)絡(luò)能夠遷移到真實世界。
 
  這里提到的環(huán)境中的隨機化是什么呢?
 
  其中包括模擬器考慮到的物理特性(如幾何形狀、摩擦和重力),以及模擬器未能考慮到的一些物理效應(yīng)。
 
  比如魔方的大小,就是隨機化參數(shù)之一。
  △ADR在魔方大小上的應(yīng)用
 
  此外,還有照明條件之類的視覺元素、相機位置和角度、物體的材料和外觀、背景紋理甚至是渲染圖像的后處理效果。
 
  研究人員表示,這項研究的重要意義在于:一旦弄清楚如何在仿真中訓(xùn)練這些模型,就可以有效地獲取無窮數(shù)據(jù),然后將模型遷移到機器人上,在現(xiàn)實世界中利用它們。
 
  既然是用強化學(xué)習(xí),必然會涉及到獎勵機制,OpenAI團隊在這個實驗中定義了三個:
 
  系統(tǒng)當(dāng)前狀態(tài)與目標(biāo)狀態(tài)之間的差異;
 
  達(dá)成目標(biāo)時給予獎勵;
 
  每當(dāng)手中魔方掉落時就受到懲罰。
 
  為了系統(tǒng)測試每次翻轉(zhuǎn)魔方成功時間,OpenAI還測量了神經(jīng)網(wǎng)絡(luò)在不同擾動下的結(jié)果,比如重置網(wǎng)絡(luò)的內(nèi)存、重置力或斷開關(guān)節(jié)等等。
  而且這種“訓(xùn)練”以虛擬仿真為主,能夠在受控的環(huán)境中平均進行1萬多次試驗。
 
  最初,隨著神經(jīng)網(wǎng)絡(luò)成功實現(xiàn)更多翻轉(zhuǎn),成功的時間會不斷縮短,神經(jīng)網(wǎng)絡(luò)學(xué)會了適應(yīng)。
 
  從結(jié)果上來看,機械手成功翻轉(zhuǎn)魔方的時間,會越來越短。
 
  即便添加新干擾、環(huán)境有變化,機械手也會調(diào)整策略,重新學(xué)習(xí)后迅速達(dá)到最佳基準(zhǔn)。
 
  所以這支神奇之手,現(xiàn)在究竟達(dá)到啥水平?
 
  最最最難情況下——一方面是需要旋轉(zhuǎn)26次魔方才能完成,另一方面加入最大外部擾動,機械手成功率20%。
 
  但如果是旋轉(zhuǎn)15次就能完成魔方復(fù)原的“平均情況”,機械手成功率就能穩(wěn)定在60%。
 
  值得一提的是,這也是人類在該方向上的新嘗試、新紀(jì)錄,打開了新前景。
 
  騰訊AI也挑戰(zhàn)過魔方
 
  OpenAI挑戰(zhàn)魔方,倒不是突發(fā)奇想。
 
  從去年開始,他們就已經(jīng)在推進前序工作,當(dāng)時開發(fā)過一個靈巧的機械手系統(tǒng),叫做Dactyl。
 
  不過那時OpenAI用它“盤”木塊,尺寸比現(xiàn)在的魔方小一些,而且也沒有轉(zhuǎn)動部件。
  只要告訴機械手目標(biāo),不必告訴它具體操作步驟,它就能給你把木塊轉(zhuǎn)到指定的方向上,而且這套系統(tǒng)也是是在模擬器里訓(xùn)練出來的強化學(xué)習(xí)算法。
 
  除了OpenAI,還有來自中國的玩家。
 
  最知名的是騰訊。今年年初,騰訊AI與香港中文大學(xué)合作,進行了一項模擬實驗。
  實驗有點類似OpenAI的“軟件”部分:在虛擬環(huán)境中,用一只機械手解決魔方問題。
 
  在騰訊其后發(fā)表的論文結(jié)果里:1400次試驗過程中平均成功率達(dá)到了90.3%,而對AI模型再訓(xùn)練3萬次,成功率會提高到95.2%。
 
  而現(xiàn)在OpenAI更進一步。
 
  在不犧牲準(zhǔn)確性和魯棒性的情況下,成功地將模擬實驗轉(zhuǎn)移到了現(xiàn)實世界的機械手上。
 
  比喻來說,就是騰訊AI在這件事上核心練了口訣和心法,而OpenAI現(xiàn)在把拳腳也練完了,軟硬結(jié)合,下一步會更有想象空間。
 
  OpenAI自己也坦承,這只神奇之手,會推動通用機器人。
 
  一開始也介紹過,這項研究結(jié)果一發(fā)布,就引起網(wǎng)絡(luò)熱議。
 
  這樣一只靈活又機智的機械手,首先讓網(wǎng)友紛紛聯(lián)想到了終結(jié)者。
  有網(wǎng)友說:
 
  它讓我感到鵝妹子嚶/瑟瑟發(fā)抖的,是它用一種讓人感覺既熟悉又完全陌生的方式,在執(zhí)行人類活動。
  不過,比起這些,OpenAI這次的訓(xùn)練投入,更是每一秒都在讓經(jīng)費熊熊燃燒。
 
  他們使用了64個V100和920臺32核CPU的主機,并且連續(xù)訓(xùn)練了好幾個月,這樣的訓(xùn)練成本,就夠讓人瑟瑟發(fā)抖的了。
 
  如果有人開心,那也是英偉達(dá)老板黃教主。
 
  所以你又怎么看這項酷酷的新進展?