讀心與芯:我們與機(jī)器人的無(wú)限未來(lái)04機(jī)器人學(xué)習(xí)

1. 觸覺(jué)中的大腦
1.1. 自主或靈巧操作
- 1.1.1. 機(jī)器人必須能安全有效地與世界中的人和物玩耍、工作,只有這樣,它才可以走出工廠的牢籠,發(fā)揮其潛力
1.2. 從工程學(xué)和編程的角度看,建造飛往火星的機(jī)器人比建造可以清理餐桌的機(jī)器人容易
-
1.2.1. 自動(dòng)駕駛汽車或在火星上空巡航的機(jī)器人運(yùn)行于自由空間,不與物理世界中的物體或生物互動(dòng),其目標(biāo)恰恰是避免互動(dòng)
-
1.2.2. 制造能移動(dòng)且避免與其他物體或生物接觸的機(jī)器人是我們的強(qiáng)項(xiàng)
1.3. 制造主動(dòng)與物理世界接觸的機(jī)器人卻是另一類問(wèn)題
1.4. 食譜是用人類能理解的語(yǔ)言(比如英語(yǔ))寫(xiě)的,機(jī)器人不能很好地理解自然語(yǔ)言
-
1.4.1. 機(jī)器智能可以閱讀文本,并根據(jù)之前訓(xùn)練過(guò)的許多文本預(yù)測(cè)接下來(lái)應(yīng)該出現(xiàn)的單詞或短語(yǔ)
-
1.4.2. 還可以將英語(yǔ)翻譯成法語(yǔ),準(zhǔn)確性非常高,但無(wú)法理解詞的真正含義
-
1.4.3. 機(jī)器人必須先將人類的食譜轉(zhuǎn)換成它可以理解的食譜,也就是說(shuō),食譜上的每個(gè)動(dòng)作都必須轉(zhuǎn)換為機(jī)器人可以實(shí)際執(zhí)行的一個(gè)或一系列動(dòng)作
-
1.4.4. 烘焙機(jī)器人必須制訂計(jì)劃
1.5. 設(shè)計(jì)機(jī)械手以及引導(dǎo)它的算法需要對(duì)所涉及的力有深入的了解
1.6. Rocycle在無(wú)法確定物體是紙還是塑料時(shí),會(huì)輕輕擠壓物體,根據(jù)變形程度做出判斷
-
1.6.1. 塑料比紙稍硬,對(duì)手指的后推力較大
-
1.6.2. 敏感的機(jī)械手讓整個(gè)機(jī)器人變得更智能
1.7. 在開(kāi)發(fā)機(jī)械手和引導(dǎo)它們的大腦方面還有許多工作要做,但如今我們建造的機(jī)器人能做的遠(yuǎn)不只是切蛋糕
-
1.7.1. 在各個(gè)生活層面可執(zhí)行的任務(wù)將包羅萬(wàn)象
-
1.7.2. 在醫(yī)院、敬老院和兒童護(hù)理機(jī)構(gòu)中,它們可以成為更得力的助手
-
1.7.3. 在工廠和倉(cāng)庫(kù),它們可以做更多艱苦的工作
-
1.7.4. 在不利于人類的環(huán)境中,它們可以承擔(dān)更危險(xiǎn)的任務(wù)
-
1.7.5. 還可以幫助我們探索深海和外太空中的一切
1.8. 如果真心希望機(jī)器人發(fā)揮潛力(無(wú)論是操縱世界上的物體,還是在世界中移動(dòng))?,就必須讓它們具備學(xué)習(xí)能力
2. 機(jī)器人的學(xué)習(xí)
2.1. 如果想讓機(jī)器人具備這種功能,工程學(xué)或編程的解決方案遠(yuǎn)遠(yuǎn)不夠—機(jī)器人要能挖掘數(shù)據(jù),研究過(guò)去的經(jīng)驗(yàn)(包括自己的經(jīng)驗(yàn)和其他機(jī)器人的經(jīng)驗(yàn))?,了解過(guò)去發(fā)生了什么、將來(lái)可能會(huì)發(fā)生什么、下一步該做什么以及如何做
- 2.1.1. 它們要能學(xué)習(xí),并與其他機(jī)器人分享學(xué)到的知識(shí)
2.2. 學(xué)習(xí)簡(jiǎn)化了較高層次的推理和規(guī)劃過(guò)程,因而機(jī)器人能以我們期望的速度運(yùn)行
2.3. 我們?cè)诓煌某橄髮用孀隽撕芏嘤?jì)劃,但也從過(guò)去的經(jīng)驗(yàn)和可用數(shù)據(jù)中學(xué)習(xí),能夠更快、更高效、更熟練地執(zhí)行計(jì)劃和行動(dòng)
2.4. 獎(jiǎng)勵(lì)是學(xué)習(xí)的重要組成部分,我們對(duì)機(jī)器人也實(shí)施獎(jiǎng)勵(lì)
2.5. 試錯(cuò)法被稱為強(qiáng)化學(xué)習(xí),可應(yīng)用于機(jī)器人的諸多任務(wù)與技能學(xué)習(xí)
-
2.5.1. 強(qiáng)化學(xué)習(xí)非常有效,但必須進(jìn)行多次迭代,因而計(jì)算成本很高—包括計(jì)算機(jī)的運(yùn)作成本、與運(yùn)行學(xué)習(xí)程序相關(guān)的電力成本,以及強(qiáng)化學(xué)習(xí)所需的資金成本
-
2.5.2. 強(qiáng)化學(xué)習(xí)的可預(yù)測(cè)性較低
-
2.5.3. 模擬產(chǎn)生了有效或看似有效的算法或系統(tǒng),但你已經(jīng)讓系統(tǒng)自學(xué)了,沒(méi)有進(jìn)行操作編程,也沒(méi)有告訴機(jī)器人怎樣按你的設(shè)想去做,所以你不了解機(jī)器人行動(dòng)的理由,因而很難證明系統(tǒng)會(huì)永遠(yuǎn)有效,或者在不可預(yù)見(jiàn)的情況下會(huì)怎么做
-
2.5.3.1. 如果系統(tǒng)出了問(wèn)題,你也很難解釋其原因
2.6. 教機(jī)器人在現(xiàn)實(shí)世界中學(xué)習(xí)有其優(yōu)勢(shì),但即使它可以獨(dú)立學(xué)習(xí),并在我們睡覺(jué)時(shí)徹夜實(shí)驗(yàn),其進(jìn)度仍然較慢
2.7. 模擬學(xué)習(xí)的速度極快
- 2.7.1. 虛擬獵豹通過(guò)自學(xué)學(xué)會(huì)了奔跑
2.8. 通過(guò)編程,將基本的自然法則和物理定律納入虛擬世界
- 2.8.1. 模擬試驗(yàn)還訓(xùn)練了機(jī)器人處理突發(fā)事件的能力
2.9. 強(qiáng)化學(xué)習(xí)開(kāi)啟了令人難以置信的可能性
-
2.9.1. OpenAI的機(jī)械手將試錯(cuò)與推理相結(jié)合,解開(kāi)了魔方
-
2.9.2. 系統(tǒng)學(xué)會(huì)了如何控制手指中的電機(jī)和手的方向,從而改變單個(gè)方塊的配置,在魔方不掉落的情況下解開(kāi)它
2.10. 谷歌旗下的自動(dòng)駕駛汽車Waymo背后的技術(shù)在現(xiàn)實(shí)世界中行駛了超過(guò)2000萬(wàn)英里,但大多數(shù)研究人員沒(méi)有資源運(yùn)作如此大規(guī)模的項(xiàng)目
2.11. 機(jī)器學(xué)習(xí)的成功可追溯到20世紀(jì)70年代人們對(duì)計(jì)算機(jī)視覺(jué)的早期探索
- 2.11.1. 李飛飛及其學(xué)生開(kāi)始編譯ImageNet,這是一個(gè)龐大的數(shù)據(jù)集,算法分割了其中每張圖片中的所有對(duì)象
2.12. 機(jī)器的學(xué)習(xí)方式也與人類不同
-
2.12.1. 機(jī)器學(xué)習(xí)技術(shù)是通過(guò)被稱為“人工神經(jīng)元”的計(jì)算單元構(gòu)建的
-
2.12.2. 機(jī)器學(xué)習(xí)系統(tǒng)貫穿多個(gè)相互關(guān)聯(lián)的處理層,具體取決于數(shù)據(jù)類型,比如圖像、文本、視頻序列、傳感器數(shù)據(jù)流等
2.13. 像素改變是對(duì)抗性攻擊的一個(gè)例子
-
2.13.1. 針對(duì)停車標(biāo)志圖像的對(duì)抗性攻擊,它突顯了此類系統(tǒng)中存在的一個(gè)關(guān)鍵缺陷
-
2.13.2. 對(duì)圖像進(jìn)行精確的調(diào)整,這些變化足以欺騙機(jī)器學(xué)習(xí)系統(tǒng),讓它以為自己看到的是讓行標(biāo)志
-
2.13.3. 在人類眼中,它仍然很像停車標(biāo)志
-
2.13.4. 受到擾動(dòng)的圖像與原始圖像之間的差異小到難以察覺(jué),但對(duì)抗性攻擊帶來(lái)的細(xì)微變化卻讓機(jī)器學(xué)習(xí)引擎產(chǎn)生誤差
-
2.13.4.1. 一個(gè)重大缺陷
-
2.13.5. 攻擊嚴(yán)重?fù)p害了自動(dòng)駕駛汽車的判斷力,我們不希望它如此脆弱
-
2.13.6. 機(jī)器人分不清狗和鴕鳥(niǎo)可能會(huì)讓人覺(jué)得有趣,如果機(jī)器人想帶著鴕鳥(niǎo)散步就更可笑了,但將停車標(biāo)志看成讓行標(biāo)志可能會(huì)導(dǎo)致嚴(yán)重的交通事故
2.14. 機(jī)器學(xué)習(xí)的缺點(diǎn)是脆弱、規(guī)模龐大、計(jì)算量大、缺乏可解釋性、存在偏見(jiàn)
3. 液態(tài)網(wǎng)絡(luò)
3.1. 秀麗隱桿線蟲(chóng)
-
3.1.1. 一種緊湊的、可解釋的新模型,我們稱之為“液態(tài)網(wǎng)絡(luò)”(liquid networks)
-
3.1.2. 這302個(gè)神經(jīng)元中的每一個(gè)都做著相當(dāng)復(fù)雜的數(shù)學(xué)工作,有效地計(jì)算微分方程
3.2. 一種緊湊的、可解釋的新模型,我們稱之為“液態(tài)網(wǎng)絡(luò)”(liquid networks)
3.3. 人工大腦中的神經(jīng)元更少,但每個(gè)神經(jīng)元的作用更大
3.4. 液態(tài)網(wǎng)絡(luò)不需要讓人工神經(jīng)元進(jìn)行較高級(jí)的計(jì)算,而且網(wǎng)絡(luò)的規(guī)模和計(jì)算需求要小得多
3.5. 意味著它們專注于指定任務(wù)中的重要事情,而不是任務(wù)的背景
- 3.5.1. 液態(tài)網(wǎng)絡(luò)具有這種能力,但今天的機(jī)器人大腦是基于深度神經(jīng)網(wǎng)絡(luò)模型構(gòu)建的,不一定以這種方式運(yùn)行
3.6. 液態(tài)網(wǎng)絡(luò)的神經(jīng)元僅有19個(gè),而用于比較的深度神經(jīng)網(wǎng)絡(luò)有超過(guò)10萬(wàn)個(gè)神經(jīng)元,但前者的人工大腦能通過(guò)觀察人類開(kāi)車來(lái)學(xué)習(xí)如何駕駛
-
3.6.1. 液態(tài)網(wǎng)絡(luò)通過(guò)自學(xué),學(xué)會(huì)了如何將轉(zhuǎn)向控制與道路曲率相關(guān)聯(lián),以及如何避開(kāi)障礙物
-
3.6.2. 液態(tài)網(wǎng)絡(luò)在操縱轉(zhuǎn)向時(shí),注意力集中在地平線和道路兩側(cè)
-
3.6.3. 深度學(xué)習(xí)模型的注意力沒(méi)那么集中,機(jī)器人觀察樹(shù)木、灌木叢、天空和道路,表現(xiàn)得更像一個(gè)心不在焉的司機(jī)
3.7. 優(yōu)點(diǎn):我們可以查明其行為的原因
- 3.7.1. 只有19個(gè)神經(jīng)元,我們可以提取決策樹(shù),以人類可理解的形式解釋網(wǎng)絡(luò)如何做出選擇,并揭示每個(gè)神經(jīng)元在不同行為類型中的作用
浙公網(wǎng)安備 33010602011771號(hào)