為了讓 AI 不斷打怪升級,DeepMind 打造「宇宙」
作者 雷鋒網 | 發布日期 2021 年 07 月 30 日 8:15 |
DeepMind 又給我們小驚喜。我們都知道,強化學習苦於類化能力差,經常只能針對單個任務從頭學習。
DeepMind之前開發的AlphaZero,儘管可以玩圍棋、西洋棋和日本將棋,但每種棋牌遊戲都只能從頭訓練。類化能力差也是AI一直被詬病為人工智障的一大原因。人類智慧的厲害之處,就在藉鑑之前經驗迅速適應新環境。
但類化能力不是一蹴而就,就像玩遊戲,也是先做簡單任務,逐步升級到複雜任務。《空洞騎士》(Hollow Knight)一開始只需要隨意走動揮刀砍怪,但噩夢級難度的「苦痛之路」關,沒有前面累積的技巧,只能玩寂寞。
多任務宇宙
DeepMind此次採用「課程學習」,讓智慧體於不斷擴展升級的開放世界學習。也就是說,AI新任務(訓練資料)是基於舊任務不斷生成。智慧體可盡情鍛鍊自己,簡單的如「靠近紫色立方體」,複雜點的如「靠近紫色立方體或將黃色球體放在紅色地板」,甚至和其他智慧體玩耍,如捉迷藏──「找到對方,且不要被對方發現」。
每個小遊戲存在世界小角落,千千萬萬個小角落拼成龐大的物理模擬世界,如下圖的幾何「地球」。總體來說這個世界的任務由三個要素構成,即任務=遊戲+世界+玩家,並根據三要素關係,決定任務的複雜度。
複雜度的判斷有四個維度:競爭性、平衡性、可選項、探索難度。
比如「搶方塊」遊戲,藍色智慧體需要把黃色方塊放到白色區域,紅色智慧體需要把黃色方塊放到藍色區域。這兩個目標矛盾,因此競爭性較強;同時雙方條件對等,平衡性比較高;因目標簡單,所以可選項少;DeepMind把探索難度評為中上,可能是因定位區域算較複雜的場景。
再如「球球喜歡和方塊一起玩」遊戲,藍色和紅色智慧體有共同目標,讓相同顏色的球體和方塊放在相近位置。
這時競爭性自然很低,平衡性毋庸置疑很高的;可選項比上面遊戲高很多;探索難度沒有定位區域,智慧體隨便把球體和方塊放哪都行,難度就變小了。
基於這四個維度,DeepMind打造超大規模「宇宙」任務空間,幾何「地球」也只是這宇宙的小角落,是四維任務空間的一點。DeepMind將「宇宙」命名為XLand,包含數十億個任務。
來看XLand的全貌,由一系列遊戲組成,每個遊戲在許多模擬世界進行,這些世界的拓樸和特徵平滑變化。
終生學習
數據有了,接下來得找到合適的算法。 DeepMind發現,目標注意代理(GOAT)可學習更通用的策略。
具體來說,智慧體輸入包括第一視角的RGB圖像、本體感覺以及目標。經過初步處理後,生成中間輸出,傳遞給GOAT模組,會根據智慧體目前目標處理中間輸出的特定部分,邏輯分析目標。
邏輯分析是指,每個遊戲可藉由一些方法,構建另一個遊戲,並限制策略的價值函數的最優值上限或下限。
DeepMind提出一個問題:對每個智慧體,什麼樣的任務是最好的?換句話說,打怪升級時,什麼樣的關卡設置才讓玩家順利升級為「真」高手,而不是一刀9999?
DeepMind的答案是,每個新任務都基於舊任務生成,「不會太難,也不會太容易」。其實恰好是讓人類學習時感覺「爽」的興奮點。
訓練開始時,太難或太容易的任務可能會鼓勵早期學習,但會導致訓練後期的學習飽和或停滯。不要求智慧體某任務非常優秀,而是鼓勵終身學習,即不斷適應新任務。所謂太難、太容易是較模糊的描述。需要量化方法,在新任務和舊任務之間彈性連接。
怎麼不讓智慧體做新任務時不適應而「暴死」?進化學習就提供很好的靈活性。總體來說,新任務和舊任務同時進行,且每個任務有多智慧體參與「競爭」。舊任務適應好的智慧體,會選拔到新任務繼續學習。
新任務中,舊任務的優秀智慧體權重、瞬間任務分佈、超參數都會複製,參與新一輪「競爭」。除了舊任務的優秀智慧體,還有很多新人參與,這就引進隨機性、創新性、靈活性,不用擔心「暴死」問題。
當然,因任務不斷生成、動態變化,一個任務可訓練不同長處的智慧體,並往不同方向演化(隨著智慧體相對性能和強健性進行)。最終每個智慧體都會形成擅長任務的集合,就像春秋戰國時期「百家爭鳴」。說打怪升級顯得格局小,簡直是模擬地球。
DeepMind表示,「這種組合學習系統的特性是,不最佳化有界性能指標,而是更新定義的通用能力範圍,這使智慧體開放式學習,僅受環境空間和智慧體的神經網路表達能力的限制。」
智慧初現
最終這複雜「宇宙」升級、進化、分流的智慧體長成了什麼優秀物種?DeepMind說,智慧體有很明顯的零樣本學習能力,比如使用工具、合圍、數數、合作+競爭等。
來看具體例子。首先智慧體學會臨機應變。目標有三個:
黑色金字塔放到黃色球體旁邊
紫色球體放到黃色金字塔旁邊
黑色金字塔放到橙色地板
AI一開始找到一個黑色金字塔,想拿到橙色地板(目標3),但搬運過程瞄見黃色球體,瞬間改變主意,「我可以實現目標1啦」,將黑色金字塔放到黃色球體旁邊。
第二個例子是,不會跳高,怎麼拿到高台上的紫色金字塔?智慧體需要想辦法突破障礙,取得高台上的紫色金字塔,高台周邊並沒有類似階梯、斜坡的路。
因不會跳高,所以智慧體「掀桌子」,把周邊幾塊豎起來的板子弄倒。然後一塊黑色石板剛好倒在高台邊,「等等,這不就是我要的階梯嗎?」這過程是否體現了慧體的智慧,還無法肯定,可能只是一時幸運。關鍵還是,要看統計數據。
經過5代訓練,智慧體在XLand的4千個獨立世界玩了約70萬個獨立遊戲,涉及340萬個獨立任務,最後一代每個智慧體都經歷2千億次訓練步驟。智慧體已能順利參與幾乎每個評估任務,除了少數即使人類也無法完成的任務。
DeepMind的研究,或許一定程度體現「密集學習」重要性。也就是說,不僅資料量要大,任務量也要大。這也使得智慧體在類化能力有很好表現,如資料顯示,只需對一些新複雜任務進行30分鐘集中訓練,智慧體就可快速適應,而從頭開始用強化學習訓練的智慧體根本無法學習這些任務。
往後我們也期待這「宇宙」更複雜和生機勃勃,AI經過不斷演化,不斷給我們帶來驚喜(細思極恐)的體驗。
資料來源:https://technews.tw/2021/07/30/deepmind_xland/
獨立樣本定義 在 Rti 中央廣播電臺 Facebook 的精選貼文
【眼看中國都能上月球採樣本 歐盟很不甘心啊!】
歐盟🇪🇺12日舉辦歐盟太空會議,會議聚焦在希望歐洲發展一個充滿活力和獨立的私營太空部門。歐盟內部市場與服務執委布萊頓表示,在接下來的幾個月裡,他將召集所有參與者發起一個歐洲發射器聯盟,以便能夠共同定義下一代發射器和相關技術的共同路線圖,以確保歐盟自主進入太空。🚀🚀🚀
他強調,歐盟將推行更積極的太空戰略,以防止遭到美國和中國的發射器技術排擠出去。💪💪💪
#太空聯盟
#太空戰略
#歐盟
📌歡迎加入央廣Rti官方TG帳號📌
https://t.me/RadioTaiwan
📌Google新聞也可追蹤央廣Rti📌
https://reurl.cc/LdGL5L
獨立樣本定義 在 黃偉民粉絲交流俱樂部 Facebook 的最佳貼文
20200915 黃偉民易經講堂
時代在變,但價值是永恆不變的。
智慧的人,歸納了變化的規律,就成為知識了。
香港人沒有不接受時代變化,我們傷感的,是價值的剝落淪喪。
林鄭帶頭否定專業。
她膜拜那批大陸來,穿著紙底褲,沒有註冊的,幫大眾採樣本的國內人員;但輕蔑的說香港,「那些所謂醫生、專家,反中央,抹黑中央和香港的關係。」
有特首擔大旗,其他政府部門都覺得專業人士很麻煩。
操弄股價,舞高弄低,然後從中取利,全世界的大鱷就是如此運作。以往要由證監會立案調查,牽涉複雜的技術和舉證,動輒調查四、五年。
現在簡單得多了,由警隊的毒品調查課,當洗黑錢處理,一個月時間,拉人封艇。什麼紐倫港,國際金融中心的招牌不要了。
是否只為買賣282壹傳媒的股票而特事特辦?那位被問到口啞啞的總警司也不知道吧!
總之,遠離毒品……和壹傳媒,你才安全!
唔尊重醫護專業,又唔尊重金融專業,連巴士司機專業也不尊重。
巴士途經旺角,響號嚇驚警察,又有手掌大調較後鏡的士巴拿,又超速——原來巴士有紀錄儀,得35公里車速以下……都唔知拉他告什麼好?終於諗到,告他當時單手揸車,不小心駕駛吧!
十二名港人逃離香港,企圖去台灣,在公海被大陸截停,目前被拘留,林鄭政府竟然可以不聞不問,聽其自生自滅,連美國國務卿蓬佩奧都看不過眼,說林鄭沒有履行特首要保護香港市民的承諾。
這是傷逝。
對曾經擁有過的美好,專業的一切消失而難過。
《周易》第二十三卦,剝卦,山地剝。
上卦艮為山,下卦坤為地。高山逐漸剝落的形象。
地勢因剝落的沙石而漸升高,終於將山頂埋沒。山崩土解。
剝卦卦象是一支陽爻在最上,下面五支都是陰爻,整個卦被淘空了。
剝卦之後,便是地雷復,復卦,五支陰爻下一支陽爻又出現了,新的生機又再來臨。
地上一棵小幼苗出現,得到陽光水份養料,會逐漸長大,枝葉繁盛。然後開花結果,果實在樹上成熟腐爛,掉下樹腳,化作春泥,但果實內的核,又是種子,入土後,又成樹苗,再作一次成長,開化結果。
這就是宇宙的規律。
所以,乾卦,代表宇宙運行的天下第一卦,卦辭就是四個字:
元、亨、利、貞。
元,善之長也。
亨,嘉之會也。
利,義之和也。
貞,事之幹也。
一切的開始,像樹苗一樣。有了因,就要看客觀的條件,緣。有了這個緣,因緣和合,開花結果,果實留下了種子,再等待另一次因緣。
所以《周易》說,貞下啟元。
卦序也是「剝極而復」,剝卦之後,復卦便來了。
《說文解字》:
剝,裂也。
從刀,從彔。
彔,刻割也。
剝字右邊是一把刀,左邊也是刻割,可見傷害很重。
從卦象睇,一陽之下五個陰,可見資源掏空,元氣喪盡,情勢岌岌可危。
剝卦之後是復卦,五陰在上,一陽在最底,培元固本的幼苗出現了。
復的左邊偏旁是「行」,一步步的走,重視基礎,腳踏實地,一步一腳印,幼苗長大,又再一次的開花結果。
剝卦二十三卦,復卦二十四卦,它是生命的核心創造根源,生命的內在主宰。亦即天地之心,彰顯人的創造價值。
這就是這幾年,香港人說的初心。
天地萬物,即便受到剝卦般的浩劫摧毀,還有重建再生的智慧和毅力,讓被剝的生命得以延續發展。
《繫辭》說:
生生之謂易。
它說,《易經》的定義,就是生生。生生就是易,生生不息,生完再生。
復卦,就是再生,靠人的智慧和創造力,讓剝落殆盡之後,再繼續下去。只要有「復」的核心創造力,又可以再來一次。人類由於有復的能力,所以,自己可以再造乾坤。這個能力,就叫「生生」。
香港在剝落,但不要怕。
因為剝,才能激發復的能量。佛教行人,修行究竟,就是探討生命的核心價值。用剝的手段,把世間假象剝除,顯現真相。
五支陰爻空掉,色受想行識,皆是虛妄,五蘊皆空,核心真相便自然呈現。剝盡復來,了悟貪嗔癡慢疑,便能度過一切苦厄。
所以,我們可以將今日香港的剝落,看成是空五蘊,探真心。
這個心,就是復卦說的天地之心。
《金剛經》說:
一切有為法,如夢幻泡影。
這也就是剝卦的過程吧。
《序卦傳》說:
賁者,飾也。致飾,然後亨則盡矣,故受之以剝。剝者,剝也。物不可以終盡,剝窮上反下,故受之以復。
復則不妄矣,故受之以無妄。
賁卦,是一種文飾,裝飾美化,也是泡沫。有外在的繁華,吸引,但如果只具形式,沒有扎實的本質,一定不能長久。
泡沫之後,接下來更是剝。
致飾,然後亨則盡矣。致飾即過度包裝,超過實際內涵,即使一時亨通,則盡了,亦會開始剝落。但《易經》的原則,物不可以終盡,宇宙規律是圓形的,生生不息的,即使剝盡浩劫,上面窮了,改府高官,都不堪用了,還有民眾,是生機勃發的。
在剝的時候,外表看似完蛋了,就逼著往下,往內心探尋。
生命內在是充滿力量的,那就是復的生機,所以,當前面無路時,就回頭深刻內省,尋找初心,本來面目。
不必擔心窮上,只要能反下,外面已窮盡,就返回內心,挖掘本來已有的潛在資源。
故受之以復,所以,剝卦雖然艱難,但藉著上面的窮,逼得我們返內做更新的創造。
復,是剝逼出來的。
復則不妄矣。一旦由復卦找回創造力,就沒有虛妄了。所以,復卦之後就是無妄卦。
也是六祖慧能說的:
自性生萬法。
近日,香港爭相改寫《木蘭辭》,這的確是一篇伴著我們這一代成長的名篇,人人都懂背誦。
我最愛它結尾的四句,生動也描繪了雌雄動物發情時的神態分別,是詩人神來之筆。
另一篇香港人耳熟能詳的,是蘇東坡的《赤壁賦》,也是中學課文,人人能念,文字書法都極優美的偉大作品。它借境言情,看著流水與明月,訴說人間的變與不變。
正值香港的剝落變化,這樣讀一次《赤壁賦》,看能否舒解我們的胸臆!
壬戌之秋,七月既望。蘇子與客泛舟,遊於赤壁之下。清風徐來,水波不興。舉酒屬客,誦明月之詩,歌窈窕之章。少焉,月出於東山之上,徘徊於斗牛之間。白露橫江,水光接天。縱一葦之所如,凌萬頃之茫然。浩浩乎如憑虛御風,而不知其所止;飄飄乎如遺世獨立,羽化而登仙。
蘇東坡因為「烏臺詩案」,在宋神宗元豐二年,被貶黃州。元豐五年,他遊赤壁,雖然不是真正的古戰場赤壁,但這次遊覽,前後寫下了兩篇《赤壁賦》,震驚千古。
壬戌是年份,像今年是庚子年。中國以干支紀時,但很多人仍對天干地支有恐懼感。其實,稍稍接觸近代史,甲午戰爭、戊戌維新,辛亥革命……事件沿路走來,就是干支紀時。兩甲子前,120年前的庚子拳變,義和團要扶清滅洋,殺外國傳教士和領事,導致八國聯軍,攻陷北京,慈禧出走,翌年就有辛丑賠款。也是說,今年庚子,明年就是辛丑牛年了。
東坡在這年秋天,七月既望,即七月中左右,今天是七月廿八,是這段日子吧。和客泛舟遊湖,遊的是黃州赤鼻磯,不是當年赤壁古戰場。但看來蘇東坡是有意借景舒情,不是以確切地理來追尋史跡。
一開始他就借水和月來引伸世間的變與不變。
湖水不斷流逝,明月往復圓缺。表面是不斷的變,但水的流逝,月的虛盈,又沒有增損水月的本質,看似變的,其實細看又沒有變。
這時,誦起《詩經》的「月出」篇章。這詩內容借月亮說思念,思念什麼呢?往後才交待。
這裡先帶出月亮。
月出於東山之上,徘徊於斗牛之間。《詩經》中古人見月而思念,東坡誦讀時,明月又「徘徊」登場。
為什麼「徘徊」?是天上明月,也是東坡的人生。人看景物,都是主觀感受出發,東坡看月,也似自己徘徊。
具體的寫景是「白露橫江,水光接天」轉折入寫情,「縱一葦之所如,凌萬頃之茫然」。
一葦,是他的小舟,對比江水的萬頃遼闊的空間。
在這環境下,帶出了羽化登仙的追求。
於是飲酒樂甚,扣舷而歌之。歌曰:桂棹兮蘭槳,擊空明兮泝流光。渺渺兮予懷,望美人兮天一方。客有吹洞簫者,倚歌而和之,其聲嗚嗚然,如怨如慕,如泣如訴。餘音嫋嫋,不絕如縷。舞幽壑之潛蛟,泣孤舟之嫠婦。
白話文一樣,淺白易解,但文辭優美,不可方物。月光空明的照映水面,流光是水,也是飛逝的光陰。這時,帶出了「望美人兮天一方」,思慕美好之人。很多人解作君王,也許是「知音」吧。
朋友,隨歌而吹起哀怨的洞簫來,令東坡感到一股惆悵。
於是他問,為何悲傷呢?
朋友講起當年曹操、周瑜,這些千古風流人物,如今都隨時間消逝了,我們這等小人物,也有日消失於塵世。漁夫、斬柴佬,和英雄們,都一樣,無法抗逆歲月的流逝。
蘇子愀然,正襟危坐,而問客曰:何為其然也?客曰:月明星稀,烏鵲南飛。此出曹孟德之詩乎?西望夏口,東望武昌。山川相繆,鬱乎蒼蒼。此非孟德之困於周郎者乎?方其破荊州,下江陵,順流而東也,舳艫千里,旌旗蔽空,釃酒臨江,橫槊賦詩,固一世之雄也,而今安在哉?況吾與子漁樵於江渚之上,侶魚蝦而友麋鹿。駕一葉之扁舟,舉匏尊以相屬。寄蜉蝣於天地,渺滄海之一粟。哀吾生之須臾,羡長江之無窮。挾飛仙以遨遊,抱明月而長終。知不可乎驟得,託遺響於悲風。
想望著夏口、武昌,這些方位,感受著歷史上年代,曾經戰火,曾經興衰。用漁夫、樵夫的凡人,對比曹操、周瑜等大人物,帶出人之於天地,無論富貴貧賤,功業高低,都只是過客,都是渺少。
除非成仙,長生不老。
長生不老,是應對人類抗拒萬物皆變的妄想。
跟著,帶出了蘇東坡對世間變與不變的領悟來。
蘇子曰:客亦知大水與月乎?逝者如斯,而未嘗往也。盈虛者如彼,而卒莫消長也。蓋將自其變者而觀之,則天地曾不能以一瞬;自其不變者而觀之,則物與我皆無盡也,而又可羡乎?且夫天地之間,物各有主,苟非吾之所有,雖一毫而莫取。惟江上之清風,與山間之明月,耳得之而為聲,目遇之而成色,取之無禁,用之不竭。是造物者之無盡藏也,而吾與子所共適。
客喜而笑,洗盞更酌,餚核既盡,杯盤狼籍。相與枕藉乎舟中,不知東方之既白。
用江水流逝,月亮盈虛,表面變化不停,其實沒有增損水月本質來看,雖則天地萬物每一瞬都在變化,但其實,萬物與我都可以是永恆的。
人怕變化,因為怕失去曾經擁有過的東西。怕年華老去,因為你曾經年輕。
問題是,我們以為曾經擁有的,真的是屬於我們的嗎?
東坡悟到,天地之間,物各有主。苟非吾之所有,雖一毫而莫取。既然天地萬物,都有自己的主宰,不相從屬,所以,一毫都不能攞走。
也是說,我們生來,本來就一無所有。一毫莫取,不是不該取,而是取不得,不能取。
當理解到這一點,就能夠不再困於擁有與失去,可以放開胸懷去欣當這個世界。
江上清風,山間明月,我們任何人,任何階層,都可以任意享受,因為,我們本來,就不曾擁有它們,所以,才能隨意享用。
當我們執著擁有,反而終日擔心失去。不用擁有,原來,也可享用。
愛,和擁有,原來毫無關係。愛上什麼人和物,就只管愛著;計較擁有,就已經失去。
最後,所謂的愛,只會留下遺憾。
蘇東坡的領悟,是欣賞人生,無須用擁有與否將自己困住。
看完今日新聞,讀一次《赤壁賦》,心情是否好點?
https://youtu.be/svGtkHq-LNM20200915
獨立樣本定義 在 第7單元獨立樣本的推論統計| 心理科學基礎統計 的推薦與評價
若研究者使用連續尺度收集資料,適用的資料分析方法就是獨立樣本t檢定。 ... 本單元示範的獨立性檢定也是運用卡方分佈,判斷各組次數之間的差異有沒有符合預期。 ... <看更多>
獨立樣本定義 在 [問題] 獨立樣本設計與相依樣本設計的差異- 看板Statistics 的推薦與評價
最近寫題目寫到有關獨立樣本設計與相依樣本設計的差異,題目如下:
從事兩母體平均數之比較時,有獨立樣本設計與相依樣本設計,兩者有何不同,請問從統
計推論誤差的觀點來看,何種樣本設計較佳?為什麼?
雖然了解兩個樣本設計之間的差別,但是不太知道如何從統計推論誤差的觀點來看何種樣
本設計較佳,希望有版上的神人可以幫我解惑一下,感謝!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 39.12.135.226 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1623336649.A.4C0.html
... <看更多>