軟體吞噬硬體的 AI 時代,晶片跟不上演算法的進化要怎麼辦?
作者 品玩 | 發布日期 2021 年 02 月 23 日 8:00 |
身為 AI 時代的幕後英雄,晶片業正經歷漸進持續的變化。
2008 年之後,深度學習演算法逐漸興起,各種神經網絡滲透到手機、App 和物聯網。同時摩爾定律卻逐漸放緩。摩爾定律雖然叫定律,但不是物理定律或自然定律,而是半導體業發展的觀察或預測,內容為:單晶片整合度(積體電路中晶體管的密度)每 2 年(也有 18 個月之說)翻倍,帶來性能每 2 年提高 1 倍。
保證摩爾定律的前提,是晶片製程進步。經常能在新聞看到的 28 奈米、14 奈米、7 奈米、5 奈米,指的就是製程,數字越小製程越先進。隨著製程的演進,特別進入10 奈米後,逐漸逼近物理極限,難度越發增加,晶片全流程設計成本大幅增加,每代較上一代至少增加 30%~50%。
這就導致 AI 對算力需求的增長速度,遠超過通用處理器算力的增長速度。據 OpenAI 測算,從 2012 年開始,全球 AI 所用的演算量呈現等比級數增長,平均每 3.4 個月便會翻 1 倍,通用處理器算力每 18 個月至 2 年才翻 1 倍。
當通用處理器算力跟不上 AI 演算法發展,針對 AI 演算的專用處理器便誕生了,也就是常說的「AI 晶片」。目前 AI 晶片的技術內涵豐富,從架構創新到先進封裝,再到模擬大腦,都影響 AI 晶片走向。這些變化的背後,都有共同主題:以更低功耗,產生更高性能。
更靈活
2017 年圖靈獎頒給電腦架構兩位先驅 David Petterson 和 John Hennessy。2018 年圖靈獎演講時,他們聚焦於架構創新主題,指出演算體系結構正迎來新的黃金 10 年。正如他們所判斷,AI 晶片不斷出現新架構,比如英國 Graphcore 的 IPU──迥異於 CPU 和 GPU 的 AI 專用智慧處理器,已逐漸被業界認可,並 Graphcore 也獲得微軟和三星的戰略投資支援。
名為 CGRA 的架構在學界和工業界正受到越來越多關注。CGRA 全稱 Coarse Grained Reconfigurable Array(粗顆粒可重構陣列),是「可重構計算」理念的落地產物。
據《可重構計算:軟體可定義的計算引擎》一文介紹,理念最早出現在 1960 年代,由加州大學洛杉磯分校的 Estrin 提出。由於太過超前時代,直到 40 年後才獲得系統性研究。加州大學柏克萊分校的 DeHon 等將可重構計算定義為具以下特徵的體系結構:製造後晶片功能仍可客製,形成加速特定任務的硬體功能;演算功能的實現,主要依靠任務到晶片的空間映射。
簡言之,可重構晶片強調靈活性,製造後仍可透過程式語言調整,適應新演算法。形成高度對比的是 ASIC(application-specific integrated circuit,專用積體電路)。ASIC 晶片雖然性能高,卻缺乏靈活性,往往是針對單一應用或演算法設計,難以相容新演算法。
2017 年,美國國防部高級研究計劃局(Defence Advanced Research Projects Agency,DARPA)提出電子產業復興計劃(Electronics Resurgence Initiative,ERI),任務之一就是「軟體定義晶片」,打造接近 ASIC 性能、同時不犧牲靈活性。
照重構時的顆粒分別,可重構晶片可分為 CGRA 和 FPGA(field-programmable gate array,現場可程式語言邏輯門陣列)。FPGA 在業界有一定規模應用,如微軟將 FPGA 晶片帶入大型資料中心,用於加速 Bing 搜索引擎,驗證 FPGA 靈活性和演算法可更新性。但 FPGA 有局限性,不僅性能和 ASIC 有較大差距,且重程式語言門檻比較高。
CGRA 由於實現原理差異,比 FPGA 能做到更底層程式的重新設計,面積效率、能量效率和重構時間都更有優勢。可說 CGRA 同時整合通用處理器的靈活性和 ASIC 的高性能。
隨著 AI 演算逐漸從雲端下放到邊緣端和 IoT 設備,不僅演算法多樣性日益增強,晶片更零碎化,且保證低功耗的同時,也要求高性能。在這種場景下,高能效高靈活性的 CGRA 大有用武之地。
由於結構不統一、程式語言和編譯工具不成熟、易用性不夠友善,CGRA 未被業界廣泛使用,但已可看到一些嘗試。早在 2016 年,英特爾便將 CGRA 納入 Xeon 處理器。三星也曾嘗試將 CGRA 整合到 8K 電視和 Exynos 晶片。
中國清微智慧 2019 年 6 月量產全球首款 CGRA 語音晶片 TX210,同年 9 月又發表全球首款 CGRA 多模態晶片 TX510。這家公司脫胎於清華大學魏少軍教授起頭的可重構計算研究團隊,從 2006 年起就進行相關研究。據芯東西 2020 年 11 月報導,語音晶片 TX210 已出貨數百萬顆,多模組晶片 TX510 在 11 月也出貨 10 萬顆以上,主要客戶為智慧門鎖、安防和臉部支付相關廠商。
先進封裝上位
如開篇提到,由於製程逼近物理極限,摩爾定律逐漸放緩。同時 AI 演算法的進步,對算力需求增長迅猛,逼迫晶片業在先進製程之外探索新方向,之一便是先進封裝。
「在大數據和認知計算時代,先進封裝技術正在發揮比以往更大的作用。AI 發展對高效能、高吞吐量互連的需求,正透過先進封裝技術加速發展來滿足。 」世界第三大晶圓代工廠格羅方德平台首席技術專家 John Pellerin 聲明表示。
先進封裝是相對於傳統封裝的技術。封裝是晶片製造的最後一步:將製作好的晶片器件放入外殼,並與外界器件相連。傳統封裝的封裝效率低,有很大改良空間,而先進封裝技術致力提高整合密度。
先進封裝有很多技術分支,其中 Chiplet(小晶片/芯粒)是最近 2 年的大熱門。所謂「小晶片」,是相對傳統晶片製造方法而言。傳統晶片製造方法,是在同一塊矽晶片上,用同一種製程打造晶片。Chiplet 是將一塊完整晶片的複雜功能分解,儲存、計算和訊號處理等功能模組化成裸晶片(Die)。這些裸晶片可用不同製程製造,甚至可是不同公司提供。透過連接介面相接後,就形成一個 Chiplet 晶片網路。
據壁仞科技研究院唐杉分析,Chiplet 歷史更久且更準確的技術詞彙應該是異構整合(Heterogeneous Integration)。總體來說,此技術趨勢較清晰明確,且第一階段 Chiplet 形態技術較成熟,除了成本較高,很多高端晶片已經在用。
如 HBM 儲存器成為 Chiplet 技術早期成功應用的典型代表。AMD 在 Zen2 架構晶片使用 Chiplet 思路,CPU 用的是 7 奈米製程,I/O 使用 14 奈米製程,與完全由 7 奈米打造的晶片相比成本約低 50%。英特爾也推出基於 Chiplet 技術的 Agilex FPGA 系列產品。
不過,Chiplet 技術仍面臨諸多挑戰,最重要之一是互連介面標準。互連介面重要嗎?如果是在大公司內部,比如英特爾或 AMD,有專用協議和封閉系統,在不同裸晶片間連接問題不大。但不同公司和系統互連,同時保證高頻寬、低延遲和每比特低功耗,互連介面就非常重要了。
2017 年,DARPA 推出 CHIPS 戰略計劃(通用異構整合和 IP 重用戰略),試圖打造開放連接協議。但 DARPA 的缺點是,側重國防相關計畫,晶片數量不大,與真正商用場景有差距。因此一些晶片業公司成立組織「ODSA(開放領域特定架構)工作組」,透過制定開放的互連介面,為 Chiplet 的發展掃清障礙。
另闢蹊徑
除了在現有框架內做架構和製造創新,還有研究人員試圖跳出電腦現行的范紐曼型架構,開發真正模擬人腦的計算模式。
范紐曼架構,數據計算和儲存分開進行。RAM 存取速度往往嚴重落後處理器的計算速度,造成「記憶體牆」問題。且傳統電腦需要透過總線,連續在處理器和儲存器之間更新,導致晶片大部分功耗都消耗於讀寫數據,不是算術邏輯單元,又衍生出「功耗牆」問題。人腦則沒有「記憶體牆」和「功耗牆」問題,處理訊息和儲存一體,計算和記憶可同時進行。
另一方面,推動 AI 發展的深度神經網路,雖然名稱有「神經網路」四字,但實際上跟人腦神經網路運作機制相差甚遠。1,000 億個神經元,透過 100 萬億個神經突觸連接,使人腦能以非常低功耗(約 20 瓦)同步記憶、演算、推理和計算。相比之下,目前的深度神經網路,不僅需大規模資料訓練,運行時還要消耗極大能量。
因此如何讓 AI 像人腦一樣工作,一直是學界和業界積極探索的課題。1980 年代後期,加州理工學院教授卡弗·米德(Carver Mead)提出神經形態工程學的概念。經過多年發展,業界和學界對神經形態晶片的摸索逐漸成形。
軟體方面,稱為第三代人工神經網路的「脈衝神經網路」(Spike Neural Network,SNN)應運而生。這種網路以脈衝信號為載體,更接近人腦的運作方式。硬體方面,大型機構和公司研發相應的脈衝神經網路處理器。
早在 2008 年,DARPA 就發起計畫──神經形態自適應塑膠可擴展電子系統(Systems of Neuromorphic Adaptive Plastic Scalable Electronics,簡稱 SyNAPSE,正好是「突觸」之意),希望開發出低功耗的電子神經形態電腦。
IBM Research 成為 SyNAPSE 計畫的合作方之一。2014 年發表論文展示最新成果──TrueNorth。這個類腦計算晶片擁有 100 萬個神經元,能以每秒 30 幀的速度輸入 400×240pixel 的影片,功耗僅 63 毫瓦,比范紐曼架構電腦有質的飛躍。
英特爾 2017 年展示名為 Loihi 的神經形態晶片,包含超過 20 億個晶體管、13 萬個人工神經元和 1.3 億個突觸,比一般訓練系統所需的通用計算效率高 1 千倍。2020 年 3 月,研究人員甚至在 Loihi 做到嗅覺辨識。這成果可應用於診斷疾病、檢測武器和爆炸物及立即發現麻醉劑、煙霧和一氧化碳氣味等場景。
中國清華大學類腦計算研究中心的施路平教授團隊,開發針對人工通用智慧的「天機」晶片,同時支持脈衝神經網路和深度神經網路。2019 年 8 月 1 日,天機成為中國第一款登上《Nature》雜誌封面的晶片。
儘管已有零星研究成果,但總體來說,脈衝神經網路和處理器仍是研究領域的方向之一,沒有在業界大規模應用,主要是因為基礎演算法還沒有關鍵性突破,達不到業界標準,且成本較高。
附圖:▲ 不同製程節點的晶片設計製造成本。(Source:ICBank)
▲ 可重構計算架構與現有主流計算架構在能量效率和靈活性對比。(Source:中國科學)
▲ 異構整合成示意動畫。(Source:IC 智庫)
▲ 通用處理器的典型操作耗能。(Source:中國科學)
資料來源:https://technews.tw/2021/02/23/what-to-do-if-the-chip-cannot-keep-up-with-the-evolution-of-the-algorithm/?fbclid=IwAR0Z-nVQb96jnhAFWuGGXNyUMt2sdgmyum8VVp8eD_aDOYrn2qCr7nxxn6I
外殼耗能計算 在 辛西亞。玩美親子進行式 Facebook 的最佳解答
#THOMSON日系微風小草無線除溼盒
➡️文章分享: https://reurl.cc/yg9zaE
➡️下單連結: https://reurl.cc/Y6Kym4
看氣象預報這雨恐怕還要再下一周,
濕漉漉的天氣讓人感覺都快發霉了!
濕氣很重的問題,媽媽真的非常困擾,
尤其家有過敏兒,除濕機、空氣清淨機幾乎整天開著,
只要聽到「除濕」這兩個關鍵字,
不管什麼用品,媽媽都會想要拿來試試看,
最近用了一款除濕盒有夠神奇,
也算是開了我這個科技鄉巴佬的眼界。
THOMSON法國百年經典老牌,
推出的日系微風小草無線除濕盒,
專為櫥櫃小空間設計,
可以廣泛使用在家中各個角落,
媽媽居家神物有效對抗潮濕問題!
設計風格很簡約時尚,
純白外殼搭配透明視窗,
頂上還有一撮仿生小草,
不說還以為是哪個日系品牌新品呢!
小草內特殊「二氧化矽粒子」成分,
能有效吸收空氣中多餘水分,達到除濕效果,
本身無毒、無味、不滲水,
更不會產生有毒氣體跟廢水。
只需插電就能還原烘乾,
不需要更換任何耗材,
省電! 省錢! 省心!
愛護自己跟家人的同時,
也為愛護地球盡一份心力。
照顧全家人的健康,
主婦太太選對日常用品就先成功一半,
居家生活質感的營造,
就是從這些日常小地方開始。
THOMSON 日系微風小草無線除濕盒 產品特點:
🔸可重複使用,經濟環保又省錢
🔸 外殼採用ABS防火阻燃材質
🔸 適合各種除溼環境皆適用
🔸 不會產生有毒氯氣及鹼性廢水
🔸 輕巧方便防潮濕不占空間
🔸 無毒、無味、不溶化、不滲水、不滲漏、不會傾倒
🔸 智慧型變色顯示,指示吸飽濕氣跟恢復除溼力
-----
✅團購表單:https://reurl.cc/Y6Kym4
(12/07開團,12/14收單,12/18前出貨)
✅ 運費計算:本團免運費。
✅ 付款方式:信用卡/ATM轉帳
✅ 客服資訊:
客服 Line@: https://line.me/R/ti/p/%40addonecs
#實用型聖誕禮物首選
#媽媽主婦必收居家好物
#湯哥每天都會好奇看變色了沒
外殼耗能計算 在 食物鏈 Facebook 的精選貼文
#斯佩爾特酸種大麵包
#兩種型號混合
#硬種
#洋車前子
今天的這顆麵包是昨天早上的早餐. 因為麵包全吃光了. 不得不趕緊烤.而且有非常熱. 必須戴手套切的熱切面.
Dinkelmehl812 這個型號在德國也不是每間超市都有. 最常見到的兩種型號是 Dinkelmehl630 及Dinkelmehl1050 而這樣的兩種型號可以利用之前介紹的這個麵粉計算器來算需要多少 630 及1050來混合而成812
https://mipano.de/mehltypenrechner/
Dinkelmehl 812 300 g 可以用 Dinkelmehl 630 171 g + Dinkemehl1050 129 g 來取代.
我這次將630 中的 6 g 去除. 使用6 g 洋車前子. 為的是和上上一篇完全使用洋車前子的做法來比較.
算起來的水量是差不多的
1. Dinkelmehl 630 165 g
2. Dinkelmehl 1050 129 g
3. 洋車前子粉 6 g
4. 酸種硬種( 高筋粉餵養. 50 %水量) 72 g
5. 水 204 g +45 g
6. 核桃隨意
7. 鹽 6 g
因為我還是要餵養我的硬種. 所以基本上都是為了消耗我的硬種才做的周邊麵包. 當我要錄影時應該就會使用斯佩爾特餵養的液種.
這次很大的想法是為了要了解這樣計算出來的麵粉混合以後口感及外觀如何?
結果覺得外殼比較硬. 老爺邊吃邊念. 我也不確定是不是因為熱切還是因為某人等麵包等得不耐煩結果是大麵包而不是棍子🥖🥖🥖伺候😅😅😅.
#因為要趕著吃早餐所以只有做了8小時冷藏後發
氣孔顯得有點雜亂無章. 但大致上是都有開的. 我覺得這樣就夠了. 這幾次下來覺得我的洋車前子應該要改少量一點. 2%是很多人會添加的量. 但以這樣的手感看來應該可以增加水量或是減少洋車子添加量. 接下來應該會把洋車前子粉研磨細緻一點. 你可以看到這個麵團準備整形後發的外觀跟一般麵粉的光滑外觀非常不一樣. 沒錯, 這樣就可以整形了.
在我做過這麼多非主流酸種麵包. 例如: 只有添加洋車前子粉的無麩質麵包. 大量使用麵筋的高蛋白質麵包或是100% 裸麥麵包. 這些麵包的判斷成熟度都是需要練習的. 我覺得當初應該有一個月訓練期的無麩質麵包" 過發" 訓練幫助我很大. 把一個麵團的麵筋剔除. 以外觀及手感來判斷真的很重要. 你必須要相信自己感覺到的東西....
最近這兩個添加洋車前子的麵包都是用這個木屑發酵籃做的. 這個木屑籃好像還是繼續缺貨中. 因為COVID19 讓很多人自己在家烘焙. 原本有接少量單子的工廠不這樣賣人了.
但還是要把我最近這兩次的割線談一下. 我的割線都剛好落在底部的那個紋路上. 在我的其他藤籃割線中也是如此. 這是我的手感. 覺得這樣割出來的長相都還不錯. 除非你要在上面作畫. 那個考量就比較不同. 因為下刀的角度. 深度. 多寡都得根據你的麵團爆發力來判斷. 爆發力這件事其實在你處理麵團時就可以有感覺. 講得有點籠統. 但我想真的常做的就可以知道我在說甚麼.
使用洋車前子的麵團我都做比較深的割線. 你也可以看到它"固形"的樣子. 一般來說這樣割了會散開. 但是它並沒有.
我們家來了嬌客. 我公公的貓已經來這裡一周了.
當初我公公去收容所收養她時被告知這是一隻自己生活在農場穀倉裡的貓. 因為她生了小貓被發現了才被抓到收容所.
記得那時我公公婆婆對這隻貓的一些行為完全沒辦法理解. 也就是她白天都會一直睡. 然後晚上非常活躍. 很吵XD 就算是當時有一個月都關客廳晚上還會跑跳自己玩....
她不是一隻喜歡和別的貓相處的貓. 但我婆婆的貓很年輕. 非常喜歡玩.每次都會去惹她生氣. 常常被打XD 我們家的Brownie 是一隻只要有食物就好的貓. 而且牠也沒有我婆婆的那隻Schoko 能抓活鳥的實力. 所以我們讓公公的貓來跟Brownie 生活.
最近晚上確實有點吵. 老爺每次回來都不是先問候我.總是先問Teresa 在哪裡? ( 我怎麼知道? 牠超級會躲的!)
然後也不乏找不到一直問我有沒有出門時沒關門?
害我買了好幾袋球莖到現在還沒時間種到土裡去!
前天老爺從婆婆家拿回了一個袋子. 裡面裝了很多蘋果. 拿開蘋果後. 發現Teresa 的玩偶. 三隻布老鼠@@ ( 其實我婆婆有跟我們要回Teresa, 但是我們還是希望她適應這裡. 還沒有決定)
我想我們家目前應該不會有老鼠敢跑進來了!
穀倉裡的貓應該都是這樣生活的吧? ( 抖~~~~~
補充: 剛剛吃了尾端的麵包發現皮變得很軟. 所以我覺得是不錯的....
外殼耗能計算 在 req等價開窗率、外殼耗能計算、節能外牆在PTT/mobile01評價 ... 的推薦與評價
req等價開窗率在PTT/mobile01評價與討論, 提供外殼耗能計算、節能外牆、通風修正係數就來台鐵車站資訊懶人包,有最完整req等價開窗率體驗分享訊息. ... <看更多>
外殼耗能計算 在 07 海拔800m以下【總量規範】建築節能計算與操作 - YouTube 的推薦與評價
00:00 低於海拔800m(總量規範)02:08 空調型建築ENVLOAD怎麼算05:27 外殼 熱性能固定之大空調空間07:09 如何設定ENVLOAD的 耗能 分區12:18 自然通風空調 ... ... <看更多>
外殼耗能計算 在 req等價開窗率、外殼耗能計算、節能外牆在PTT/mobile01評價 ... 的推薦與評價
req等價開窗率在PTT/mobile01評價與討論, 提供外殼耗能計算、節能外牆、通風修正係數就來台鐵車站資訊懶人包,有最完整req等價開窗率體驗分享訊息. ... <看更多>