【全球最強AI芯片!今天,阿里巴巴第一顆自研芯片問世,1秒處理7.8萬張照片,能頂10顆GPU】
今天的杭州雲棲大會上,達摩院院長張建鋒現場展示了這款全球最強的AI芯片——含光800。
作為一款主要用於雲端視覺處理場景的推理芯片,含光800采用12納米制程工藝,集成了170億個晶體管,性能和能效比都做到了全球最強。
張建鋒說:“在全球芯片領域,阿里巴巴是一個新人。阿里巴巴去年成立了半導體公司‘平頭哥’,此前發布的玄鐵和今天發布的含光800是平頭哥的萬里長征第一步,我們還有很長的路要走。”
過去半年,平頭哥先後發布玄鐵910、無劍SoC平臺等產品。隨著含光800的發布,平頭哥端雲一體全棧產品系列初步成型,涵蓋處理器IP、一站式芯片設計平臺和AI芯片,實現了芯片設計鏈路的全覆蓋。
#每秒處理7.8萬張照片
“含光”得名於傳說中的上古三大神劍之一,該劍含而不露,光而不耀,正如含光800帶來的無形卻強勁的算力。
在業界標準的ResNet-50測試中,含光800推理性能達到78563 IPS(每秒能處理78563張照片),比目前業界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。
含光800性能的突破得益於軟硬件的協同創新:硬件層面采用自研芯片架構,通過推理加速等技術有效解決芯片性能瓶頸問題;軟件層面集成了達摩院先進算法,針對CNN及視覺類算法深度優化計算、存儲密度,可實現大網絡模型在一顆NPU上完成計算。
我們知道,芯片設計是一個十分復雜的系統工程,流片失敗是所有芯片設計企業的噩夢,數以億計的巨額流片費用白白燒掉不說,還意味著所有硬件設計需要推倒重來,這遠比軟件出BUG問題更加嚴重。一般芯片公司需要做兩次或多次才能流片成功。
即便流片成功,也不代表芯片可以直接商用,它還需要經過復雜的測試驗證,在各項指標都符合實際場景需求後才到了真正的商用階段。
值得註意的是,平頭哥卻很生猛,用最短的時間完成了芯片的設計、流片整個過程,7個月完成前端設計,之後僅用了3個月就成功流片。這背後主要得益於阿裏軟硬件的深厚積累,以及豐富的驗證場景。
#含光AI雲服務已上線
在人工智能行業,AI芯片雖是最重要的硬件基礎設施,卻總因雷聲大雨點小而遭人詬病,歸根結底,初創公司缺乏將芯片落地的場景和能力。
阿里巴巴就不存在這個問題,阿里巴巴自己就是全球最大的人工智能應用者之一,淘寶等等一系列豐富的場景是就是研發人工智能芯片的絕佳土壤,他們擁有豐富的人工智能應用場景,圖像視頻分析、搜索、推薦這些業務場景都需要AI專用芯片提供算力,而圖像、視頻對算力的需求量最大。
目前,含光800已應用在阿裏巴巴內部核心業務中。
根據雲棲大會的現場演示,在城市大腦中實時處理杭州主城區交通視頻,使用傳統GPU需要40顆,延時為300ms,單路視頻功耗2.8W;而使用含光800僅需4顆,延時降至150ms,單路視頻功耗1W,有效節約了硬件和時間成本。
另外還有拍立淘商品庫,每天新增10億商品圖片,為了讓用戶快速從海量圖片中精準搜索到商品,需要強大的計算力支撐,使用含光800搜索效率可提升12倍,時間從傳統GPU的1小時縮減至5分鐘。
含光800的算力不僅可以滿足阿裏內部場景的需求,還會通過全球前三、亞太第一的阿裏雲對外輸出,幫助企業用更低的成本獲取高性能算力,加速業務創新。
基於含光800的AI雲服務已於當天正式上線,相比傳統GPU算力,性價比提升100%。對於受限於算力瓶頸的企業而言,含光800可以更高效地運行更復雜、更先進的算法。
#做面向AIoT時代的普惠算力
過去半年,平頭哥先後發布了玄鐵910、無劍SoC平臺。隨著含光800的發布,平頭哥端雲一體全棧產品系列初步成型,涵蓋處理器IP、一站式芯片設計平臺和AI芯片,實現了芯片設計鏈路的全覆蓋。
不同於絕大多數芯片商,平頭哥的目的並非賣芯片,而是延續了阿里巴巴“讓天下沒有難做生意”的願景,開辟了全新的商業模式(平頭哥模式)。
平頭哥認為,AIoT場景需要新的計算架構,這必將在芯片行業將引起一波全新技術革命和產業浪潮。但AIoT市場有強應用驅動和場景碎片化等特點,平頭哥希望通過端雲一體芯片生態為各行業提供普惠算力。
從平頭哥全系列產品的名字和定位,就可以看出他們做普惠算力的良苦用心。
玄鐵系列致力於為AIoT終端芯片提供高性價比IP,外部合作夥伴可以在玄鐵的IP(知識產權)核上,根據場景需要增添擴展指令,設計出自己的芯片。過程類似於高通(75.230,-2.60%)和華為在ARM的Cortex-A系列處理器的基礎上,設計出驍龍和麒麟。
這也是阿里將其取名為玄鐵的原因:“玄鐵重劍”由楊過交給郭靖夫婦後,熔化鑄成了倚天劍和屠龍刀。
玄鐵系列可用於5G基站、人工智能加速、自動駕駛等領域。平頭哥承諾,玄鐵910的授權價格將比競爭對手降低一半以上。
同樣能夠幫助企業降低芯片設計門檻的,還有無劍SoC平臺。
無劍是面向AIoT時代的一站式芯片設計平臺,提供集芯片架構、基礎軟件、算法與開發工具於一體的整體解決方案,能幫芯片設計企業將設計成本降低50%,周期壓縮50%。
獨孤求敗四十歲前使用玄鐵重劍,四十歲後,草木竹石均可為劍,漸進於無劍勝有劍之境。正如平頭哥無劍平臺,自己能夠沒有芯片,但可幫助各路芯片設計企業“鑄劍”。
此外,平頭哥還將成立芯片開放社區,進一步為芯片產業提供開放協作的平臺,爭取將操作系統、軟硬件融合的算法和核心IP等具有共性的技術做好做精做出競爭力,並形成生態,然後開放給合作夥伴,幫助他們基於高質量的基礎設施打造芯片產品,提升產業整體競爭力。
resnet 50架構 在 ResNeXt 架構介紹 的推薦與評價
下表為ResNet-50 和ResNeXt-50 的比較。兩者參數數量及FLOPs 差不多。(FLOPs:floating point operations,浮點運算數量,可以想成計算量[3])表 ... ... <看更多>
resnet 50架構 在 Keras 以ResNet-50 預訓練模型建立狗與貓辨識程式- GT Wang 的推薦與評價
這裡示範在Keras 架構下以ResNet-50 預訓練模型為基礎,建立可用來辨識狗與貓的AI 程式。 ... <看更多>