卷積網路一直是影像辨識的首選,但近日一篇匿名論文(An Image Is Worth 16×16 Words)引起ML社群關注,指出直接用Transformer來處理影像Patch序列,其影像分類能力遠比CNN出色,連DeepMind、Tesla AI總監和發明AlexNet的OpenAI首席科學家都表示期待。該論文正接受AI頂級盛會ICLR 2021的評審,因此無法透露作者姓名。
同時也有10000部Youtube影片,追蹤數超過2,910的網紅コバにゃんチャンネル,也在其Youtube影片中提到,...
transformer 影像辨識 在 iThome Facebook 的最佳貼文
30多位OpenAI研究員聯手發表超大自然語言模型GPT-3,擁有1,750億個參數,而且在一系列的基準測試任務中,比如翻譯、新聞生成、回答SAT問題等領域,都達到高階等級(SOTA)
https://www.ithome.com.tw/news/138054
transformer 影像辨識 在 iThome Facebook 的最佳解答
臉書日前發表影像辨識模型DETR,將常用於自然語言任務的Transformer架構,也用來應付電腦視覺問題。OpenAI最近發布超大自然語言模型GPT-3,用了1,750億個參數,在一系列測試中精準度都達高階(SOTA)表現。DeepMind最新研究發現,句法偏差可改善BERT表現。百度發布量子機器學習平臺Paddle Quantum.