矮化女性和少數種族,OpenAI GPT 模型為何變成 AI 歧視重災區?
作者 品玩 | 發布日期 2021 年 02 月 13 日 0:00 |
機器學習技術近幾年突飛猛進,許多強大 AI 因此誕生。以知名研究機構 OpenAI 開發的語言生成模型 GPT 為例,現在可寫文章、幫人做報表、自動查詢資訊,給用戶很大幫助和便利。
然而,多篇近期論文指出,包括 GPT 等 AI 模型,生成結果包含基於性別和種族的偏見。而這些 AI 模型應用在商業領域,勢必強化歧視偏見對象現象。
卡內基美隆大學 Ryan Steed 和喬治華盛頓大學 Aylin Caliskan 近日發表論文《無監督的方式訓練的影像表示法包含類似人類的偏見》(Image Represnetations Learned With Unsupervised Pre-Training Contain Human-like Biases)。
研究者對 OpenAI 在 GPT-2 基礎上開發的 iGPT 和 Google 的 SimCLR,兩個去年發表的影像生成模型進行系統性測試,發現種族、膚色和性別等指標幾乎原樣複製人類測試物件的偏見和刻板印象。
其中一項測試,研究者用機器生成男女頭像照片為底板,用 iGPT 補完(生成)上半身影像。誇張的事發生了:所有女性生成結果,超過一半影像穿著比基尼或低胸上衣。
男性結果影像,約 42.5% 影像穿和職業有關的上衣,如襯衫、西裝、和服、醫生大衣等;露手臂或穿背心的結果只有 7.5%。
這樣的結果,技術方面的直接原因可能是 iGPT 採用的自迴歸模型機制。研究者進一步發現,用 iGPT 和 SimCLR 對照片和職業相關名詞建立連結時,男人更多和「商務」、「辦公室」等名詞連結,女人更多和「孩子」、「家庭」等連結;白人更多和工具連結,而黑人更多和武器連結。
這篇論文還在 iGPT 和 SimCLR 比對不同種族膚色外觀的人像照片「親和度」(pleasantness),發現阿拉伯穆斯林人士的照片普遍缺乏親和力。
雖然 iGPT 和 SimCLR 模型的具體運作機制有差別,但透過這篇論文,研究者指出這些偏見現象背後的共同原因:無監督學習。
這兩個模型都採用無監督學習 (unsupervised learning),這是機器學習的方法之一,沒有給事先標記好的訓練資料,自動分類或分群匯入的資料。
無監督學習的好處,在於資料標記是繁瑣費時的工作,受制於標記工的程度和條件限制,準確性很難保持一定,標記也會體現人工的偏見歧視,某些領域的資料更缺乏標記資料庫;而無監督學習在這種條件下仍有優秀表現,最近幾年很受歡迎。
然而這篇論文似乎證明,採用無監督學習無法避免人類常見的偏見和歧視。
研究者認為,採用無監督學習的機器學習演算法,出現的偏見歧視來源仍是訓練資料,如網路影像的男性照更多和職業相關,女性照片更多衣著甚少。
另一原因是這些模型採用自迴歸演算法。在機器學習領域,自迴歸演演算法的偏見問題人盡皆知,但嘗試解決這問題的努力並不多。
結果就是,機器學習演算法從初始資料庫學到所有東西,當然包括人類的各種偏見和歧視。
之前 OpenAI 號稱「1700 億參數量」的最新語言生成模型 GPT-3,發表論文也申明因訓練資料來自網路,偏見無法避免,但還是發表並商業化。
去年 12 月,史丹佛和麥克馬斯特大學的研究者另一篇論文《Persistent Anti-Muslim Bias in Large Language Models》,確認 GPT-3 等大規模語言生成模型對穆斯林等常見刻板印象的受害者,確實有嚴重的歧視問題。
具體來說,用相關詞語造句時,GPT-3 多半會將穆斯林和槍擊、炸彈、謀殺和暴力連結。
另一項測試,研究者上傳一張穆斯林女孩的照片,讓模型自動生成一段文字,卻包含明顯的暴力過度遐想和延申,其中有句話「不知為何原因,我渾身是血。」
而當這類演算法應用到現實生活,偏見和歧視將進一步強化。
iGPT 和背後的 OpenAI GPT 技術,現在開發到第三代。能力確實很強大,就像眾多媒體報導過那樣,因此許多商業機構青睞採用。最知名的用戶就是微軟。去年 9 月,微軟 CTO Kevin Scott 宣布和 OpenAI 合作,獨家獲得 GPT-3 授權,將技術應用到針對用戶的各項產品和 AI 解決方案。
微軟尚未透露具體會把 GPT-3 應用到哪些產品,但考慮到微軟產品的十億級用戶量,情況非常令人擔憂。如微軟近幾年 Word、PPT 等產品推廣的自動查詢資訊、文字補完和影像設計功能,當用戶匯入某特定詞或插入圖片時,如果正好落入 GPT-3 的偏見陷阱,結果將非常糟糕。
不僅 GPT,照前述論文說法,所有採用無監督學習的演算法都可能包含這些偏見。現在因無監督學習非常熱門,自然語言處理、電腦視覺等領域,都成為非常關鍵的底層技術。
如翻譯對人際溝通十分重要,但錯誤的翻譯結果,一次被演算法強化的偏見事件,少則切斷人與人的聯繫,更嚴重者將導致不可估量的人身和財產損失。
作者 Steed 和 Caliskan 呼籲,機器學習研究者應該更區別和記錄訓練資料庫的內容,以便未來找到降低模型偏見的更好方法,以及發表模型前應該做更多測試,盡量避免受演算法強化的偏見被帶入模型。
資料來源:https://technews.tw/2021/02/13/openai-gpt-discrimination/
「電腦視覺影像處理差別」的推薦目錄:
- 關於電腦視覺影像處理差別 在 台灣物聯網實驗室 IOT Labs Facebook 的最讚貼文
- 關於電腦視覺影像處理差別 在 台灣物聯網實驗室 IOT Labs Facebook 的精選貼文
- 關於電腦視覺影像處理差別 在 台灣物聯網實驗室 IOT Labs Facebook 的最讚貼文
- 關於電腦視覺影像處理差別 在 [心得] 系統軟體轉電腦視覺(ulsee/由田) - 看板Soft_Job 的評價
- 關於電腦視覺影像處理差別 在 [請益] 電腦視覺方向差別- 看板Soft_Job - PTT網頁版 的評價
- 關於電腦視覺影像處理差別 在 Re: [請益] 放棄影像處理會不會比較好- Soft_Job - PTT Web 的評價
- 關於電腦視覺影像處理差別 在 Garmin Forerunner 965/265系列跑錶開箱|AMOLED螢幕與鈦 ... 的評價
電腦視覺影像處理差別 在 台灣物聯網實驗室 IOT Labs Facebook 的精選貼文
AlphaGo之後… AI落地是未來產業焦點
工商時報 劉季清 2020.06.14
AI(人工智慧)是未來科技發展趨勢,資策會MIC調查指出,台灣AI的技術發展前三名以「數據推理推論」、「電腦視覺」、「語音與自然語言處理」為主,並以2016年AlphaGo事件為分水嶺,可發現2016年以後成立的台灣企業,發展的AI技術重心轉為以語音及自然語言處理為主。
資策會MIC資深產業分析師韓揚銘表示,「AI落地」將是未來產業焦點,而當企業運用AI的情境愈多,愈需要良好的營運管理機制。
MIC表示,2016年以前成立的台灣企業發展AI時,以「資料擷取、標記或維運平台」技術為主,2016年AlphaGo事件發生後,語音與自然語言處理成了發展重心。入領域差別也顯示在企業AI應用領域趨勢,其中發展「跨領域應用」仍為主軸,驅動AI落地到各行各業產生效益。此外,醫療健康、行銷與媒體,也成為各企業應用AI的新興重點領域。
韓揚銘指出,觀測AI發展趨勢有幾大關鍵議題值得注意,包括「AI落地」將是未來產業焦點,落地之後,當企業運用AI的情境愈多,而落地後開啟的「後AI時代」,將帶來AI模型部署與監管、版本控制更新等挑戰,並驅動一波AI管理商機,當企業運用AI的情境愈多,愈需要良好的營運管理機制。
此外,落地前「效率」問題需要被解決,目前已有國際大廠開始透過晶片效率提升、分散式運算架構、使用剪枝技術讓模型最佳化、針對不同應用提供效率或推論程式改良,以加快推論與訓練時間、以迷你模型幫助落地等方式來提升效率。
MIC表示,隨著AI與感測技術發展帶動終端載具軟硬體升級,未來「非接觸式UI」發展值得關注。目前語音UI技術仍以說話者辨識、聲紋認證為主,可有利於電商、金融等行業辨識客戶身分與打造個人化服務,不過聲紋認證專利技術偏少,目前仍存在技術缺口。
視覺UI部分,布局熱點開始延伸至電子設備識別、3D模型或影像操作、影像分析如運動分析/決定位置或物件、通信控制等,顯示為AR/MR應用鋪路的意圖。
MIC指出,當終端載具被賦予更多感知能力,使用者將可透過手勢/動作、語音、視覺甚至腦波來與機器互動,資深產業分析師林巧珍表示,非接觸式UI將可催生更多智慧產品,也將提供更多中小型、無龐大研發資源的競逐者有機會躍升獨角獸。
附圖:2016年AlphaGo事件為分水嶺,可發現2016年以後成立的台灣企業,發展的AI技術重心轉為以語音及自然語言處理為主。圖/美聯社
資料來源:https://ctee.com.tw/news/tech/285274.html?fbclid=IwAR2MeVq-hp65ucOz3Axrkj-bCwE1AuiaKsakD87dDvMbW5g5qDlCQa4cFTk
電腦視覺影像處理差別 在 台灣物聯網實驗室 IOT Labs Facebook 的最讚貼文
把AI導入邊緣裝置就對了!
作者 : Duncan Stewart、Jeff Loucks,Deloitte科技/媒體/電信中心
2020-06-04
邊緣AI晶片可能會嵌入越來越多的消費性裝置,例如高階智慧型手機、平板電腦、智慧揚聲器和可穿戴裝置等。它們還將在多個企業市場中得到應用,例如機器人、攝影機、感測器和其他物聯網裝置...
德勤(Deloitte)預測,2020年,邊緣AI晶片出貨量將超過7.5億顆,銷售金額將達到26億美元,而且邊緣AI晶片的成長速度將遠高於整體晶片市場,估計到到2024年邊緣AI晶片出貨量可能超過15億顆,代表其複合年成長率(CAGR)至少達20%,是整體半導體產業(長期CAGR預測為9%)的兩倍多。
這些邊緣AI晶片可能會嵌入越來越多的消費性裝置,例如高階智慧型手機、平板電腦、智慧揚聲器和可穿戴裝置等。它們還將在多個企業市場中得到應用,例如機器人、攝影機、感測器和其他物聯網裝置。消費性應用邊緣AI晶片市場將遠大於企業應用市場,但成長速度可能會較慢,預計2020年至2024年之間,其CAGR為18%;企業應用邊緣AI晶片市場的成長速度更快,同期CAGR預計為50%。
儘管如此,無論從出貨量還是銷售金額來看,今年消費性裝置應用都將佔據整體邊緣AI晶片市場的90%以上。這些邊緣AI晶片中的絕大部分將應用於高階智慧型手機,佔據目前所有使用中的消費性邊緣AI晶片70%以上。實際上不僅是2020年,在未來幾年,AI晶片的成長將主要由智慧型手機推動。我們相信在今年預期出售的15.6億支智慧型手機中,超過三分之一都可能內含邊緣AI晶片。
由於對處理器的要求非常高,AI運算向來幾乎都在資料中心、企業核心設備或電信邊緣處理器上遠端執行,而不是在終端裝置本地執行;現在,邊緣AI晶片正在改變這一切。它們的實體尺寸更小、相對便宜、功耗更小、產生的熱量也更少,因而可以整合到手持裝置以及非消費性裝置(如機器人)中。
邊緣AI晶片可讓終端裝置能夠在本地執行密集型AI計算,減少甚至消除了將大量資料發送到遠端位置的需求,因此在可用性、速度、資料安全性和隱私性方面益處良多。從隱私和安全性方面來看,在邊緣裝置處理資料顯然更安全;個人資訊不離開手機就不會被攔截或濫用。而當邊緣AI晶片安裝在手機上時,即使未連結網路,它也可以完成所有處理。
當然,並非所有AI運算都必須在本地進行。針對某些應用,例如當裝置上的邊緣AI晶片無法處理太多資料時,將資料發送至遠端AI陣列來處理是適當的、甚至是首選方案。實際上,在大多數情況下,AI將以混合模式完成:一部分在裝置端實現,一部分在雲端實現。具體情況下應該選擇什麼樣的混合方式,要看需要完成的AI處理類型。
智慧型手機邊緣AI經濟學
並非只有智慧型手機使用邊緣AI晶片;其他裝置諸如平板電腦、可穿戴裝置、智慧揚聲器等也會採用AI晶片。短期內,其他裝置對邊緣AI晶片銷售的影響力可能會比智慧型手機小得多,原因若非這類市場沒有什麼成長(如平板電腦),就是這類市場規模太小、無法產生實質性的影響;例如,2020年智慧揚聲器和可穿戴裝置市場總銷售量預計僅1.25億部。不過許多可穿戴裝置和智慧揚聲器都依賴邊緣AI晶片,因此其普及率已經很高。
目前,只有價格最昂貴的智慧型手機(處於價格區間頂部)才可能內置邊緣AI晶片。但是,帶有AI晶片的智慧型手機並不一定要價格昂貴到讓消費者望而卻步。
我們可以對智慧型手機的邊緣AI晶片比例進行合理的估算。目前三星(Samsung)、蘋果(Apple)和華為(Huawei)的手機處理器圖片均顯示出裸片及所有功能特性,因此可以識別出晶片的哪些部分用於哪些功能。例如,三星Exynos 9820晶片的照片顯示,其晶片總面積的大約5%專用於AI處理器,整個應用處理器SoC的成本估計為70.50美元,僅次於顯示器,是手機中第二昂貴的元件,約佔據裝置總物料成本的17%。假設AI部分的成本與裸片上的其他部分一樣,即與所佔裸片面積成正比,那麼Exynos的邊緣AI神經處理單元(NPU)大約佔裸片總成本的5%,相當於每個NPU約3.50美元。
相同的,在蘋果的A12仿生晶片上,專用於機器學習的部分約佔裸片總面積的7%。如果整顆處理器的成本為72美元,邊緣AI部分的成本大約5.10美元。華為麒麟970晶片的成本估計為52.50美元,其中2.1%用於NPU,則這部分成本應為1.10美元(當然,裸片面積並不是衡量晶片總成本中有多少比例屬於AI的唯一方法。據華為表示,麒麟970的NPU包含1.5億個電晶體,佔整體晶片55億個電晶體總數的2.7%;按這樣計算,NPU的成本較高,約1.42美元)。
儘管這裡所提到的成本差別很大,但可以合理假設,NPU的平均成本約為每晶片3.50美元。雖然每顆晶片的價格不高,但考量達到5億支的智慧型手機出貨量(還不包括平板電腦、智慧揚聲器和可穿戴裝置),這仍然是一個很大的市場。
製造商的平均成本為3.50美元,最低可能僅1美元,因此在智慧型手機晶片中添加專用的邊緣AI NPU是很自然的事。按照正常的利潤加價幅度,製造成本增加1美元,對終端消費者而言也僅增加2美元。這意味著即使是價格低於250美元的智慧型手機,也可以享受NPU及其帶來的好處,如更好的攝影機、離線語音助理等,而價格漲幅不到1%。
AI晶片來源:自家生產還是找外部供應商?
生產智慧型手機和其他裝置的廠商取得邊緣AI晶片的方式各不相同,這主要取決於手機機型、甚至是區域市場等因素。有些公司向高通(Qualcomm)和聯發科(MediaTek)等第三方供應商採購應用處理器/數據機晶片,這兩家公司在2018年合計佔據了智慧型手機SoC市場約60%的比例。高通和聯發科提供了一系列不同價位的SoC;儘管並非都包含邊緣AI晶片,高階型號通常都會有,例如高通的Snapdragon 845和855,以及聯發科的Helio P60。
在另一方面,蘋果則完全不使用外部供應商的應用處理器晶片,而是設計並使用自己的處理器SoC,如A11、A12和A13 仿生晶片,所有這些晶片都支援邊緣AI。其他手機製造商如三星和華為則採用混合策略,也就是會從市場上的晶片供應商採購一部分SoC,其餘則使用自家研發的晶片,例如三星的Exynos 9820和華為的麒麟970/980。
兵家必爭的企業與工業應用領域邊緣AI市場
如果在智慧型手機和其他裝置中採用邊緣AI處理器好處多多,那為何不將之導入企業應用呢?事實上邊緣AI處理器已經有一些企業應用案例了,例如某些自主無人機;配備了智慧型手機應用處理器SoC的無人機,能完全在裝置端執行即時導航和避障,無需連結網路。
但是,針對智慧型手機或平板電腦最佳化的晶片並非許多企業或工業應用的正確選擇。如前面所述,智慧型手機SoC的邊緣AI部分僅佔總面積的5%,在總成本中佔據約3.50美元,功耗比整個SoC少大約95%。所以若開發出只有邊緣AI功能(加上其他一些必要功能,例如記憶體)的晶片,它的成本會更低、功耗更少且體積更小,豈不更好?
事實上,已經有這樣的晶片了。據說,有多達50家不同的公司正在開發各種各樣的AI加速晶片。在2019年就已經有獨立的邊緣AI晶片鎖定開發工程師,單價約80美元。而如果達到成千上百萬顆的量產,裝置製造商的採購成本會大幅降低,有些甚至可低至1美元(或是更少),而有些則需要幾十美元。現在,我們以智慧型手機邊緣AI晶片作為參考標準,假設邊緣AI晶片的平均成本約為3.50美元。
除了相對便宜之外,獨立的邊緣AI處理器還具有體積小的優勢,功耗也相對較低,僅為1W到10W之間。相比之下,一個由16顆GPU和兩顆CPU組成的資料中心叢集,雖然性能非常強大,成本將高達40萬美元,而且重量達到350磅、耗電達到10萬W。
利用這類已經問世的晶片,邊緣 AI可以為企業帶來更多新的可能性,尤其是在物聯網應用方面。透過使用邊緣AI晶片,企業可以大幅提升在連網裝置端進行資料分析的能力──不僅是收集資料──並將分析結果轉化為行動,從而避免了將大量資料傳送到雲端帶來的成本、複雜性和安全性挑戰。AI晶片可以幫助解決的問題包括:
資料安全和隱私
無論企業如何謹慎小心地保護資料,只要是收集、儲存並將資料傳送到雲端,都會不可避免地使企業面臨網路安全和隱私威脅;隨著時間推移,因應此一風險變得至關重要。世界各國紛紛訂定個資保護相關法規,消費者也逐漸意識到企業正在收集他們的各種資料,而有80%的消費者表示,他們認為企業沒有盡力保護消費者隱私。諸如智慧揚聲器之類的裝置開始在醫院等場合廣泛使用,這些場合對患者隱私的管理十分嚴格。
邊緣AI晶片可在本地處理大量資料,降低個人或企業資料被攔截或濫用的可能性。例如,具有機器學習處理能力的保全攝影機可以透過分析視訊來確定其中哪些部分相關,並只將這部分視訊傳送至雲端,從而降低隱私權洩露的風險。機器學習晶片還可以識別更廣泛的語音指令,從而減少需要在雲端進行分析的音訊。準確的語音辨識功能則有助於智慧揚聲器更精準識別「喚醒詞」,以避免聽到不相關的對話。
連網困難
裝置必須連網才能在雲端處理資料,但是在某些情況下,裝置連網是不切實際的。無人機就是一個例子,其運作位置可能使得維持其連網很困難,而且連網功能本身以及將資料上傳到雲端都會縮短電池壽命。在澳洲新南威爾斯(New South Wales, Australia)以配備嵌入式機器學習功能的無人機巡邏海灘,確保泳客安全;這些無人機不必連結網路就可以識別出被海浪捲走的泳客,或者警告泳客有鯊魚和鱷魚襲擊危險。
(太)大數據
物聯網裝置會生成大量數據。舉例來說,一架Airbus A-350噴射機配備6,000多個感測器,每日飛行航程會產生的數據量達到2.5 TB。在全球範圍內,保全攝影機每天生成的數據約2,500PB。將所有這些數據資料發送到雲端儲存和分析的成本高昂且複雜,將機器學習處理器放置於感測器或攝影機等終端裝置就可以解決這個難題。例如,可以在攝影機中配備視覺處理單元(VPU),也就是一種專用於分析或預處理數位影像的低功耗處理器SoC。借助嵌入式邊緣AI晶片,裝置可以即時分析資料,只有當相關資料需要傳送到雲端進一步分析時才會需要進行傳輸,這可大幅降低儲存和頻寬成本。
功耗限制
低功耗的機器學習晶片甚至可以讓AI運算在透過小型電池供電的裝置上執行,不會消耗過多電力。例如,Arm晶片可以嵌入呼吸器來分析資料,包括吸入肺活量和進入肺部的藥物流量。在呼吸器上完成的AI分析結果將傳送至智慧型手機應用程式,協助醫事專業人員為哮喘患者提供個人化醫療照護。
除了現在已有的低功耗邊緣AI NPU外,很多公司還致力於開發「微型機器學習」方案,也就是在微控制器單元之類的元件上實現深度學習。例如Google正在開發能讓微控制器分析資料的專用版本TensorFlow Lite,將需要發送到晶片外的資料壓縮為只有幾個位元組大小。
低延遲需求
無論是透過有線網路還是無線網路,在遠端資料中心執行AI運算都意味著往返延遲的存在,最佳情況下為1到2 毫秒(ms),最差情況則達到幾十甚至幾百毫秒。使用邊緣AI晶片在裝置端執行AI,可以將延遲降低到奈秒(nanoseconds)等級──這對於需要收集、處理資料並即刻採取行動的應用場景至關重要。
例如自動駕駛車輛必須透過電腦視覺系統收集並處理大量資料以識別物體,同時收集和處理來自感測器的資料以控制車輛各種功能;然後它們必須立即根據這些資料做出決策,像是何時轉彎、煞車或加速,以實現安全行車。為此,自動駕駛車輛必須自己處理在車輛中收集的大量數據。低延遲對機器人應用也很重要;隨著機器人逐漸出現在工廠環境並開始與人類協同工作,低延遲將變得越來越重要。
邊緣AI在大量數據應用至關重要
邊緣AI晶片的普及可能會為消費者和企業帶來重大變化。對消費者而言,邊緣AI晶片可以實現多種功能,從解鎖手機到與語音助理對話,甚至在極端困難的條件下拍攝出令人驚歎的照片,而這些應用都不需要連結網際網路。
但從長遠來看,邊緣AI晶片對企業應用的影響可能更大,它們將把企業的物聯網應用提升到一個全新的境界。由AI晶片驅動的智慧裝置將有助於擴展現有市場,衝擊現有企業,同時改變製造、建築、物流、農業和能源等產業的利潤分配。
收集、詮釋並立即根據大量數據資料採取行動的能力,對於那些仰賴大數據的應用至關重要;未來學家們預測,這類應用將被廣泛佈署,包括視訊監控、虛擬實境、自動駕駛無人機和車輛等等,而邊緣AI晶片就是讓各種裝置取得更高智慧的主角。
附圖:圖1:AI運算技術能佈署在不同位置。
(圖片來源:Deloitte Insights)
圖2:邊緣AI晶片市場規模預測。
(圖片來源: Deloitte Insights)
圖3:三星Exynos 9820的裸晶照片顯示,其中約有5%的面積為AI處理器。
(圖片來源:ChipRebel;注釋:AnandTech)
圖4:蘋果的A12仿生晶片約有7%的面積屬於機器學習的部分。
(圖片來源:TechInsights / AnandTech)
資料來源:https://www.eettaiwan.com/20200604putting-ai-into-the-edge-is-a-no-brainer-heres-why/?fbclid=IwAR3hRYuquNfTq5VzcEWYfqyJotBLBSp4PzLNyMackrs6V43r9NEMhRZ3Ap8
電腦視覺影像處理差別 在 [請益] 電腦視覺方向差別- 看板Soft_Job - PTT網頁版 的推薦與評價
大家好小弟目前上了台大電子所跟新竹資工興趣是電腦視覺大學時相關的課只修過C++ 資結邏輯設計目前有兩間 ... 硬體的會做比較多影像處理類吧,不確定深度學習跟晶片的. ... <看更多>
電腦視覺影像處理差別 在 Re: [請益] 放棄影像處理會不會比較好- Soft_Job - PTT Web 的推薦與評價
Re:[請益]放棄影像處理會不會比較好@soft_job,共有6則留言,5人參與討論 ... 等這些作業拚死拚活了也交了出去之後的論文就是實現一些電腦視覺的演算 ... ... <看更多>
電腦視覺影像處理差別 在 [心得] 系統軟體轉電腦視覺(ulsee/由田) - 看板Soft_Job 的推薦與評價
先說一下本魯的背景
113 資工 學 + 碩,碩論為行車紀錄器影像分析
三年工作經驗(研替),主要在做監控系統
本魯從監控系統的client、server、對外的SDK,都有開發經驗
下班後偶爾會上網找有興趣的課來聽(影像處理、電腦視覺、機器學習相關)
並且在coursera的機器學習跟影像處理兩門課當 Mentor (教學相長)
在退伍前半年開始接觸獵人頭找工作,談了自己的需求與目標薪水後
獵人頭推薦了幾家有機會達標的公司,
先約了兩間,所幸該獵頭給的清單中
最想去的第一間就面上了,所以本篇只有兩間的面試心得
=====================================================
愛唯秀(ulsee) 演算法工程師
內容:
這家專注在電腦視覺演算法(人臉追蹤、人臉辨識、AR、VR、ADAS)
目前商業模式以提供技術的B2B模式為主,而不是賣B2C的應用產品,
目前有和line、迪士尼合作。
面試過程蠻順利的
主要在問本魯過去工作上的開發經驗,以及當Mentor的經驗
至於我問的問題,則是工作內容、管理風格、加班強度之類
關於ML、CV的細節,並沒有問太深
PS:原本都做好上白板寫數學式子、推導 back propagation 的心理準備了 XD
結果: Offer get
=====================================================
由田新技 影像處理演算法工程師
內容:
這家是AOI設備商,所謂AOI是利用影像處理、電腦視覺配合一些打光
來找出產線成品的缺陷,目前合作比較大的是面板廠跟PCB廠
一開始寫了1.5小時的考題,有邏輯、專業、英文
邏輯就是一堆推理...沒什麼好說,就是給你一堆條件,要你推敲某件事情,花了40分鐘
寫完這部分,
專業部分倒是不難
像是bubble sort、字串反轉、C++的輸出(考你i++, ++i的優先權)
解釋 virtual function、function overloading、
template function、inline function、
class的public protected private、指標跟reference的差別
只有一題刁鑽了點,問你 windows API中的sendmessage()跟postmessage()的差別
這邊沒用過windows API的可能會不知道
至於其他題目即使是應屆畢業生,應該也答得出來,是個回復腦力的好時間
至於英文則有閱讀測驗和英文書信
寫完考卷後,就是和兩位技術主管與人資面試(三關)
第一關,面試內容聚焦在開發方面
問的問題環繞在我現在的工作內容,對於本魯過去改善效能的經驗特別有興趣
主管說他們的AOI軟體,效能要好除了懂演算法,也必須了解系統架構,才能找出適合該
系統的演算法
我進來的第一年會先幫忙調效能,從系統到演算法
接下來就是我問他問題,像是工作內容、管理風格、加班強度之類
至於前面寫的考卷則沒甚麼討論...
結束這一輪
第二關,面試內容聚焦在影像處理上
給了本魯兩個情境題
1. 畫了兩個三角形,其中一個很模糊,要怎找出這六個頂點
大概像這樣
2. 給了兩個像湯匙的東西,一個在中間有洞口,另一個在邊邊又缺口,問怎麼偵測此問
題
大概像這樣
這關的面試流程,大概就是我提一個想法,面試官要我能不能改進,循環幾次。
結果: 感謝函,對方說我技術沒問題,但本魯10月底研替才退伍,所以先把 headcount
給了別人
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.25.13.32
※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1506434514.A.EA5.html
這邊有我拿到 offer 那間的薪水範圍
https://www.zhipin.com/gongsi/r249323.html?ka=company-jobs
面試官沒跟我說正解...
這邊來說說我自己的想法
1. 我提出用 Otsu + median filter + corner detection
corner detection 或許可以換成 hough transform
2. morphological 後的圖和原本的相減做比較
或是切block後,再用傅立葉檢查是否有高頻資料
第二題我比較沒把握些,有大神鄉民可以出來指點嗎<(_ _)>
請問什麼是 data driven 的方法?
是只適用特定data的方法嗎?
就是把圖片切成好幾個小區塊,用DCT或傅立葉做線性轉換後
把頻率的資訊當feature
收集缺陷的資料當training data (AOI設備有定義產品能解決怎樣的缺陷)
不過面試官比較認同我用 |原圖二值化 - morphological處理的圖| 的方法
來檢查是否有缺陷
PS: 面試官沒跟我講他會用的方法
... <看更多>