機器學習識別特徵阻絕代測 上鏈回送監理資料庫防竄改
人臉辨識加酒精鎖阻酒駕 串區塊鏈上傳比對告警
2021-05-24社團法人台灣E化資安分析管理協會元智大學多媒體安全與影像處理實驗室
本文將介紹酒精防偽人臉影像辨識系統,結合了人臉辨識、酒精鎖以及區塊鏈應用,以解決酒駕問題,並透過監控系統避免代測狀況發生。且利用區塊鏈不可修改的特性,將車輛與人臉資料串上區塊鏈,以確保駕駛人的不可否認性。
長長期以來「酒駕」都是一個很嚴肅且必須被重視的議題,儘管在2019年立法院修法酒駕及拒絕酒測的罰則,但是抱持僥倖心態的人還是數不勝數,導致因酒駕釀成車禍的悲劇還是一再重演,讓不少的家庭因此破滅。
據統計,從2015年到2018年的酒駕取締件數都逾10萬件,而因為酒駕車禍的死亡人數逾百人。在2019年酒駕新制上路以後,2020年警方酒駕取締件數有明顯下降至約6萬件,雖然成功達到嚇阻效果,但是死亡人數仍與去年前年持平,可見離完全遏止酒駕還有很長的路需要努力。
立法院於2018年三讀通過了「道路交通管理處罰條例部分條文修正案」,酒駕者必須重新考照,並且只能駕駛具有酒精鎖(Alcohol Interlock)的車輛,所謂酒精鎖,屬於車輛點火自動鎖定裝置,在汽車發動前必須進行酒測,通過才能將汽車發動,而且在每45分鐘至60分鐘後酒精鎖系統就會要求駕駛人在一定時間內進行重新酒測,以便防範在行車過程中有飲酒的情況發生,若駕駛人未遵守其要求,車子就會強制熄火並鎖死,必須回酒精鎖服務中心才能將鎖解開。
由於法案的方式無法完全遏止酒駕,因此許多創新科技或是企業致力於研究相關科技來解決酒駕的問題。
其中本田(Honda)汽車與日立(Hitachi)公司研發出手持型酒精含量檢測裝置,讓駕駛人必須在駕駛之前都先進行酒測,若酒精濃度超標就會將汽車載具上鎖,藉此避免酒駕意外或事故發生,且該技術結合了智慧鑰匙功能,若偵測到酒測值超標,車輛中的顯示面板將會發出警告訊號告知駕駛人,避免酒駕上路之問題。
另一方面則是解決酒精殘值之問題,因為有許多駕駛人都會認為,休息一下後,身體也無感到不適,即駕車出門,等到駕駛人被警方臨檢時才知道酒測未通過,因此收到罰單,甚至是吊銷駕照處罰等。
根據醫學研究指出,酒精是在人體體內由肝臟代謝,實際代謝時間必須看體質以及飲酒量而定。台灣酒駕防制社會關懷協會建議,喝酒後至少要10至20小時後再駕車比較安全。多數人無具備酒精代謝時間的觀念,導致駕駛人貿然上路,待意外發生或罰單臨頭時,已經為時已晚。
背景知識說明
本文介紹的方法為酒精鎖結合攝影鏡頭進行人臉辨識,並將人臉特徵資料與車輛資料串上區塊鏈,並利用區塊鏈不可篡改的特性,來避免駕駛人在解鎖酒精鎖時發生他人代測的問題。
由於人臉辨識技術具備防偽性、身分驗證的特性,因此將酒精鎖的技術結合人臉辨識,便可確認為駕駛本人。
何謂人臉辨識
人臉辨識技術屬於生物辨識的一種,基於人工智慧、機器學習、深度學習等技術,將大量人臉的資料輸入至電腦中做為模型訓練的素材,讓電腦透過演算法學習人類的面部特徵,藉以歸納其關聯性最後輸出人臉的特徵模型。
目前人臉辨識技術已經遍佈在日常生活之中,其應用面廣泛,最為常見的應用即為智慧型手機的解鎖、行動支付如LINE Pay、Apple Pay等,其他應用還包括行動網路銀行、網路郵局、社區大樓門禁管理系統、企業監控系統、機場出入關、智能ATM、中國天眼系統等。一般來說,人臉辨識皆具備以下幾個特性:
‧ 普遍性:屬於任何人皆擁有的特徵。
‧ 唯一性:除本人以外,其他人不具相同的特徵。
‧ 永續性:特徵不易隨著短時間有大幅的改變。
‧ 方便性:人臉辨識容易實施,設備容易取得,如相機鏡頭。
‧ 非接觸性:不須直接接觸儀器,也可以進行辨識,這部分考量到衛生問題以及辨識速度。
人臉辨識透過人臉特徵的分析比對進行身分的驗證,別於其他生物辨識如虹膜辨識、指紋辨識,無須近距離接觸,也可以精準地辨識身分,且具有同時辨識多人的能力。因應新冠肺炎疫情肆虐全球,人臉辨識技術也被用來管理人來人往的人流。人臉辨識的儀器可以搭配紅外線攝影機來測量人體體溫,在門禁進出管制系統中,利於提高管理效率,有效掌握到進出人員的身分,以及幫助衛生福利部在做疫調時更容易掌握到確診病患行經的足跡。
人臉辨識的步驟
人臉辨識的過程與步驟,包括人臉偵測、人臉校正、人臉特徵值的摘取,進行機器學習與深度學習、輸出人臉模型,從影像中先尋找目標人臉,偵測到目標後會將人臉進行預處理、灰階化、校正,並摘取特徵值,接著人臉資料交給電腦進行機器學習與深度學習運算,最後輸出已訓練好的模型。相關辨識的步驟,如圖1所示。
人臉偵測
基於Haar臉部檢測器的基本思想,對於一個一般的正臉而言,眼睛周圍的亮度較前額與臉頰暗、嘴巴比臉頰暗等其他明顯特徵。基於這樣的模式進行數千、數萬次的訓練,所訓練出的人臉模型,其訓練時間可能為幾個小時甚至幾天到幾周不等。利用已經訓練好的Haar人臉特徵模型,可以有效地在影像中偵測到人臉。
Python中的Dilb函式庫提供了訓練好的人臉模型,可以偵測出人臉的68個特徵點,包括臉的輪廓、眉毛、眼睛、鼻子、嘴巴。基於這些特徵點的資料就能夠進行人臉偵測,如圖2~4所示。圖中左上角的部分是偵測到的分數,若分數越高,代表該張影像就越可能是人臉,右側括弧中的編號代表子偵測器的編號,代表人臉的方向,其中0為正面、1為左側、2為右側。
人臉的預處理
偵測到人臉後,要針對圖片進行預處理。通常訓練的影像與攝影鏡頭拍出來的照片會有很大的不同,尤其會受到燈光、角度、表情等影響,為了改善這類問題,必須對圖片進行預處理以減少這類的問題,其中訓練的資料集也很重要:
‧ 幾何變換與裁剪:將影像中的人臉對齊與校正,將影像中不重要的部分進行裁切,並旋轉人臉,並使眼睛保持水平。
‧ 針對人臉的兩側用直方圖均衡化:可以增強影像中的對比度,可以改善過曝的影像或是曝光不足的問題,更有效地顯示與取得人臉目標的特徵點。
‧ 影像平滑化:影像在傳遞的過程中若受到通道、劣質取樣系統或是受到其他干擾導致影像變得粗糙,藉由使用圖形平滑處理,可以減少影像中的鋸齒效應和雜訊。
人臉特徵摘取
關於人臉特徵摘取,相關的技術說明如下:
‧ 歐式距離:人臉辨識是一個監督式學習,利用建立好的人臉模型,將測試資料和訓練資料進行匹配,最直觀的方式就是利用歐式距離來計算所有測試資料與訓練資料之間的距離,選擇差距最小者的影像作為辨識結果。由於人臉資料過於複雜,且需要大量的訓練集資料與測試集資料,會導致計算量過大,使辨識的速度過於緩慢,因此需要透過主成分分析法(Principal Components Analysis,PCA)來解決此問題。
‧ 主成分分析法:主成分分析法為統計學中的方法,目的是將大量且複雜的人臉資料進行降維,只保留影像中的主成分,即為影像中的關鍵像素,以在維持精確度的前提下加快辨識的速度。先將原本的二維影像資料每列資料減掉平均值,並計算協方差矩陣且取得特徵值與特徵向量,接著將訓練集與測試集的資料進行降維,讓新的像素矩陣中只保留主成分,最後則將降維後的測試資料與訓練資料做匹配,選擇距離最近者為辨識的結果。由於影像資料經過了降維的步驟,因此人臉辨識的速度將會大幅度地提升。
‧ 卷積神經網路:卷積神經網路(Convolutional Neural Network,CNN)是一種神經網路的架構,在影像辨識、人臉辨識至自駕車領域中都被廣泛運用,是深度學習(Deep Learning)中重要的一部分。主要的目的是透過濾波器對影像進行卷積、池化運算,藉此來提取圖片的特徵,並進行分類、辨識、訓練模型等作業。在人臉辨識的應用中,首先會輸入人臉的影像,再透過CNN從影像提取像素特徵並轉換成特定形式輸出,並用輸出的資料集進行訓練、辨識等等。
何謂酒精鎖
酒精鎖(圖5)是一種裝置在車輛載體中的配備,讓駕駛人必須在汽車發動前進行酒測,通過後才能將車輛發動。且每隔45分鐘至60分鐘會發出要求,讓駕駛人在時間內再次進行檢測。
根據歐盟經驗,提高罰款金額以及吊銷駕照只有在短期實施有效,只有勸阻的效果,若在執法上不夠嚴謹,被吊照者會轉變成無照駕駛,因此防止酒駕最有效的方法就是強制讓駕駛人無法上路,這就是「酒精鎖」的設計精神。
在本國2020年3月1日起酒駕新制通過後,針對酒駕犯有了更明確且更嚴厲的規定,在酒駕被吊銷駕照者重考後,一年內車輛要裝酒精鎖,未通過酒測者無法啟動,且必須上15小時的教育訓練才能重考,若酒駕累犯三次,要接受酒癮評估治療滿一年、十二次才能重考。
許多民眾對於「酒精鎖」議論紛紛,懷疑是否會發生找其他人代吹酒精鎖的疑慮,為防範此問題,酒精鎖在啟動後的五分鐘內重新進行吹氣,且汽車在行駛期間的每45至60分鐘內,便會隨機要求駕駛重新進行酒測,如果沒有通過測量或是沒有測量,整合在汽車智慧顯示面板的酒精鎖便會發出警告,並勸告駕駛停止駕車。
對於酒精鎖的實施,目前無法完全普及到每一台車子,而且對於沒有飲酒習慣的民眾而言,根本是多此一舉,反而增加不少麻煩給駕駛。若還有每45~60分鐘的隨機檢測,會導致多輛汽車必須臨時停靠路邊進行檢測,可能加劇汽車違規停車的發生頻率。
認識區塊鏈
區塊鏈技術是一種不依賴於第三方,透過分散式節點(Peer to Peer,P2P)來進行網路數據的存儲、交易與驗證的技術方法。本質上就是一個去中心化的資料庫,任何人在任何時間都可以依照相同的技術標準將訊息打包成區塊並串上區塊鏈,而這些被串上區塊鏈的區塊無法再被更改。區塊鏈技術主要依靠了密碼學與HASH來保護訊息安全,也是賦予區塊鏈技術具有高安全性、不可篡改性以及去中心化的關鍵。區塊鏈相關概念,如圖6所示。
區塊鏈的原理與特性
可以將區塊鏈想像成是一個大型公開帳本,網路上的每個節點都擁有完整的帳本備份,當產生一筆交易時,會將這筆交易廣播到各個節點,而每個節點會將未驗證的交易HASH值收集至區塊內。接著,每個節點進行工作量證明,選取計算最快的節點進行這些交易的驗證,完成後會把區塊廣播給到其他節點,其他節點會再度確認區塊中包含的交易是否有效,驗證過後才會接受區塊並串上區塊鏈,此時就無法再將資料進行篡改。
關於區塊鏈的特性,可分成以下四部分做說明:
1. 去中心化:區塊鏈其中一個最重要的核心宗旨,就是「去中心化」,區塊鏈採用分散式的點對點傳輸,該概念架構中,節點與節點之中沒有所謂的中心,所有的操作都部署在分散式的節點中,而無須部署在中心化機構的伺服器,一筆交易或資料的傳輸不再需要第三方的介入,因此又可以說每個節點就是所謂的「中心」。這樣的結構也加強了區塊鏈的穩定性,不會因為其中的部分節點故障而癱瘓整個區塊鏈的結構。
2. 不可篡改性:透過密碼學與雜湊函數的運用來將資料打包成區塊並上鏈,所有區塊都有屬於它的時間戳記,並依照時間順序排序,而所有節點的帳本資料中又記錄了完整的歷史內容,讓區塊鏈無法進行更改或是更改成本很高,因此使區塊鏈具備「不可篡改性」,並且同時確保了資料的完整性、安全性以及真實性。
3. 可追溯性:區塊鏈是一種鏈式的資料結構,鏈上的訊息區塊依照時間的順序環環相扣,這便使得區塊鏈具有可追溯的特性。可追本溯源的特性適用在廣泛的領域中,如供應鏈、版權保護、醫療、學歷認證等。區塊鏈就如同記帳帳本一般,每筆交易記錄著時間和訊息內容,若要進行資料的更改,則會視為一筆新的交易,且舊的紀錄仍會存在無法更動,因此仍可依照過去的交易事件進行追溯。
4. 匿名性:在去中心化的結構下,節點與節點之間不分主從關係,且每個節點中都擁有一本完整的帳本,因此區塊鏈系統是公開透明的。此時,個人資料與訊息內容的隱私就非常重要,區塊鏈技術運用了HASH運算、非對稱式加密與數位簽章等其他密碼學技術,讓節點資料在完全開放的情況下,也能保護隱私以及用戶的匿名性。
區塊鏈與酒精鎖
由於區塊鏈的技術具備去中心化、記錄時間以及不可篡改的特性,且更加強酒精鎖的檢測需要身分驗證的保證性。當進行酒精鎖檢測解鎖時,系統記錄駕駛人吹氣時間以及車輛的相關資訊,還有人臉特徵資料打包成區塊並串上區塊鏈。因此,在同一時間當監控系統偵測到當前駕駛人與吹氣人不同時,此時區塊鏈中所記錄的資料便能成為一個強而有力的依據,同時也能讓其他的違規或違法事件可以更容易進行追溯。
酒駕防偽人臉辨識系統介紹
為了解決酒精鎖發生駕駛人代測的問題,酒精鎖產品應導入具有身分驗證性的人臉辨識技術。酒駕防偽人臉辨識系統即為駕駛人在進行酒精鎖解鎖時,要同時進行人臉辨識,來確保駕駛人與吹氣人為同一人。
在駕駛座前方的位置會安裝攝影鏡頭,作為駕駛的監控裝置。進行酒測吹氣的人臉資料將會輸入到該系統中的資料庫儲存,並將人臉資料以及酒測的時間戳記打包成區塊串上區塊鏈,當汽車已經駛動時,攝影鏡頭將會將當前駕駛人畫面傳回系統進行人臉比對驗證。如果驗證成功,會將通過的紀錄與時間戳一同上傳至區塊鏈,若是系統偵測到駕駛人與吹氣人為不同對象,系統將發出警示要求駕駛停車並重新進行檢測,並同時將此次異常的情況進行記錄上傳到區塊鏈中。
如果駕駛持續不遵循系統指示仍持續行駛,該系統會將區塊鏈的紀錄傳送回給開罰的相關單位,並同時發出警報以告知附近用路人該車輛處於異常情況,應先行迴避。且該車輛於熄火後,酒精鎖會將車輛上鎖,必須聯絡酒精鎖廠商或酒精鎖服務中心才能解鎖。相關的系統概念流程圖,如圖7所示。
區塊鏈打包上鏈模擬
在進行酒測解鎖完畢以及進行人臉資料儲存後,會透過CNN將影像轉換輸出成128維的特徵向量作為人臉資料的測量值,接著將128個人臉特徵向量資料取出,並隨著車輛資訊一起打包到同一個區塊,然後串上區塊鏈。取出的人臉特徵資料,如圖8所示。
要打包成區塊和上鏈的內容,包括了人臉特徵資料、車牌號碼、酒測解鎖時間點等相關輔助資料,接著透過雜湊函數將相關的資料打包成區塊。以車牌號碼ABC-1234為例,圖9顯示將車輛資料和人臉資料進行區塊鏈的打包,並進行HASH運算。
將人臉資料和車輛相關資料作為一次的交易內容,並打包區塊,經過HASH後的結果如圖10所示,其中prev_hash屬性代表鏈結串列指向前一筆資料,由於這是實作模擬情境,並無上一筆資料,其中messages屬性代表內容數,一筆代表車牌資料,另一筆則為人臉資料。time屬性則代表區塊上鏈的時間點,代表車輛解鎖的時間點。
情境演練說明
話說小禛是一間企業的上班族,平時以開車為上下班的交通工具,他的汽車配置了酒駕防偽影像辨識系統,以下模擬小禛下班後準備開車的情境。
已經下班的小禛今天打算從公司開車回家,當小禛上車準備發動車子時,他必須先拿起安裝在車上的酒測器進行吹氣,並將臉對準攝影鏡頭讓系統取得小禛的人臉影像。小禛在汽車發動前的人臉影像,如圖11所示。
待攝影鏡頭偵測到小禛的人臉後,接著系統便會擷取臉上五官的68個特徵點,如圖12所示。然後,相關數據再透過CNN轉換輸出成128維的特徵向量作為人臉資料的測量值,如圖13所示。
酒精鎖通過解鎖後,車輛隨之發動,解鎖成功的時間點將會記錄成時間戳記,隨著影像與相關資料串上區塊鏈。在行駛途中,設置在駕駛座前方的鏡頭將擷取目前駕駛的人臉,以取得駕駛人的128維人臉特徵向量測量值,並且與汽車發動前所存入的人臉資料進行比對,藉以判斷目前的駕駛人與剛才的吹氣人臉是否為同一位駕駛。當驗證通過後,也會再將通過的紀錄與時間戳上傳至區塊鏈中,如此一來,區塊鏈的訊息內容便完整記載了這一次駕車的紀錄,檢測通過的示意圖如圖14所示。
系統通過辨識後,便確認了駕駛人的身分與吹氣人一致。且透過時戳的紀錄和區塊鏈的輔助,也確保了駕駛的不可否認性。若有其他違規事件發生時,區塊鏈的紀錄便成為一個強而有力的依據來進行追溯。
如此一來,便可以預防小禛喝酒卻找其他人代吹酒測器的情況發生。在駕駛的途中,如果有需要更換駕駛人,必須待車輛靜止時,從車載系統發出更換駕駛要求,再重新進行酒測以及重複上述流程,才可以更換駕駛人。如果沒有按照該流程更換駕駛,系統將視為異常情況。
結語
酒駕一直是全球性的問題,將有高機率導致重大交通事故,造成人員傷亡、家庭破碎,進而醞釀後續更多的社會問題,皆是酒駕所引發的不良效益。為了解決酒駕的問題,各個國家都有不同的酒駕標準或是法律規範,但是大部分國家的規範和制度都只有嚇阻作用卻無法完全遏止。在不同的國家防止酒駕的方式不盡相同,有的國家如新加坡,透過監禁及鞭刑來遏止酒駕犯,又或者是薩爾瓦多,當發現酒駕直接判定死刑,這樣的制度雖嚇阻力極強,但是若讓其他國家也跟進,會造成違憲或是違反人權等問題。因此,各國都在酒駕的問題方面紛紛投入研究,想要達到零酒駕的社會。
為達成此理想,本文介紹了基於區塊鏈的酒駕防偽辨識系統,利用酒精鎖搭配人臉辨識技術以及區塊鏈技術,使有飲酒的駕駛人無法發動汽車。且該系統搭載在行車電腦中,結合攝影鏡頭的監控對駕駛進行酒測防制管理,將人臉資料、酒精鎖、解鎖時間點與相關資訊打包成區塊並上鏈。基於區塊鏈技術內容的不易篡改,可加強駕駛人的不可否認性,當汽車發生異常情況時,便能利用有效且可靠的依據進行追溯。人工智慧和物聯網時代已經來臨,透過酒駕防偽辨識系統來改善酒駕問題,在未來能夠普及並結合法規,智慧汽車以及智慧科技的應用將會帶給人們更安全、更便利的社會。
附圖:圖1 人臉辨識的步驟。
圖2 人臉特徵點偵測(正臉)。
圖3 人臉特徵點偵測(左側臉)。
圖4 人臉特徵點偵測(右側臉)。
圖5 酒精鎖。 (圖片來源:https://commons.wikimedia.org/wiki/File:Guardian_Interlock_AMS2000_1.jpg with Author: Rsheram)
圖6 區塊鏈分散式節點的概念圖。
圖7 系統概念流程圖。
圖8 取出人臉128維特徵向量。
圖9 儲存車輛相關資料及人臉資料到區塊。
圖10 HASH後及打包成區塊的結果。
圖11 汽車發動前小禛的人臉影像。
圖12 小禛的人臉影像特徵點。
圖13 小禛的人臉特徵向量資料。
圖14 系統通過酒測檢測者與駕駛人為同一人。
資料來源:https://www.netadmin.com.tw/netadmin/zh-tw/technology/CC690F49163E4AAF9FD0E88A157C7B9D
排序演算法應用 在 Facebook 的最讚貼文
醫療健康是現階段AI绝佳的應用場景
今年開始我分享比較多醫療相關的文章,特別最近台灣疫情仍在緊繃狀態,分享這篇我談 AI 在醫療健康領域能創造哪些價值,提供大家參考。
最近,我出席了第五屆醫療健康產業投資50人的「H50年度峰會」,就「人工智能醫療醫藥領域的應用機遇與挑戰」進行一場主題演講。我認為,傳統產業「+AI」的時代已經到來,AI將像電一樣穿透各行各業為其降本提效,創造巨大的經濟價值。醫療健康是現階段AI絕佳的應用場景。創新工場將結合自身TECH VC基因,以醫療市場化、數字化及AI應用等方向為切入口,一起探索發掘醫療產業重塑的機會。
以下是來自峰會的現場報導,文章經21世紀經濟報導授權轉載。
「多年前,如果你問我人工智能最好的應用會是什麼,我可能在不同的時期會說是語音識別或者計算機視覺、自動駕駛、金融領域。但今天如果你問我這個問題,我覺得人工智能最好的應用場景,毫無疑問是醫療的場景。」李開復說。
也正因如此,創新工場在兩年多前設立了醫療投資團隊。這個團隊從2019年起以醫療市場化、數字化及AI應用等方向為切入口,目前已經投資了鎂信健康、艾登科技、英矽智能、沃比醫療、予果生物等20多個項目,涵蓋了數據AI、服務、器械、生物製藥等多個領域。
「隨著團隊的擴張,現在醫療投資團隊已經比人工智能團隊還要大了。創新工場將按照原有Tech VC 基因結合度,搭建醫療生物領域專業化團隊,接下來的1到2年,醫療技術領域的投資將是我們的重中之重,我們會把火力集中在IVD(In Vitro Diagnositcs)體外檢測和高值耗材兩個大賽道。」李開復說。
本次分享中,李開復談到人工智能發展的現狀、深度學習的要點及相關要求,同時,重點給大家分享了AI在病理分析、藥物研發、大數據、以及其他特定領域與場景的應用場景,並結合創新工場在醫療AI投資方面的實踐,給參會嘉賓提供了相關建議。
▎AI賦能傳統行業的時代已經到來
李開復認為,現階段能夠做AI的科學家和工程師數以百萬計,AI技術已經普及化。在過去的人工智能1.0時代,大家把AI當「黑科技」,可能最開始並不知道技術具體能創造什麼價值,就先投資進去公司,再幫牠找應用。
但現在情況已經發生改變,AI賦能傳統產業的時代到來,這裡所謂的「傳統行業」並不是說真的很傳統,而是指任何沒有AI的行業,其中也包括醫療產業。
人工智能發展到今天已有60多年歷史,李開復認為其中最重要的成果是深度學習技術的發明。對此,他總結出了深度學習最重要的四個特點。首先,深度學習能夠針對一個目標函數優化到最佳,如識別腫瘤的正確率;其次,數據量越多,結果越好;第三,千人千面,運營在醫療領域可以根據不同患者的家庭背景、基因等信息精準醫療;第四,文字、圖像、視頻等不同數據都可以作為深度學習的內容。這是此前人工智能算法做不到的,因而近年來深度學習取得了很多突破。
李開復也指出了深度學習需要滿足的五點要求:
第一,需要海量的數據;
第二,數據不能是網上爬來的,而是客觀、精準、自動地標註或打好標籤;
第三,只能在單一領域內工作;
第四,需要比較大的計算力;
第五,需要一些AI專家的參與。 AI擅長運用海量數據針對目標函數進行優化,但無法取代人抽象、分析、嘗試的能力和創造力。
至於AI是否適合用在醫療領域,李開復認為,當下醫療領域正在開始產生海量的數據。可穿戴設備、新的醫療方法、基因排序等都提供了多樣化的數據來源,他對AI+醫療的未來有非常大的信心。
但同時他也提到,AI+醫療在當前的發展過程中遇到了一些問題。首先,AI不擅長做「全科大夫」,只能解決某一特定領域的問題,不可過份神話這一技術。其次,傳統醫療需要的是小而精的數據,而AI對數據的要求是海量、結構化、精準化、閉環,因而現成的數據無法完全滿足AI的需求。
此外,李開復指出,醫療是非常神聖的,關乎人的生命與健康,與金融領域、互聯網領域不同。AI+醫療特別要尊重客戶和他們的服務或產品引進方式,而不是盲目教育市場。很多AI科學家創業會把醫療領域想得過於簡單,而李開復建議創業者需要用更嚴謹的方法適應醫院的採購流程,讓醫院現有的負責人意識到AI技術是在幫助他們,而非取代他們。
▎AI+醫療的細分落地場景
李開復認為,目前AI+醫療在一些細分領域有很多具體的落地場景。第一,病理方面有特別巨大的需求。每年會有成千上萬的病理樣本產生,而註冊的病理醫生缺口則很大。在這方面AI雖然不能做最終判斷,但可以幫助更好的篩選,提供更好的建議。
第二是藥物研發方面,最近國際上已經有了一些成果,如美國一家公司做的蛋白質折疊,以及創新工場所投資的 Insilico Medicine英矽智能,已經開始用AI技術幫助科學家發現新藥。 AI技術的加入可以幫助節約90%的新藥研發時間,對未來製藥行業會帶來很大的顛覆。
第三是大數據與AI的結合,近年來有各種新數據產生,如基因、轉錄、蛋白、代謝等等,都可以用來做新的分析,創作更多新的應用和價值,針對每個患者背景做出更精準的診斷。
此外,李開復還提到在骨科手術、神經介入、種植牙等領域,AI都可以創造價值。
AI+醫療是創新工作的醫療團隊所關注的方向之一。創新工場借助自身的AI工程院以及在AI、醫療領域的深入研究,擁有較為豐富的專業知識。李開復認為,做AI最重要的是有海量數據,創新工場會關注真正數據源頭的掌握者,獲得脫敏數據後再思考如何激活,如何做出新的產品,產生更大的價值。此外,團隊也願意接觸一些產業投資人和產業公司,因為這些人更懂醫療的具體流程,大家的合作將產生價值。
排序演算法應用 在 唐家婕 - Jane Tang Facebook 的最讚貼文
【中國振華數據搜全球240萬「重要人士」個資 臺灣名單首次曝光】
【#馬英九、#宋楚瑜、外交部長 #吳釗燮、國安局副局長皆上榜】
中國深圳振華數據公司(Zhenhua Data)洩漏資料顯示,這家與中國人民解放軍及中共安全情報系統有關連的中國公司,建立了約240萬「全球有影響力人士」(OKIDB)的個人數據庫。
昨天跟我同事Mia拿到與台灣有關的名單,疏理如下:
▫️報導全文:https://www.rfa.org/mandarin/yataibaodao/junshiwaijiao/jt-09142020110020.html
▫️QA全文:https://www.rfa.org/mandarin/yataibaodao/meiti/cm-09152020113802.html
—
▪️👀臺灣近3000政商名流遭監控 #馬英九、#宋楚瑜、#吳釗燮 上榜
自由亞洲電台取得相關資料疏理後發現,有至少2900名台籍人士在數據庫內,包含臺灣前總統馬英九、親民黨主席宋楚瑜、外交部長吳釗燮、台積電董事長張忠謀的夫人 #張淑芬、國安局副局長 #胡木源、李登輝孫女 #李坤儀、前國安局長楊國強等人,他們的基本個人資料包括家庭位址、生日、電子郵箱、婚姻狀況、照片、社交媒體帳號、最新法庭文件與犯罪記錄,都記錄在數據庫內。
臺灣民主實驗室執行長吳明軒告訴本台:「這些可能是這幾年來中國在利用的、各個不同層面資訊作戰的整合,是一個重要的直接證據。」
本台沒有訪問完整的 「全球有影響力人士」(OKIDB)數據庫的許可權,但得到與臺灣有關的基本資料原始格式檔,為搞清楚中國企業如何搜集海外人士的資料提供了線索。
▪️沈伯洋:數據庫相對小 更像是「#統戰」工作情報搜集
長期研究中共資訊戰的臺北大學犯罪學研究所助理教授沈伯洋告訴本台表示,在他看來,這份數據庫最有意義的三點分別是如何對這些「重要人物」進行人格分析、如何進行「重要性排序」、以及如何情搜布建「交友網路」。
鑒於臺灣的數據庫相對小、且鎖定的人物鮮少異見人士,沈泊洋認為這與「統戰」工作更有關,接案的振華公司也可能是非常週邊的接案單位。
沈伯洋:「240萬筆資料以全世界來講(用來作資訊戰操作)太少了。如果是臺灣240萬可能都嫌少,他比較像是重要人物的社會網路圖,我會覺得或許跟國安、公安系統的關聯更小,會跟統戰、解放軍關係比較大一點。」
一位在美國的資安專家在審查相關數據後告訴本台,這份數據庫由於大量依賴公開信息的搜集,「情報質量有限」。
不過,「數據庫的曝光有助於外界認知中共及週邊組織正在合作建構中國境外的個人情資數據庫,讓更多人知道中共在情報活動上的積極度和威脅性。」
上述人士表示,以資安人員來看,更感興趣的是中國公司如何搜集10%-20%非公開的資訊,以及如何將企業搜集的資料與情報部門連接創建數據庫。
▪️👩🏻✈️240萬資料如何被洩漏?
數據庫由中國境內人士在今年初洩露給駐越南的美國學者克裡斯•鮑爾丁(Chris Balding),鮑爾丁原在北京大學滙豐商學院教課近10年,因批評中國學術及言論審查,於2018年遭解聘。
鮑爾丁告訴自由亞洲電台,近幾年他在追蹤華為相關的中國科技監控議題,已看過幾次相關數據庫,但直到今年初才拿到這份完整資料。他找了Internet 2.0創辦人波特 (Robert Potter)一起復原並疏理資料,最終下載並重建了約10%的完整數據庫,估計約有1TB的文本。
鮑爾丁訂於9月14日發表研究報告,卻在發表前收到安全警告,緊急返美。
鮑爾丁:「有兩個不同政府的工作人員建議我,當這個報告出來的時候,不要在越南。我被告知中國特工在越南很活躍,我可能有人身安全風險。」
鮑爾丁的報告僅5頁,以分析資料從何而來、可能如何被利用為主。他把數據庫再分享給美國、澳洲、英國、印度、日本等幾個不同國家的媒體,由當地記者追蹤詳細的「上榜」名單。
在恢復的24萬份記錄中,有約5.2萬條涉及美國人,此外還涉及3.5萬名澳大利亞人、1萬名印度人、9700名英國人、5000名加拿大人、2900名台灣人、2100名印尼人和1400名馬來西亞人。
▪️🧶哪些資料被搜集? 又如何被應用?
鮑爾丁的研究估計,這些資料有八成至九成都來自公開資料,比如個人在社交媒體臉書、推特、Linkedin、Instagram上的足跡,但也有非公開信息如銀行帳號、工作申請記錄和心理分析檔案等。
正在研究中國人工智慧及科技監控相關議題的美國維吉尼亞大學傳媒教授孔安怡(Aynne Kokas)告訴自由亞洲電台,這類資料搜集最常被使用在三個方面,第一是訓練軍用或商用的人工智慧演算法,第二是資訊戰,第三則是鎖定特定人員作情報工作。
本台在兩千多筆台灣的數據庫中發現,大多詳細記錄個人最新的法庭記錄,比如走私、貪腐、收賄等各種細節。鮑爾丁說,他們在其他國家也發現這個特性。
鮑爾丁:「第一點是我們發現他們在搜集各國組織犯罪者的資料,第二是像你說的法庭文件。我們只能猜測,他們要列出可能可以影響一個人的方方面面,除了要有完整的個資背景、還要瞭解他們的脆弱性,特別在金錢及法律問題上,這都能成為中共潛在影響(滲透)的工具。」
孔安怡還提到,這次中國企業監控資料洩漏對於美國正在進行的中國軟體禁令辯論也有影響。
孔安怡:「以現在圍繞抖音TikTok禁令的辯論來說,很多人不知道為什麼這些短視頻怎麼會影響國家安全。大家沒有意識到中國政府其實可以用很簡單的個人訊息,結合多個平台資料去造出一個更複雜的情報資訊。」
▪️🇨🇳振華跟中國官方有什麼聯繫?
鮑爾丁強調,目前沒有中國政府直接控制振華數據庫的證據。不過,根據振華公司網站及微信公號,有大量證據顯示振華與中國政府及解放軍有進行合作。
公開記錄顯示,振華公司成立於2017年,由一位名叫王雪峰的前IBM工程師持有多數股權,目前在深圳的一個科技孵化器和北京西北部的一個辦公園區內運營,投保員工數為17人。
本台嘗試聯繫王雪峰及振華公司,至截稿並無回應。
振華已將公司網站及微信公號「99局」撤下。但本台流覽相關文章發現,振華把自己行銷成與中國國安系統及解放軍關聯緊密的公司,他們探討的話題包括如何運用監控軍人的社媒活動來預測軍事活動、「混合戰」、「基因戰」、以及如何利用西方社交媒體平台搜集公開信息。
鮑爾丁告訴本台,很多人或許會拿美國公司也在搜集數據來作比較,但不同之處在於中國政府對於民營企業的控制能力,「數據一到了中國,是完全沒有隱私可言的」。
「我們放出報告及數據庫的原因更是希望大眾知道這類的(中國搜集海外個人資料)行為正在發生。」鮑爾丁說,「開放的自由民主國家的個人和機構,應該要更加意識到,中國共產黨和國家安全情報單位正在進行的不對稱資訊戰和對海外人士隱私權的侵犯。」
▫️報導全文:https://www.rfa.org/mandarin/yataibaodao/junshiwaijiao/jt-09142020110020.html
▫️QA全文:https://www.rfa.org/mandarin/yataibaodao/meiti/cm-09152020113802.html
▫️鮑爾丁報告:https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3691999
--
其他「上榜」名單:
//記者:裡面並沒有蔡英文和韓國瑜。其實許多名單都很令人吃驚,像是街口支付執行長 #胡亦嘉、李登輝孫女 #李坤儀、閃靈樂團團長,立委林昶佐的妻子 #葉湘怡、主播 #夏嘉璐,甚至藝人 #吳克群 都有在名單內。另外有許多立委、政商界人物、民運人士,譬如立委 #蔡易餘、 #翁重鈞,前立委 #沈智慧、#沈富雄、#段宜康、台獨鬥士 #蔡丁貴、前台聯主席黃昆輝、法務部綜合規劃司長林麗瑩、前台灣高鐵董事長 #殷琪、金美齡、前考試院長伍錦霖、,名單內國民兩黨都有。這些人之前捲入的官司也有被詳細記載,像是前立委 #李慶安、前台南市長 #許添財。另外也包含一些已經過世的人士,譬如嚴家淦、白冰冰前夫梶原一騎。//
排序演算法應用 在 JavaScript 學演算法 - 竹白記事本 的推薦與評價
合併排序(Merge Sort) 又稱為歸併排序,是建立在合併操作上的一種有效的排序演算法,是採用分治法的一個非常典型的應用。 JavaScript 學演算法(九)- 合併排序 ... ... <看更多>
排序演算法應用 在 loyiCodes #17:常見的排序演算法——氣泡排序(Bubble Sort) 的推薦與評價
... <看更多>