#1922疫苗登記預約平台發生個資外露問題
#人民隱私權被侵犯政府是否準備賠償
#關貿號稱最大最專業為何出包不斷
民眾黨立委邱臣遠辦公室日前接到民眾投訴,號稱由天才IT大臣唐鳳設計規劃,並委託關貿網路公司製作的「COVID-19 公費疫苗預約」網站,因為網站設計有疏漏,明顯侵害民眾隱私權,任何人只要握有對方身分證資料及手機號碼,就可以直接在1922網站知道對方想預約哪種疫苗、是否已打過第一劑、已打過何種疫苗、打過第一劑的未來第二劑預約時間及種類。平台從7月6日上線已足足兩個月,民眾個資早就通通外洩!
#號稱天才專業卻犯個資外洩嚴重錯誤
「COVID-19 公費疫苗預約」網頁設計相當簡單,進入首頁後僅有「意願登記」及「預約接種」兩大項目,也僅有「查詢」、「登記/修改」、「預約」共3個按鍵。
民眾進行「登記/修改」、「預約」時都需要輸入雙證件或是身分證加收手機一次性OTP密碼,唯獨在「查詢」這項只要輸入身分證字號和手機號碼就可登入,
網路設計時為何要獨漏「查詢」無須雙重認證,實在令人不敢相信出自天才IT之手。
檢舉民眾非常恐慌公司人資就擁有這兩項個資,若有心人想查,資料不就被看光光!再加上國內詐騙集團手段不斷翻新,之前就常傳出大型網站被駭會員資料外流,若詐騙集團手上本就擁有民眾基本個資,更可以偽造1922網頁誤導民眾點擊,讓民眾有可能被網路釣魚和被植入勒索病毒。
#關貿公司得標無數卻出包不斷誰在包庇
關貿公司員工500人,每年都拿到高達數億政府公標案,並多為限制性招標。官網上這樣自我介紹:「展現卓越的團隊能量與深厚的專業實力,成功在短時間內整合金流、物流與商流,提供口罩實名制預購系統、振興三倍券、藝FUN券APP等服務,協助政府達到科技防疫與振興經濟之目標。」
關貿同時號稱自己是國內最大之應用軟體服務(ASP)供應業者,然而光是一個「COVID-19 公費疫苗預約」網站從上線之後就常常系統壅塞當機,現在再加上洩漏個資的嚴重錯誤,實在看不出號稱最大最專業的實力何在。
盤點「COVID-19 公費疫苗預約」幾次大出包事件
✅7/13開放第九類以及18歲以上民眾進行意願登記時,該系統網站與手機健保快易通都大當機
✅有民眾接獲1922簡訊後,已於7月16日到打完第一劑疫苗,7月27日開放第四輪疫苗預約接種,竟然又再度收到1922簡訊
✅7/27第四輪公費疫苗對象登記,原本預告會發送疫苗接種簡訊,給符合資格的民眾上網登記接種;因為PTT爆料「沒收到簡訊,符合資格直接預約就可以了」民眾大呼不公平
✅7月30日有民眾至新竹縣仁慈醫院欲施打第一劑AZ疫苗,未料現場醫護人員通知「1922平台出包,並未得到相關接種名單,衛生局也沒有配發到AZ疫苗」
✅8/9因系統錯誤不符預約資格的1500人意外搶到莫德納第二劑
✅8/14號稱太多人預約高端疫苗開放10分鐘內即當機
有媒體還透露,去年由關貿公司承攬的三倍券的系統開發光是驗證系統開發等等就耗費1億,如今五倍振興券上路確定,若同為關貿公司設計,就不應該再編列巨額開發預算,其他類似案件亦然。蔡政府從前瞻計畫到紓困預算處處浪費大撒幣,已經花掉人民一兆七千六百億,要知道這些錢都是人民辛苦工作的納稅而來,這個執政黨政府一路荒腔走板,人民歷歷在目,就算選舉快到了蔡政府才會醒過來假謙卑傾聽民意,人民的記性真的沒有那麼差!
勒索病毒種類 在 文茜的世界周報 Sisy's World News Facebook 的精選貼文
0702紐約時報
*【歐盟“電子疫苗護照”正式生效】
該護照將允許歐盟成員國的居民在完成疫苗接種的前提下更自由地出行,這對希望提振旅遊業的國家來說是一個期待已久的里程碑。但各國對何時何地由誰來核查仍未達成一致,其認證的疫苗種類也引發了一些摩擦,當前被接受的四種疫苗僅包括輝瑞、莫德納、阿斯特捷利康和嬌生。
https://www.nytimes.com/2021/07/01/world/europe/eu-digital-covid-certificates.html
*【緬甸政變後疫情急劇惡化,感染人數飆升】
翁山蘇姬此前的疫情遏制計畫被擱置,疫苗被優先供給士兵而非老人和醫護人員。緬甸正在為軍政府對大流行的忽視付出代價,根據軍政府公佈的數位,當前該國新冠檢測陽性率已達22%。專家指出,還有更多病例未被發現。更令人擔憂的是,該國與印度接壤的三個社區已經發現Delta變種。在已有大批醫護人員因抗議政變而罷工的情況下,緬甸的醫療保健系統可能會因疫情而崩潰。
https://www.nytimes.com/2021/07/01/world/asia/covid-myanmar-coup.html
*【嬌生公司稱疫苗可預防 Delta 變體】
嬌生公司報告說,即使在接種 8 個月後,嬌生公司的冠狀病毒疫苗對高度傳染性的 Delta 變體也有效。這一發現應該會讓 1100 萬接種疫苗的美國人放心。該公司表示,與對原始病毒的有效性相比,該疫苗對變體的效力略有下降。但是這種疫苗對Delta變體的效果,比在南非首次發現的Beta變體更有效,這種模式也出現在mRNA 疫苗中。
https://www.nytimes.com/2021/07/01/health/coronavirus-johnson-vaccine-delta.html
*【Covid-19實時更新】
#Delta變種正在蔓延的葡萄牙,在其最大的城市和旅遊中心重新實施了夜間宵禁。根據《紐約時報》數據庫,在過去 14 天裡,葡萄牙的平均每日病例數幾乎翻了一番,達到 1,600 多例,但仍遠低於1月每天超過 12,000 例的峰值。
科學家認為,Delta 變體的傳播性可能是冠狀病毒原始毒株的兩倍。大多數現有疫苗似乎對 Delta 變體有效,但專家表示,隨著新變體的傳播,需要顯著提高疫苗接種率並採取持續的預防措施來控制大流行。
#世界衛生組織表示,聚集在體育場館、酒吧和酒吧觀看歐洲錦標賽足球比賽的人群已推動整個歐洲的冠狀病毒病例增加,引發了對另一波病毒浪潮的擔憂。
#數據顯示,Delta變體並未推動英格蘭的住院率激增。儘管最近幾週冠狀病毒感染人數急劇上升,但住院率仍然很低。6月21日至6月27日,每週住院率為每10萬人1.9人,與前一周持平。
#美國整體上,無法達到拜登在7月4日提出的疫苗接種目標,但已經有20個州達標。
#非洲聯盟Covid-19問題特使,敦促歐洲放寬對疫苗製造商出口的限制,以便非洲國家可以購買更多劑量,並試圖阻止主要由更具傳染性的Delta病毒驅動的快速蔓延的第三波大流行
#印尼總統佐科威宣佈了對爪哇島和巴厘島部分地區的新限制,以遏制迅速蔓延的Delta病毒,包括關閉清真寺、學校、購物中心和體育設施。
https://www.nytimes.com/live/2021/07/01/world/covid-19-vaccine-coronavirus-updates?type=styln-live-updates&label=coronavirus%20updates&index=0&action=click&module=Top%20Stories&pgtype=Homepage
*【川普集團涉嫌稅務犯罪被起訴】
該集團被控在長達15年的時間內,通過隱瞞大額津貼和獎金來幫助其高管逃稅;該集團首席財務官AllenWeisselberg被控逃稅170萬美元,並面臨重大盜竊、稅務欺詐等其他指控,已向當局自首。川普本人沒有受到指控,但川普集團及其高管的被訴將把針對這名前總統的刑事調查帶到一個新的階段。
https://www.nytimes.com/2021/07/01/nyregion/allen-weisselberg-charged-trump-organization.html
*【川普沒有被起訴,但指控仍然威脅著他】
在所有的懷疑和預期之後,這並不是一個涉及俄羅斯的陰謀,廣泛的洗錢活動,也不是對敲詐勒索和腐敗的全面指控。相反,是一項調查揭露了所謂的濫用普通福利的行為,如租車、公寓和學校學費,讓川普的家族企業從房地產品牌帝國到刑事被告。這起針對前總統旗下企業的刑事案件,可能會給他的財政帶來打擊,而他仍然是紐約法院廣泛調查的焦點。
https://www.nytimes.com/2021/07/01/nyregion/trump-organization-indictment.html
*【美國提議15%全球最低稅獲130個國家支持】
世界各國朝大幅改革全球稅收計畫邁出關鍵一步,有130國和地區同意設定最低企業稅率,並對臉書和Google這類大型跨國企業的稅收分配規則達成共識。
經濟合作發展組織(OECD)歷經多年波折後,終於談成這項協議,為20國集團(G20)財長簽署原則性協議奠基。OECD表示,處理了稅務漏洞,將有上看1,500億美元的稅收。
https://www.nytimes.com/2021/07/01/business/global-minimum-tax.html
*【稱佛羅里達建築狀態良好的檢查員將接受調查】
Ross Prieto2018年11月向公寓業主保證,儘管諮詢工程師表示擔憂,但他們的建築似乎“狀態非常好”,這是調查人員在試圖確定導致6月24日失敗的原因時可能要審查的許多事項之一,造成至少18人死亡,140多人下落不明。至於是什麼導致了坍塌,目前還沒有什麼線索,專家們希望調查人員能夠研究一系列的潛在因素,包括推遲按照顧問的建議進行修復;設計或施工缺陷;地下土壤的任何問題;還有一種可能性是,一些外力(例如,一輛撞到地下停車場柱子上的車輛)可能影響了建築的一個關鍵結構部件
https://www.nytimes.com/2021/07/01/us/ross-prieto-surfside.html
*【拜登與倒塌事故中等待的親屬見面】
拜登總統週四花了三個小時慰問在邁阿密海灘附近倒塌公寓中遇難或失蹤者的家屬,由於擔心建築群的其他部分也可能倒塌,救援人員當天大部分時間先暫停搜尋,他們對痛苦的親屬說“等待是無法忍受的”。拜登在鄰近飯店舉行會面,他表示,和一位剛剛失去丈夫和小男孩的婦女坐在一起,她不知道該怎麼辦。另一個幾乎失去了整個家庭,看著他們,只能祈禱和懇求上帝讓奇蹟出現。
https://www.nytimes.com/2021/07/01/us/politics/miami-building-collapse-biden.html
*【威廉王子和哈利王子短暫重聚,為戴安娜王妃雕像揭幕】
週四,這對疏遠的王子擱置分歧,在倫敦肯辛頓宮出席了一個戴安娜雕像的揭幕儀式,紀念她的60歲冥誕。不過,這並非是一個和解時刻,威廉和哈利仍然幾乎沒有和對方說話。
https://www.nytimes.com/2021/07/01/world/europe/diana-statue-william-harry.html
*【華盛頓州和奧勒岡州與高溫有關的死亡人數攀升至近 100】
北美遭遇致命熱浪襲擊。近日以來,在美國的華盛頓州和奧勒岡州,與酷熱有關的死亡事件已攀升至接近100例。而從上週五到本週三下午,加拿大的不列顛哥倫比亞省至少報告了486例猝死事件,而該省往常的平均五日內猝死病例數為165 例。
https://www.nytimes.com/2021/07/01/us/heat-wave-deaths-oregon-canada-washington.html
勒索病毒種類 在 台灣物聯網實驗室 IOT Labs Facebook 的精選貼文
訓練AI模型,要多少數據?拆解企業人工智慧專案為何難落地
2020.12.09 by 若水AI Blog
企業導入AI似乎已成為一種趨勢,但是訓練AI模型,需要多少數據?其背後的商業命題與成本又該如何解決?帶你來一起窺探AI專案背後的秘密!
企業的AI專案在釐清問題本質、找到命題之後,首先會面臨到一個問題:收集數據(Data Collection)和建立AI模型(Model Establishing),該以什麼作為評估基準?
訓練一個AI數據模型,需要多少數據?
訓練AI數據模型時,其實有三個要素,彼此互相影響。分別是: 商業問題的複雜度 、 AI模型複雜度 (Model Complexity),以及 數據複雜度 (Data Complexity)。
因此,如果想知道需要多少訓練數據(Training Data),建議先釐清:這個AI專案到底要處理什麼問題,以及這個問題有多複雜?確定之後,再來判斷應該選用哪種程度的模型來做訓練。根據不同的商業命題複雜度,用不同複雜度的模型和精準數據彼此搭配,找出最佳平衡,才能讓AI專案順利落地。
但光憑想像,很難評估實際的AI數據量和成效,所以開始AI的第一步,需要先透過POC概念驗證(Proof of Concept)實驗來找答案。
簡單來說,就是針對不同複雜程度的商業問題,嘗試選用不同複雜度的模型搭配測試,直到模型跑出來的曲線,符合理想目標。
一般狀態下,假設商業問題本身的複雜度很高,我們會預期要選擇複雜度較高的模型。但是如果數據量不足,那麼選擇複雜度較高的AI模型,反而會比用簡單的AI模型效果還差。(上圖左上、右上,分別代表複雜度10和複雜度50的問題,可以明顯看出複雜的模型曲線比較接近學習數據集(Dataset),但是在測試數據集上的誤差 Eout,反而比簡單模型還差了許多。)
上圖的左下和右下,是以不同複雜度的模型去做POC,跑出來的結果曲線圖。藍色線代表的是學習數據(Training Data)成效,紅色線代表的是測試數據(Testing Data)成效。最理想的POC目標,應該是兩條曲線很貼近彼此,而且位置越低越好。
我們會發現,左下這張圖的兩條曲線雖然彼此貼近,但是就算增加數據,也無法降低誤差。這表示模型偏誤(Bias)高,效果不佳,應該要增加模型複雜度 (Model Complexity)。
增加模型複雜度之後,就會像右下這張圖,藍色曲線(學習數據)雖然數值很低,但在學習數據不足的情況下(灰色區塊),紅色曲線(測試數據)卻「飄」得太高。這表示模型變異誤差(Variance)高,應該要增加學習數據。最後在慢慢增加模型複雜度以及學習數據之後,我們就可以達到理想的結果(兩條曲線很貼近彼此,而且位置越低越好)。
數據哪裡來?發展AI人工智慧之前,先建立數據流
先前我在文章裡提到,很多企業會急著開發AI模型,但AI專案落地經驗的三大關鍵之一,其實是先確認:是否已經準備好數據了?如果沒有這樣的能力,談AI落地其實有點好高騖遠。
AI數據收集(Data Collection)最大的挑戰,在於針對不同型態的命題,會產生不同的AI數據需求,因此需要建立的「數據流」(Data Pipeline),AI數據處理 (Data Processing)和數據標註(Data Annotation)的模式及流程也會有所不同。
發展AI之前,如果能建立起從數據收集(Data Collection)、數據處理(Data Processing)到AI模型學習的數據流(Data Pipeline),並確保可以順暢運行,實際訓練AI模型時才會省力很多。
數據不夠或太多怎麼辦?
Google開設的機器學習(Machine Learning)課程中,第一項原則就開宗明義地指出:「Don’t be afraid to launch a product without machine learning」。
如果你的產品或業務不一定需要用到機器學習(Machine Learning),那就別用,除非你有AI數據。有數據,再來談機器學習(Machine Learning)。但在業界的實際狀況,大家不是沒有數據,而是只有一些些,這時候該怎麼辦?我會建議,先從小地方開始做起,也就是從POC專案著手。
POC專案要有具體成效,除了要注意設計專案、實驗模型的指標(Metrics),企業最重要的是要先定義清楚:AI專案要達到什麼樣的指標,才算是成功?這樣最後做出來的成果,才會真正符合商業目標。
如果今天不是沒有AI數據,而是數據很多,又該從何下手呢?
我建議,嘗試減少訓練AI人工智慧時的「 數據大小 」和「 數據筆數 」。
過去曾經處理過一個AI專案,數據多達2億筆。第一次實驗,把數據全部餵進AI模型,取得結果。第二次,只拿其中有代表性的500萬筆出來訓練人工智慧。
猜猜結果如何?兩次實驗的表現,只差異不到1%。
所以,如果企業對於AI數據的品質和數量有一定程度的自信根據,其實不用把數據全部餵進AI模型訓練(Model Training),只用有代表性的AI數據來訓練就可以了。市面上很多常見的AI工具(Cluster),可以做到這點,幫助省時省力。
AI模型訓練,記得校準商業目標
企業發展AI人工智慧的最終目的,還是希望能 達到商業目標,創造價值 。
所以,訓練AI模型時,團隊如果不知道如何判斷哪個指標,對AI模型學習來說比較重要,建議回歸初心,重新釐清「 這個專案想達到的商業目標是什麼 」。
比方,趨勢科技(Trend Micro)要開發一個能夠判斷電腦病毒的AI,但是勒索病毒(denial-of-access attack)和廣告病毒對客戶的傷害程度大不相同。這時候,工程師就會針對這個命題,餵給AI模型不同病毒種類的數據,讓它學會判斷不同病毒的重要性,分辨出哪些病毒比較嚴重不能有判斷錯誤,而哪些病毒比較無害,不一定要做到一百分。
最常見的訓練方法,是用成本函數(Cost Function)的方式,訓練完再回去調整AI模型的評分(Rating),用加扣分的方式,告訴機器它的學習表現是好是壞,做對就加分,做錯就扣分。
上述評分原則的制定,和企業的商業價值考量息息相關,所以一般在組織分工,會由PM專案團隊負責判斷哪些項目重要,請資料科學家設計在上述Cost Function裡面。
很多人以為,AI人工智慧開發要做到很完美才行,但其實根據我們的經驗,只要AI開發成本符合預算、AI模型表現可接受(大約做到60–70分),而且結果有助於降低成本,就可以算是達到商業目標。反過來,即使AI模型表現非常好(高達90分),但成本卻遠超出預算,就不建議執行。
另外,因為POC階段會做很多的實驗,需要拿兩個穩定且可以互相比較的基準做A/B Test,所以做好基礎建設非常重要。
如果一個團隊裡面有三位工程師,但三個人做出來的結果都無法互相比較,那麼這個實驗就會變得霧裡看花,導致AI專案難以落地。
AI數據小學堂:模型指標(metrics)
在做模型實驗時,通常會用混淆矩陣(Confusion Matrix)的四種指標:TP(True Positive)、TN(True Negative)、FP(False Positive)、FN(False Negative),以及Count、Unique和Accuracy等等函數,來判斷這個模型的表現好不好。
P或TN值,代表模型辨識的答案正確,和預期結果一致。例如:模型正確判斷出「這是一隻貓」、「這不是一隻貓」。而FP或FN值,則代表模型的判斷錯誤,例如「明明是貓,模型卻說不是貓」、「明明不是貓,模型卻說它是貓」。
附圖:AI模型 若水國際
AI模型的POC概念驗證實驗怎麼做?
資料來源:https://www.bnext.com.tw/article/60440/ai-strategy-04?fbclid=IwAR1SOhjjGxypdGgOGfaBIl_a1IsZFJAQZ8J2aeDd98spbUfOdg7hiPQP7UA