資料清理,是 AI 模型建立時超級重要的前期基礎,往往會耗費大量時間成本與人工來投入,對資料科學家來說更是一大負擔,如果能將這些工作簡化,能為企業帶來哪些好處?
「資料科學的建模基礎」的推薦目錄:
- 關於資料科學的建模基礎 在 TechOrange 科技報橘 Facebook 的最佳貼文
- 關於資料科學的建模基礎 在 文茜的世界周報 Sisy's World News Facebook 的最讚貼文
- 關於資料科學的建模基礎 在 台灣物聯網實驗室 IOT Labs Facebook 的精選貼文
- 關於資料科學的建模基礎 在 Re: [心得] 自學AI資源分享- 看板DataScience - 批踢踢實業坊 的評價
- 關於資料科學的建模基礎 在 旗標知識講堂- 《資料科學的建模基礎 - Facebook 的評價
- 關於資料科學的建模基礎 在 資料科學基礎(五):了解數據分析建模與常見的演算法 的評價
- 關於資料科學的建模基礎 在 資料科學數學 :: 全台大學開課課程資訊網 的評價
資料科學的建模基礎 在 文茜的世界周報 Sisy's World News Facebook 的最讚貼文
0507新加坡聯合早報
*【專家:病毒傳播率高 印度發生第三波疫情無可避免】
印度政府首席科學顧問拉加萬表示,鑒於目前冠病病毒傳播率居高不下,印度將不可避免發生第三波疫情。他說,目前尚不清楚第三波疫情發生的時間和規模,但應該為此做好準備。印度目前遭受第二波疫情衝擊。根據印度衛生部週四公佈的資料,過去24小時再增3980起死亡病例,累計死亡病例已破23萬起;新增確診病例41萬2262起,單日新增確診病例已連續兩周超過30萬起。
https://www.zaobao.com.sg/news/world/story20210507-1144859
*【世衛:非洲恐面臨第三波疫情】
世界衛生組織(WHO)警告,由於冠病疫苗供應受到延誤、接種運動進展緩慢以及新變種冠病病毒的出現,非洲恐將面臨新一波疫情。聯合國駐非洲機構發表聲明說,非洲在接種冠病疫苗方面遠落後於世界上其他地區。聲明說:“印度血清研究所為非洲生產的疫苗延遲運出、疫苗接種部署進度也延緩,加上新變種病毒的威脅,非洲出現新一波疫情的風險依然非常高。”
https://www.zaobao.com.sg/realtime/world/story20210507-1144980
*【巴西累計冠病確診人數破1500萬】
巴西衛生部6日通報,過去24小時增加7萬3380起確診病例和2550起死亡病例。至此,巴西累計確診病例超過1500萬起,累計死亡病例達41萬6949起,染疫人數在全球排在美國和印度之後,死亡人數僅次於美國。
https://www.zaobao.com.sg/realtime/world/story20210507-1144974
*【馮德萊恩:歐盟準備討論美國有關豁免疫苗專刊保護的計畫】
歐盟委員會主席烏爾蘇拉·馮德萊恩表示,歐盟準備討論美國有關豁免對冠病疫苗智慧財產權保護的提議。馮德萊恩在義大利佛羅倫斯舉行的一次線上會議上說,歐盟準備以有效和務實的方式討論可以解決危機的任何提議。她說:“這就是為什麼我們準備討論,美國有關豁免冠病疫苗智慧財產權保護的提議如何有助於實現該目標的原因。” 馮德萊恩補充說,然而,從短期來看,所有疫苗生產國都應允許出口,並避免採取破壞供應鏈的措施。
https://www.zaobao.com.sg/realtime/world/story20210506-1144809
*【應對危機非常措施 拜登:美國支持放棄對疫苗智慧財產權保護】
美國總統拜登宣佈,美國支持放棄對冠病疫苗相關智慧財產權的保護,表明這是在全球疫情大流行危機下,必須採取的特殊和非常措施。拜登被指屈服于民主黨國會議員和全球百多個國家日益增大的壓力,作出支持疫苗智慧財產權豁免的決定,此舉讓製藥公司感到憤怒。生產冠病疫苗的藥劑公司包括兩家最大的疫苗製造商輝瑞和莫德納的股價當天都下跌。
https://www.zaobao.com.sg/news/world/story20210507-1144857
*【BioNTech:疫苗專利保護不阻礙生產和供應】
德國生物技術公司BioNTech表示,冠病疫苗的專利保護不會阻礙其與輝瑞公司合作開發冠病疫苗的生產或供應。BioNTech聲明中表示,“專利不是我們疫苗生產或供應的限制因素。它們不會在短期和中期內增加全球疫苗劑量的生產和供應。” 實際上,阻礙疫苗生產過程的問題在於製造工廠的設立、原材料採購,以及適合的工作人員。該公司警告:“如果不滿足這些要求中的任何一項,製造商或疫苗研發者都無法確保疫苗的品質、安全性和有效性。這可能會使疫苗的品質受到威脅。”
https://www.zaobao.com.sg/realtime/world/story20210506-1144826
*【疾控中心:若按計劃維持接種率和防疫措施 美新增確診病例到7月或急劇下降】
美國疾病控制與預防中心(CDC)的研究預測,若能按計劃維持疫苗接種率和防疫措施,到了7月,美國新增冠病確診病例可能會急劇下降。為“吸引”民眾接種疫苗,一些州還推出“利誘”措施。該中心週三公佈發病率和死亡率週報,研究人員利用情景建模技術展示對新增病例、住院和死亡人數等潛在趨勢的長期預測。
https://www.zaobao.com.sg/news/world/story20210507-1144858
*【澳洲5月15日重啟印度撤僑行動】
莫里森7日表示,澳洲政府將從5月15日起,派包機到印度接回目前仍滯留當地的澳洲公民。莫里森補充說:“我們原先的決定是在5月15日前落實生物安全指令,這個決定證明非常有效。這項指令將在5月15日前全面執行,不會有任何改變。”
https://www.zaobao.com.sg/realtime/world/story20210507-1144973
*【澳洲說國際邊界或無法在明年年中前全面開放】
澳洲貿易部長特漢表示,澳洲可能得等到2022年年中或2022年下半年才能全面開放國際邊界。這一消息對航空公司和旅遊業來說肯定是個壞消息。特漢(Dan Tehan)接受天空台訪問時說:“最樂觀的預測是在明年年中或下半年開放國際旅行,但是,正如我們在整個大流行病期間所看到的情況,疫情發展隨時都會改變。”儘管如此,特漢表示希望澳洲能與更多國家開通類似澳洲和紐西蘭的“旅遊泡泡”。
https://www.zaobao.com.sg/realtime/world/story20210507-1144970
*【輝瑞將為東京奧運會代表團捐贈疫苗】
輝瑞公司及其德國合作夥伴BioNTech SE週四表示,他們將捐贈一定劑量的冠病疫苗,以幫助參加東京奧運會和殘奧會的運動員及其代表團接種疫苗。這兩家公司表示,首劑冠病疫苗劑量預計將在5月底交付給與會代表團,以確保代表團在抵達東京之前獲得第二劑。據報導,輝瑞首席執行官布林拉較早前提議向運動員及其代表團捐贈疫苗後,國際奧會與日本政府舉行了會議,讓這項計畫生效。
https://www.zaobao.com.sg/realtime/world/story20210506-1144815
*【馬國公衛專家:希望當局收回成命 讓大學生回鄉過節馬國病例可能翻倍】
馬來西亞政府准許全國各地超過10萬名大專生,今天開始分批跨州回家準備度過開齋節假期。這引起衛生專家的擔心,並希望當局收回成命。專家形容這個決定是“災難性”的,因為這可能導致馬國出現類似印度目前的情況。馬國高等教育部4月29日宣佈,砂拉越以外的全國各地大專生獲准自5月7日至12日期間,分批回鄉慶祝5月13日及14日的開齋節,然後在5月15日至21日分批返校。
https://www.zaobao.com.sg/news/sea/story20210507-1144886
*【珠峰大本營至少17名登山者確診冠病】
尼泊爾境內的珠穆朗瑪峰大本營已有至少17名登山者確診冠病。大本營中的登山者和醫生透露,越來越多的人出現了感染冠病病毒的症狀。
https://www.zaobao.com.sg/realtime/world/story20210506-1144823
*【英將投資建新實驗室 加速研發應對變種病毒疫苗】
英國政府指出,將通過投資建設新的實驗室設施,加速研發可應對變種冠狀病毒的疫苗。英國衛生部長漢考克週三發佈聲明說,政府將額外投入2930萬英鎊,增加英格蘭公共衛生局的檢測設施。此舉預計能讓該機構每週檢測的血液樣本數量從700份增至3000份。這些檢測主要是評估疫苗誘導產生的抗體水準。
https://www.zaobao.com.sg/news/world/story20210507-1144862
*【消息:日本最快5月20日批准使用阿斯特捷利康和莫德納疫苗】
《日經新聞》報導,日本政府最快可能會在5月20日給予阿斯特捷利康和莫德納冠病疫苗緊急使用授權。日本衛生部官員計畫舉行會議,討論這兩款疫苗事宜。目前日本政府只批准使用輝瑞-BioNTech冠病疫苗。
https://www.zaobao.com.sg/realtime/world/story20210507-1144983
*【俄羅斯批准單劑冠病疫苗“衛星-Light” 】
俄羅斯直接投資基金表示,俄羅斯已批准使用“衛星Light”(Sputnik Light)冠病疫苗。該基金稱,這種縮小版疫苗對冠病的有效性為79.4%,每劑成本不到10美元。該疫苗已指定用於出口,並可能增加部分免疫力人群的數量。此舉可能有助於在感染率高的國家進一步供應疫苗。
https://www.zaobao.com.sg/realtime/world/story20210506-1144821
*【印度北方邦制氧廠爆炸 至少三人喪命】
《印度時報》報導,事發時民眾帶著空的氧氣瓶排起長隊,等待充氧。爆炸非常劇烈,導致許多傷者當場失去手腳。有目擊者稱,“聽到一聲巨響,地面也在震動,還以為是地震。”報導稱,該制氧廠位於居民區,事發後工廠經理和許多員工逃離了現場。爆炸造成至少三人死亡八人受傷,其中兩名顧客一死一傷,其餘受害者均為制氧廠工作人員。
https://www.zaobao.com.sg/realtime/world/story20210506-1144819
*【試圖規避封禁川普措施 推特關掉多個帳號】
美國推特本周關閉了多個為分享前總統川普網站聲明而設立的推特帳號,理由是這些帳號違反其封禁一個推特帳號的規定。1月6日美國國會山遭川普的支持者暴力衝擊後,推特宣佈無限期封禁川普的帳號,他的推特帳號擁有超過8800萬名追隨者。除了推特,其他社群媒體平臺包括面簿、谷歌、Snapchat等也在國會騷亂爆發後,禁止川普使用它們的平臺。
https://www.zaobao.com.sg/realtime/world/story20210507-1144957
*【川普抨擊臉書繼續封禁其帳號 並指三科技公司使美國受辱】
美國前總統川普抨擊社群媒體平檯臉書繼續封禁他的相關帳號,並指臉書、推特和谷歌這些科技公司使美國受辱。他在其官方網頁上說,臉書、推特和谷歌的行為完全是對美國的侮辱。他還譴責這些公司剝奪了美國總統的言論自由,並稱他們腐敗。
https://www.zaobao.com.sg/news/world/story20210507-1144861
*【消息:拜登政府或保留川普的中國投資禁令】
知情人士透露,美國拜登政府可能保留川普時期實施限制美國投資部分中國公司的措施。不願具名的消息人士稱,拜登政府官員仍就川普針對被指與中國軍方有關聯的企業所實施的投資禁令進行初步討論,這當中包括中國三家最大的電信公司,目前尚未做出決定。川普政府去年11月公佈投資黑名單,禁止美國人士投資在美國財政部創建的“共產中國軍事公司”名單上的企業。
https://www.zaobao.com.sg/realtime/china/story20210507-1144979
*【拜登接受上調公司稅25%為基建籌集資金】
美國總統拜登說,美國國會必須通過其價值數以兆美元計的振興美國經濟方案,因為中國正在“吃掉我們的午餐”。拜登飛到共和黨的大本營路易斯安那州,大力宣傳他提出的2.3兆美元的大規模基礎設施建設計畫。拜登表示,這項龐大的計畫不僅是為了整修危險的橋樑和道路,還將能鞏固美國在國際舞臺上的領導地位。
https://www.zaobao.com.sg/realtime/world/story20210507-1144956
*【外長會議發表公報: G7首度支援臺灣參與世衛組織及世界衛生大會】
七國集團(G7)外長會議昨天發表公報,首度支持臺灣有意義地參與世界衛生組織(WHO)及世界衛生大會(WHA),並強調台海和平穩定的重要性,臺灣總統府和外交部誠摯感謝G7成員國對臺灣的堅定支持。
https://www.zaobao.com.sg/news/china/story20210507-1144894
*【美國防長:無計畫把正在墜落地球的中國火箭擊落】
有報導指中國長征五號B火箭將在本週末墜落地球,美國國防部長奧斯丁表示,美國軍方無計畫把它擊落。奧斯丁向媒體發表講話時說:“我們具備多種能力可以這麼做,但直到現在為止,我們沒有計劃打下它。”五角大樓專家預計,從北京空間站分離出來後,長征5B火箭的機體將在本週六或星期天墜落地球表面,但其具體的墜落時間和地點目前仍難以預測。
https://www.zaobao.com.sg/realtime/world/story20210507-1144955
*【英法澤西島漁業糾紛持續升級 兩國派軍艦執行巡邏任務】
英法在澤西島附近的漁業糾紛持續升級,兩國派遣軍艦到該區域執行巡邏任務。歐盟執行官呼籲雙方保持冷靜,並指與英國的對話正在進行中。
https://www.zaobao.com.sg/realtime/world/story20210506-1144817
*【美國聲援烏克蘭 呼籲俄羅斯停止魯莽和侵略性行動】
美國國務卿布林肯呼籲俄羅斯停止對烏克蘭的“魯莽和侵略性行動”,並稱莫斯科已在與烏克蘭的邊界附近部署“規模顯著的軍事力量”。布林肯5日在訪問烏克蘭基輔時作出上述表述。他表示,美國正密切關注俄羅斯對烏克蘭持續構成的威脅。布林肯在與烏克蘭總統澤倫斯基會晤時表示,烏克蘭邊境仍有俄羅斯大量兵力,“我們希望俄羅斯停止其侵略性行動”。布林肯還表示,美國一直在積極尋求增加對烏克蘭的安全援助。
https://www.zaobao.com.sg/realtime/world/story20210506-1144813
資料科學的建模基礎 在 台灣物聯網實驗室 IOT Labs Facebook 的精選貼文
時尚依靠AI改造其業務模型,以更加綠色
2020年3月4日
由柏拉圖重新發布
AI趨勢員工
一家洛杉磯時裝屋正在使用AI改變時尚行業的商業模式,該行業在歷史上與未售出的存貨相關的風險很高。
靈巧 為了響應客戶在其網站上的投票,該公司正在使用AI來定制限量發行的商品,稱為“ drops”。
Finesse創始人兼首席執行官Ramin Ahmari
“如今的時尚每個月都會創造成千上萬的作品。 我們之所以創建這個品牌,是因為我們希望時尚更具可持續性。” 靈巧,在最近的帳戶中 運氣.
可持續發展是時尚界許多年輕企業家的主題,他們致力於應用技術以更好地利用 進行預測,定價和運營研究以減少浪費。
Finesse在一月份完成了4.5萬美元的種子輪融資。 該公司現在正在其網站上列出從街頭服裝到禮服的八個限量編輯的商品,這些商品是通過分析包括社交媒體趨勢和客戶投票在內的數據精心選擇的。 這個想法是生產最有可能小批量銷售的產品。 “我們只會有出售的東西,”艾哈邁利說。
他的職業生涯始於華爾街,在摩根士丹利,貝萊德和對沖基金TwoSigma的暑期實習中,他探索了數據分析。 他說:“我們將查看財務數據並做出數百萬美元的決策。” “但我們不會以相同的方式看待社交數據,儘管它具有很強的表現力,並且可以告訴我們哪些類型的項目值得投資。”
他以這個想法為基礎發起了Finesse,該活動密切跟踪社交媒體,在線博客和Google趨勢上的定量研究和文本數據。 他說:“這是模式匹配,試圖弄清非結構化的社交數據。” “我們汲取了靈感,並以此為基礎進行了生產。”
該公司使用3D虛擬原型製作產品設計,而無需物理樣品。 它使用收集到的數據來預測製造多少,隨著收集的數據的增加,這種預測會隨著時間的推移而逐漸完善。
數據科學家為時裝業製定了可持續發展基準
一位可持續發展顧問認為,時裝行業處於很好的位置,可以像Finesse一樣利用AI技術趨勢以從中受益。
阿姆斯特丹數據收集中心的經理Joanneke Meijer
“我們相信,通過確定可持續發展的品牌,行業可以朝著可持續發展的方向發展。” 開放數據科學。。 她是一位經驗豐富的數據科學顧問,專注於預測,定價,運營研究和文本挖掘。 “我們使用抓取,人工智能,自然語言處理和 可解釋性 比目前的方法更快地提供更多可持續的服裝信息。”她說。
為了建立基準,她設計了一種自動方法,從網站,博客和書籍中收集有關服裝品牌信息的信息,以期在可持續性方面有所作為。 她說:“在數據科學中,您通常從需要大量清理的數據集開始。” 對於時裝項目,她的團隊首先使用Google搜索API創建了一個包含2,000多個服裝品牌的數據庫。 為了建立監督模型,團隊收集了可持續和不可持續服裝品牌的培訓實例。
從這個小的數據集中,團隊訓練了一個AI模型。 使用自然語言處理來準備從網站獲得的文本以進行分類。 文本中的某些單詞用數字表示,帶有線性核的支持向量機經過訓練可以分配可持續性標籤。 “我們必須精明地抓取正確數量的數據,” Meijer說。
首次檢查數據產生的詞云表明,可持續品牌與其他品牌之間存在明顯差異。 該團隊強調了可解釋的結果,以進一步信任模型的預測。
“可解釋性 對於人們而言,至關重要的是要相信結果。”邁耶說。 “就我們而言,這還提高了預處理的質量。 結果,我們現在有了幾款精度超過80%的模型。”
為了宣傳時尚可持續性基準,Meijer和她的團隊建立了一個網站, goodbase.ai。訪客可以按服裝品牌進行搜索,查看該品牌的綠色指示符是否為可持續性,紅色指示符為不可持續。
成為基準的因素包括:衣服是否由有機材料製成; 品牌工廠的勞動條件; 品牌供應鏈造成的污染量; 和回收政策。
接管行業的綠色時尚實踐
Fashion負責 92萬噸固體廢物 來自的數據顯示,該行業每年都被傾倒在垃圾填埋場中,據信該行業是世界供水的第二大消費者,佔人類碳排放量的10%。 塔塔諮詢服務公司 該公司AI技術戰略情報負責人Shilpa Rao撰寫。
結果,綠色時尚開始佔據主導地位。 “ R零售商可以通過投資於可持續時尚技術並在時尚價值鏈中應用AI等較新的技術來確保其客戶在保持運營盈利的同時保持良好的外觀,”她說。
時裝行業的新綠色實踐包括:用於製造,使用3D建模;以及用於採購,合併所需的材料成分; 在設計上,幫助個性化量身定制的服裝並創建新的組合; 為了訂購,使用AI根據社交和其他數據預測趨勢,以幫助購買正確的數量。
附圖:時裝行業正在轉向使用AI,以幫助AI變得更具可持續性,減少浪費並為客戶實現更高的個性化。 (來源:蓋蒂圖片社)
資料來源:https://zephyrnet.com/zh-TW/%E4%BE%9D%E9%9D%A0AI%E6%94%B9%E8%AE%8A%E5%85%B6%E5%95%86%E6%A5%AD%E6%A8%A1%E5%BC%8F%E4%BB%A5%E6%9B%B4%E5%8A%A0%E7%B6%A0%E8%89%B2%E7%9A%84%E6%99%82%E5%B0%9A/
資料科學的建模基礎 在 旗標知識講堂- 《資料科學的建模基礎 - Facebook 的推薦與評價
《資料科學的建模基礎- 別急著coding!你知道模型的陷阱嗎?》在《CIO IT經理人》雜誌刊登一篇「導入AI從建立成功的數學模型開始」,在此分享一下部分 ... ... <看更多>
資料科學的建模基礎 在 資料科學基礎(五):了解數據分析建模與常見的演算法 的推薦與評價
資料科學基礎 (五):了解數據分析建模與常見的演算法. 9 videos 264 views Last updated on Aug 19, 2020. Show more. NOU 數位深化系列. NOU 數位深化系列. ... <看更多>
資料科學的建模基礎 在 Re: [心得] 自學AI資源分享- 看板DataScience - 批踢踢實業坊 的推薦與評價
感謝原 PO 的分享,我也來分享一下我自己的學習清單
==== 前言 ====
去年因緣際會知道了有關大數據、資料科學、機器學習這些領域
本來考慮要去參加資策會的課程,但自己要在家帶小孩
如果參加課程,小孩要找保母,整個機會成本太高,因此決定自學先
網路課程現在幾乎是隨手可得,想要自學的人根本不怕沒有教材可以學習,但是五花八門
的課程中,怎麼去選擇就是一個很重要的問題了。
我自己是一個門外漢,因此在選擇課程以及安排上面花了蠻多時間,以下大多是我看過或
是大概瀏覽過覺得不錯的課程,就推薦給想要自學又不知道怎麼開始的朋友們吧~
==== 概論 ====
由於自己雖為國立大學數學系畢業,但畢業非常多年,加上自己也非科班出身,因此想要
先了解整個領域的範疇、概要,之後再開始針對各個科目分進合擊。
PS : 初期我自己都以大數據為出發點,所以上的課都是大數據概論取向,但再其中其實
對於資料科學、AI、機器學習都會講到。
1. [ Coursera ] 大數據分析:商業應用與策略管理 (Big Data Analytics: Business
Applications and Strategic Decisions)
這門課是台大與玉山銀行合作開的線上課程,與其說是課程,我認為比較偏向講座,在這
過程中可以對大數據、機器學習等在商業上的應用。這堂課可當作補充資料來上,會有一
些實務應用上的概念,當然,如果沒時間也不一定非得要上。
2. [ Coursera ] Big Data Specialization
University of California, San Diego 開設的這們課程,我個人還蠻推薦的,尤其是對
跨領域、無先備知識的學習者來說,可以在這一系列課程中很快速地對整個領域有蠻深入
的理解。
3. [ Book ] 精通 Python
4. [ Book ] Python 資料科學學習手冊
這兩本都是 O’REILLY 的經典書籍,我必須坦白說我沒有完整的看完,精通 Python 我
針對資料科學的部分有完整看過,然後做習題,但裡面很多章節稍微跟資料課學無關的我
幾乎都暫先跳過,而資料科學學習手冊我是都拿來當工具書翻閱。( 所以我 coding 能力
還是一樣很差XDDDDD )
==== Python ====
第二階段我開始以 Python 為主進行學習,因為我自己 coding 能力幾乎是 0,這個部分
必然要作為初期學習的重點項目。另外,雖然說這是第二階段,但其實這部分跟上述的概
論課程我幾乎都是同時期一起上課。( 不過我坦承到現在我自己的 coding能力還是很差XDD )
1. [ Coursera ] Python for Everybody Specialization
這門是 University of Michigan 所開設的 Python 專項課程,完全從 0 基礎開始上課
,上完以後可以可以進行一些初階的程式作業我想是沒有問題的,這堂課並沒有太多針對
資料科學的部分,主要是以各領域都會用到的基礎工具為主。Charles Russell 的上課方
式我超喜歡,喜歡友去上課方式的人我想也會跟我一樣喜歡這門課。
2. [ Coursera ] Applied Data Science with Python Specialization
一樣是 University of Michigan 開設的,這專項課程我作為上門課程的接續課程。前面
幾堂會針對 python 在資料科學中會用到的模組、方法進行概略式的瀏覽,後面則會針對
視覺化、機器學習等領域做較為深入的介紹。整個課程較上一門來說困難度增加不少,因
為我自己有做手寫筆記的習慣,這門課的許多東西在我現在 coding 遇到問題時都還能翻
閱筆記作為工具書使用,我覺得受益不少。
3. [ Coursera ] Fundamentals of computing
Rice University 所開設的課程,之前應該也是在論壇看見推薦的,但課程難度較高,目
前我也是暫時先擱置還未進行這課程的學習。
===== Machine Learning =====
1. [ YouTube ] 機器學習基石 & 技法
(Machine Learning Foundations and Techniques)
台大林軒田教授所開設的機器學習課程,在 Coursera 與 YouTube 軍可以免費觀看課程
內容。這門課主要以基礎的機器學習演算法為主,但雖然說世紀處演算法,但內容包含的
數學比重較重,啃下來的確會有點困難,但整個課程的安排的確非常流暢,老師的講述也
算是蠻清楚。而且教授對於課程教學十分用心,如果在 YouTube 或是 Coursera 上面提
問,教授 (或助教) 都會盡可能地回覆。( 即使課程已經是兩三年前的課程了,現在也都
會看到教授的回覆,非常用心。 )
2. [ YouTube ] Machine Learning — 李宏毅
台大李宏毅所開設的機器學習課程,一直以來都是台灣及中國學習者極力推薦的中文課程
之一。課程內容與時俱進,每一年都會將最新的機器學習、深度學習的演算法、模型加入
到課程內,讓學習者能夠跟上整個領域的發展。數學的比重比林軒田教授的課程低,而且
多了許多有趣的範例及講述,上課起來輕鬆不少。然而,影片內容我個人覺得安排較為紊
亂,可能是每一年的課程進度剪接而成,在某一些地方的銜接度較差,這是上課時稍微讓
人困惑的地方。不過瑕不掩瑜,這門課程我認為還是非常值得花時間上的。
[ 補充 ] 最近中國一些人將李宏毅的課程整理成一個 github 專案,完全複刻課程內容
,包含了課程中的所有 demo 以及課程作業內容,非常值得大家在上課的同時做參考使用
。
[ 補充 ] 李宏毅另外有一門課程 " Machine Learning and having it deep and
structured ",會更深入講解機器學習的演算法跟架構,這也是後續上完 Machine
Learning 後可以深入補充的課程。
3. [ Coursera ] Machine Learning — Andrew Ng
由 Stanford University 的吳恩達教授所開設的課程,這已經是全世界公認的經典了,
不過已經花了大半年上完前面兩門課程的我,可能要稍作休息,待日後有機會再來進行這
門課程的學習。
4. [ YouTube ] Large-Scale Machine Learning
清大吳尚鴻所開設的課程 (https://www.cs.nthu.edu.tw/~shwu/courses/ml/),忘了在哪
看見推薦的,我有上去大概看了一下,就學習論的部分我覺得講解的蠻清楚,就也是有空
可以再回頭來看看。
===== Mathematics =====
整個 Machine Learning 所涵蓋的數學領域其實是很廣的,有一些甚至不是數學系四年會
碰觸到的部分,而且某些部分甚至都是數學系、所一整學年的課程,我認為不用太糾結每
一個數學細節,找到一個可以說服自己的方式就好。( 當然,如果你真的想走演算法這條
路,要求就要再提高ㄧ些 )。如果有時間我會建議可以把機率統計以及線性代數的部分上
過一次(我大學機率統計實在學得慘不忍睹),我認為這兩個領域如果可以上手,就會輕鬆
許多。
1. [ 清大開放式課程 ] 機率論
2. [ 清大開放式課程 ] 統計學
3. [ 清大開放式課程 ] 數理統計
這三們都是清大鄭少為老師所開的課,基本上他的機統普遍受到許多人的推薦,我自己有
看過前面幾堂的機率論,我認為條理清楚,講義也很詳細,這是我真的很想找時間上的課
程。
4. 線性代數
這個部份我目前暫時沒有重新上課的打算,大學教授上的非常好,我的筆記也都還留著,
就可以來回對照著參考,如果有推薦的課程也可以讓我知道,一起推薦給所有人參考看看
。
===== 補充資料 =====
這裡推薦幾個我認為很有幫助的學習途徑,有些是課程,有些並不算是。但我認為都可以
在上面這些基礎課程以外作為增強實力的補充教材。(備註 : 這裡我選出來的都是比較廣
泛性的平台,但 Medium 或是ㄧ些個人部落格也有很多非常棒的補充資料可以看,但這樣
的資料多且雜,我就暫時沒收在下列推薦名單中。)
1. AI 研習社 ( https://ai.yanxishe.com/ )
不得不說,中國在這領域的發展真的比台灣快而且豐富,當我在學習過程中找尋中文資料
時,九成都是從中國的論壇或是部落格中找到,台灣在這方面的分享上面的確比較少。
AI 研習社我會建議大家可以去他的線上課程看,裡面有幾個大師級的課程 ( 重點是有簡
中字幕XD ),例如 Hinton 的課程我就會想要找時間來看一下。裡面還有一些資料、論文
整理的部分,大家也是可以上去晃晃看。
PS:它有一門「機器學習必修之數學基礎」系列課程其實我還蠻有興趣的,但是學費不便
宜就…
2. CSDN博客 ( https://blog.csdn.net/ )
不管閱讀論文還是課程上面有疑問,絕對可以針對同一件事情再上面找到非常多樣化的解
釋。上面我曾經說過,很多時候不要拘泥,找到一個能說服自己的方式就好,通常我都會
在許多不同的解釋當中選擇一個我比較理解且能接受的方式作為我對這件事情的理解。
3. 知乎
這有點像是中國版的奇摩知識+ (?),針對一個問題也可以看到底下有許多不同角度的切
入,我覺得這樣的學習其實蠻不錯的。當我在找資料的時候,只要是CSDN跟知乎我都會點
進去看一下,許多時候都會有不錯的收穫。
4. reddit/MachineLearing ( https://www.reddit.com/r/MachineLearning/ )
reddit 的 Machine Learning 版裡面有許多的神人,還潛伏了許多論文的作者在裡面,
時不時會有一些很新的論文發表、成果發表還有許多有趣的討論在裡面,我覺得可以收藏
起來看。
5. 微博公眾號
好,我知道這部分爭議很大,如果真的很介意的可以跳過這一 part。
我完全沒有在用微博,但為了ㄧ些公眾號的訂閱我才開始使用。許多公眾號會把很新的
AI 新知、或是一些知識整理放出來,雖然品質參差不齊,但也不得不說有時候真的能撿
到一些不錯的好文章。另外,覺得閱讀reddit 全英文資料很吃力的,有時候大概在
reddit 上面發表一兩天之後公眾號就有簡體中文的說明出來,我覺得有時候偷吃步其實
也是蠻可以的啦XDDDDD。還有一個公眾號會每天發送各種領域最新的論文內容出來,如果
閱讀論文速度很快的,可以從這樣的公眾號中拿到很多最新的論文資訊。
=======END=======
以上是我自己的一些學習資訊,也提供給大家參考看看
當然還有很多非科班出身必須要修的 例如資料結構跟演算法等等
我目前還沒有什麼概念,如果有人有推薦課程也希望不吝分享讓我知道一下
--
聽眾散去了,希爾伯特卻仍留在講台上,
他等著看自己是否已經運用有利的例子,優越的論證,
以及具誘惑力的23個問題,
塑造他期盼見到的未來.....
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.45.98.201 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1565639939.A.F2F.html
... <看更多>