「孫在陽」直播-陽明交通大學-數據科學與雲端運算-Data cleaning
大數據分析中的數據清理,關乎於大數據分析成敗關鍵。轉置、樞紐、文字清理、數字清理、日期清理等,遺漏值、異常值、雜訊等數據清理。讓數據不是垃圾,就必需做好數據清理。
孫在陽老師主講,[email protected]
範例、講義下載:https://goo.gl/ytzRxT
時間軸
00:00 簡介數據清理
07:40 轉置:樞紐其他資料行(unpivot)
09:30 大數據分析與統計分析的差別
13:35 AI是什麼
36:25 關聯
37:56 匯出轉置後的資料表
48:16 FHIR標準的數據設定
53:36 載入錯誤資料的說明
55:56 資料型態
01:00:00 視覺化的數據清理
01:03:27 錯誤取代為負極值
01:11:54 文字的數據清理-性別
01:44:40 數值的數據清理-年齡
02:06:24 數據清理規則
02:07:15 譯碼簿包含LOINC
02:07:56 Release Note
Search