[是日偽Data Science]咩情況應該用Pie Chart?侮辱讀者同自己智商嗰時。
TLDR:唔好用Pie Chart。任何情況下都唔好。有乜嘢衰過Pie Chart?就係3D Pie Chart
1. 你鍾意可以睇原文(但要訂戶:)Korea Set to Crack Down on Chaebols With Corporate Reform (https://bityl.co/4YtH),但反正重點不在內容,我只係討論呢個圖。絶對係chart crime
2. OK,美斯,彭博當然係專業的(唔專業我唔使一個月畀幾舊水睇),但今次我可以講,呢個圖,我去整都好過佢。
3. 我在Patreon貼過呢張圖,叫讀者睇下有乜問題。咁多人都答到,加埋唔係100%。亦唔止係四捨五入問題。但如果只係咁,就唔會要寫篇文啦。
4. 更重要嘅係:根本,唔應該用pie chart.實情,差不多任何情況都唔應該用pie chart.用pie chart 係挑戰人類文明底線的,應該所有稍為有淅醋嘅data visualizer都會叫你唔好用,特別係任何正經嘅文章
5. Pie chart有乜問題?之後細講。但不如我地首先講下,點解咁多問題,都仲有人用?事實彭博都常用,我以前啲報告都有用過—所以唔使拎嚟打我面,但,我係跟公司規矩用。係呀,公司叫食屎咪食。而有啲媒體,例如Quartz,New York Time,Washington Post之類,in house嘅工具根本就冇pie chart(*)
6. 咁Pie chart咁多問題,都仲有咁多人用,總有原因。好簡單,同零食,content farm,賤男,淫婦,陰謀論一樣,極具性格而無奈未可當正餐,但一個字:過癮,而且靚。
7. 人性就係鍾意「圓」,圓滿(https://bityl.co/4ZGS)。亦有研究做過,人類普遍鍾意曲線嘅嘢(https://bityl.co/4ZGQ),例如Double May(問教宗就知)。而起角嘅嘢呢(例如埃汾),多數都會畀人覺得危險(本人有期嘅username就叫「危險的啤」)。事實我地祖先嘅世界,大自然,係曲線多,去到較近代先有人工建築咁多直線。
8. 亦因為咁,Pie chart由遠古時代開始已出現,我地祖先(特別係數學同哲學撚)對圓形有異常嘅執迷,就帶到去今日。但,人要長大嘛。
9. 講返呢個圖,南韓5大財閥佔該國GDP。數字我望過冇錯(**)我自己做過一次,你呢五個數字放入Excel,auto suggest就會畀個pie chart你,就係咁嘅嘢。
10. 但點解加埋唔係100%?因為,就係加埋唔等於100%咯!5大加埋就係南韓GDP 44.2%。咁而家個圖整出嚟,就係當44.2%係100%(!)之下,5大各自佔呢入面嘅幾多%。唔知講乜?亦可以理解為,每間公司在5大呢個universe入面各自佔幾多。死未?「例如你見Samsung,塊餅大約係三份一,就係16.4% as a % of 44.2%,即係37%左右」。記住呢句嘢,下面再講
11. 你話唔想咁煩,咁可以點?得,你咪加個others(comment會貼圖)。靚仔晒。不過有乜後果?首先,原來Others過半,感覺幾混吉。另外,唔劃刻度,你可能都睇唔到LG同SK邊個大啲。
12. 解決方法?好撚簡單:唔撚好用Pie Chart.你用個Bra Chart(特登打錯的)咪得!(Comment 會貼)。我又唔使加個Others,又visualize 到原本個效果!
13. 咁點解仲要用Pie Chart?巴閉咯,英雄主義。
14. 事實上,頭先我就已經講咗Pie Chart嘅問題了。叫你save低嗰段,你睇多次。或者,而家望下佢原本個圖,睇多次。請問,Samsung嗰塊餅,係大過三份一,定細過三份一呢?亦即係問,隻角係大過120度定細過?驗眼乎?(答案係37%,大過三份一)
15. 另外,Hyundai同SK嗰兩塊,你遮住個刻度,敢唔敢話好易睇到邊舊大邊舊細?你得嘅話,「咁不如話我知,呢兩舊大過五份一,定細過?」(答案:一個大過,一個細過!)
16. 用Bra Chart,咪唔會有呢個問題咯!邊個長邊個短,一睇睇到,21%同19%都分到。
17. 頭先講過,Pie Chart嘅吸引力,嚟自人類對圓形嘅迷戀,特別係遠古年代。但呢樣嘢正害咗大家,中一科學堂應該頭幾堂就教你,我地嘅感官,係唔可靠嘅。所以先要儀器,否則個個目測得啦。
18. 人類雙眼,判斷啲Pie邊舊大邊舊細嘅能力,極低。要判斷一舊Pie佔total幾多,更低。實驗做過,一般人consistently 低估銳角嘅大細,而又高估鈍角嘅大細(https://bityl.co/4ZGH).又:細過90度就銳角,大過90度就鈍角,要咁寫我都覺得唔好意思,香港嘅STEM又係得啖笑
19. 一百年前已經鬧:“The circle with sectors is not a desirable form of presentation”, “In a sense, it might be construed as an insult to a man's intelligence to show him a pie chart.”
20. 記住係靚,但張無忌老豆(好似係)教佢,靚嘅嘢就害你。The point of charts is to communicate data effectively. 但當然,有時始終係it’s more about art than science
21. 下次再有你唔妥嘅同事用Pie Chart,記住以上呢堆句子。正文完,下面係……延伸閱讀
22. 係呀,你以為我鳩寫,但我寫Pie Chart都睇五六篇文的,台上一分鐘台下十年功啦。美斯啦,「你咁叻,你寫丫」。所以點解要訂我 Patreon(https://bityl.co/4Y0h),我幫你訂埋啲文睇埋消化埋整理埋仲令你有得笑。以下呢幾篇,應該包咗當今全世界最出名嘅幾個Data Visualizer了
===============================
23. Save the Pies for Dessert (https://bityl.co/4YvU)—呢篇長啲,但多圖多例子。如果只睇一篇就睇呢篇。Stephen Few ,神級人馬
24. The Worst Chart In The World (https://bityl.co/4ZG0)—呢篇簡單又好睇
25. Pie Charts(https://bityl.co/4ZH9)— 教父級,Edward Tufte,不過只講文反而上面嗰篇好睇啲。
26. The pie chart: Why data visualization’s greatest villain will never die(https://bityl.co/4YvP)—好似要訂戶,而埃汾是訂戶,我幫你訂晒所有嘢仲要睇埋消化埋,亦係一個支持埃汾Patreon嘅理由(https://bityl.co/4Y0h)
27. Should You Ever Use a Pie Chart?(https://bityl.co/4YvS)—同樓上同一個作者,詳細,但深啲。
28. 係喎,明明Data Visualization 唔係埃汾本行(***),居然要睇咁多篇文.證明我有幾咁痛恨Pie Chart.
(*)留意,唔用Pie chart嘅,似乎都係比較「左」嘅媒體。左in American context.WSJ 彭博之類依然會用。
(**)但呢類XX行業 XX活動 佔 GDP XX% 嘅講法,我一路都好質疑,你見我好少寫。我到而家都唔係好知點計出嚟。例如呢個圖,五大財閥集團嘅收入,同GDP比。但大佬,GDP係valued added喎,真係可以同上市公司嘅收入相比?
(***)本人既唔識data 又唔識 visualization(你見呢度平時啲圖就知),正如用PowerPoint嘅人(都係我)既冇Power又冇Point
=================================
Ivan Patreon,港美市場評點,專題號外,每日一圖,好文推介。每星期6篇,月費100蚊唔使,3個月已700人訂!(https://bityl.co/4Y0h)
「data visualization工具」的推薦目錄:
- 關於data visualization工具 在 君子馬蘭頭 - Ivan Li 李聲揚 Facebook 的最讚貼文
- 關於data visualization工具 在 軟體開發學習資訊分享 Facebook 的精選貼文
- 關於data visualization工具 在 旅行熱炒店Podcast Facebook 的最讚貼文
- 關於data visualization工具 在 選工具困擾,可以藉此快速的瀏覽 - Facebook 的評價
- 關於data visualization工具 在 視覺化心法與R 語言實戰工作坊 - GitHub 的評價
- 關於data visualization工具 在 [Clubhouse][8/29/2021][4] 在DA 的面试中Data Visualization 会 ... 的評價
data visualization工具 在 軟體開發學習資訊分享 Facebook 的精選貼文
--課程已於 2020 年 9 月更新--
使用 D3.js 設計和建構精美的資料視覺化
從這 7 小時的課程,你會學到
1. 了解 D3 的基本建構模組
2. 獲得廣泛的知識,學習如何創建 14 種不同的視覺化
3. 評論現有的可視覺化並發明更好的設計來顯示數據
4. 解釋 D3 社群的開源程式碼,以便在您自己的專案中使用
5. 掌握 D3 的進階工具,建構等值線圖( chorpleth maps )、畫筆( brushes )、工具提示( tooltips )和佈局( layouts )
開發實質性的 Web 應用程式,同時在頁面上顯示多個視覺化
6. 用引人注目的草圖闡明原始抽象的想法
#d3js
https://softnshare.com/mastering-data-visualization-d3-js/
data visualization工具 在 旅行熱炒店Podcast Facebook 的最讚貼文
《誤打誤撞的意外旅程:我如何成為一位碼農》
.
雖然這個部落格與臉書專頁的主題是旅行,但因為我一直把日常生活也當成人生這場旅行的一部份,因此稍微用點篇幅來講講我在這段旅程上的經驗,應該不算是超出本部落格的主題範疇吧?
先講結論:這段旅程的走向基本上都在我的意料之外。平常自己自助旅行,我通常可以規劃並且執行得很精準;但是人生這場旅行,不只充滿著意外,許多關鍵的決定都不完全是我的選擇,而是受情勢所迫而做的。
.
* * *
.
我從很小的年紀就對旅行有興趣。大概從幼稚園開始,每次坐車走中山高(那時候全台灣只有這一條高速公路),家父就會教我認地名,偶爾心血來潮就帶著我亂跑,印象最深刻的大概是某次在嘉義市說要「出門走走」,結果這一走就走到阿里山去了,據說連外套都沒帶(笑)。
.
後來應該是繼承了他的血脈(廢話,我是他兒子啊),小學六年級就會自己坐火車去基隆廟口吃好料,國中就騎腳踏車把台北市區跑遍,也因此大學選擇主修地理學,副修社會學,對於任何理工科系完全不屑一顧,其中最不感興趣的就是電腦相關領域,因為那和我最熱衷的事情——探索世界、了解人事物——看起來一點關係也沒有。
.
既然如此,到底是怎樣的際遇把我帶上了碼農這條路呢?大概有兩個轉折點,一個讓我進入地理資訊系統(geographic information system,以下簡稱GIS)的領域,另一個則讓我陷入了美國科技業這個進去了就出不來的大火坑(誤)。
.
* * *
.
大學快畢業時,出國留學的意念逐漸在心裡萌芽,一部份為的是學位,另一部份則是想要看到更大的世界——在大學畢業之前我從未自己出國旅行過,而且因為經濟能力的限制,很少有機會出國,於是我就像身邊許多同學一樣去考了托福和GRE準備申請學校,但是因為程度太差,成績並沒有非常理想。
.
另一方面,要申請什麼領域也是個大問題。大學時期我極度著迷於以分析、批判、反思見長的人文地理,在地理學與社會學兩邊也都吃得很開,但到快畢業時卻意識到自己並沒有學會太多屬於應用層面的工具(無論是技術或分析方法等),因此有了想要稍微轉換領域的念頭。
.
總之,一邊當兵一邊申請學校的過程中,由於英文成績不好、對於方向感到迷茫,再加上沒有能力自費留學, 讓我方向越來越混亂。眼看距離提出申請的時間越來越近,方向卻仍然不是很確定,最後決定聯絡一位久未見面的大學老師,兩人約了一個週六中午,在大學系館附近的餐廳吃飯。
.
那頓午餐中,我很誠實地把當時所有的限制一一講給老師聽,連當時感情因素的限制都交代清楚;後來老師很有趣的提出了一個建議:你就乾脆申請GIS這個方向吧!這種技術性的東西比較有機會拿到獎學金、比較不受英文能力限制,現在發展還也不錯。這個建議在當時算是我唯一比較可行的出路了,於是我就因為這樣踏上了大學時期其實沒那麼喜歡的GIS之路。
.
後來出國的故事這裡就不贅述了,有興趣的話可以參考我之前寫過的《我的菜鳥移民故事》系列(https://ltsoj.com/tag/Fob)。
.
* * *
.
接下來談談第二個轉折——我又是如何從GIS跳到科技業並且成為軟體工程師的呢?關鍵就在我的第一家公司,Esri。
只要是出身於環境相關領域(地理、地質、生態、環境工程、建築、景觀設計等)的人大概都知道,有個獨佔鰲頭的地理資訊軟體叫做ArcGIS,Esri就是生產這家軟體的公司,也是多數GIS領域畢業生心目中的業界第一志願,然後我竟然很順利的在這家公司拿到實習,實習不到三週就拿到正職的offer,於是我就正式搬到南加州,在這家公司開始我的第一份工作。
.
雖然碩士班期間有稍微學一點程式語言,但我的寫程式能力以業界標準來說基本上是零,因此我在Esri初期並沒有真的負責寫程式,反而花比較多時間在做測試、寫參考文件等,偶爾會寫寫小的程式範例,給公司外部的開發者作參考。就這樣寫著寫著,大概一年之後對於JavaScript有基本的掌握了(喔對了,我在這裡說的是jQuery當道、Angular才剛出來大家覺得很酷、React連個影子都還沒有的年代),我才開始多少寫一些真的會成為產品一部份的程式碼。
.
* * *
.
但就在進那間公司一年多之後,我決定離開,原因很多,其中跟專業比較相關的是:我知道自己喜歡GIS,做起來也覺得蠻上手的,但是這個領域畢竟比較小一點,而當時的我已經在業界龍頭了,領域裡面沒有比那更好的公司。因此,如果我想要探索更大的世界、挑戰自己的極限,唯一的可能性就是往GIS以外的世界發展。雖然我不是電資科系出身,卻也累積了一些資料視覺化(data visualization)與前端開發(front-end development)的經驗,於是就開始往這個方向找工作。
.
美國科技業雖然工作機會很多,但因為自己的外國人身份,要轉換工作其實是非常困難的。我後來是如何找到工作並且從西岸搬回東岸的呢?意外的旅程待續,敬請期待下回分曉。
.
* * *
.
(照片為2014年滿腦子想著要換工作時攝於南加州,常常週末就一個人出去找一間咖啡店,坐在那裡準備面試,整個浪費了南加州大好的陽光和戶外活動啊!)
.
繼續閱讀系列文: (2) https://bit.ly/2u6gHCB (3) https://bit.ly/2SRVtmu
data visualization工具 在 視覺化心法與R 語言實戰工作坊 - GitHub 的推薦與評價
Course -- Data Visualization with R. Contribute to leoluyi/RViz_201609 ... 資料視覺化」的心法,結合資料ETL 流程,在學會R 及其他相關工具的基本視覺化操作。 ... <看更多>
data visualization工具 在 選工具困擾,可以藉此快速的瀏覽 - Facebook 的推薦與評價
圖表工具比比皆是,如何比較呢?那就通通拿來畫個散布圖吧!Lisa Charlotte Rost 挑選了 ... To connect with 資料視覺化/ Data Visualization, join Facebook today. ... <看更多>