🙌 那些 <<資料科學領航者論壇>> 分享不完的 Q&A
-
9/16 週四晚間的直播論壇結束了,超級感謝數百人參與,一起來交流這些 #資料科學職涯 中的大小事。
-
當天其實我們各個老師都很認真有準備一些筆記,希望能全面回答大家在報名活動時提出的職涯相關疑難雜症,但後來可惜時間不大夠,所以我決定把一些我有準備的筆記但沒在活動中提到的部分用圖文整理出來。
-
因為篇幅有限,我整理了其中有三個問題
Q1. 文組要如何跨進資料科學領域當(商業)資料分析師?(當下有回答,但我想補充一點細節)
Q2. 請問新人該去 AI 新創公司還是大公司的 AI 部門,比較可以有紮實的訓練?(這題因為時間不夠,我當下沒有回答,所以在這裡補充一點點我的觀點)
Q3. 想請問 Irene 老師 KKday AdTech 如何運用資料科學決定廣告相關決策通常會使用的 metrics 以及資料科學方法有哪些? 謝謝
-
我發現藉由這次的職涯論壇活動,好像也帶給我滿多靈感可以再結構化一些實務經驗來分享給大家,所以之後再請大家拭目以待🙌
#資料科學 #資料科學職涯 #資料科學家 #職涯規劃 #職涯探索 #資料分析師 #hiskio
「資料科學家商業分析師」的推薦目錄:
資料科學家商業分析師 在 Irene 與資料職涯大小事 Facebook 的最佳解答
[淺談近期從履歷看到的3個現象]
如果有看之前限動應該會知道,我們最近有在找兩個職缺:資料科學家(Data scientist)和商業資料分析師(Business Data Analyst),首先先感謝大家對這兩個職缺的愛戴,我們收到不少履歷。
-
1. 面試這兩個職位的人很難有明確的分界
我當初會設定這兩種職位是因為需要專注在不同的工作階段:#資料科學家 專注在資料統計處理與開發模型;#商業資料分析師 專注在定義上商業問題、資料視覺化以及廣告成效追蹤。但事實上發現,不少candidate 都是介在這兩種專長之間(現在的資料人好辛苦,在學校或是在工作上都一次學了好多面向😳)。
-
2. 現在的社會新鮮人有不少實習和 side project 經驗
我看到不少資料新鮮人的履歷,覺得非常讚嘆😌,不少人在在學期間都有積極爭取實習經驗、且可能同時準備作品集。所以如果你們也是新鮮人或還是學生,未來想往資料職涯發展的人必須加把勁了😆
-
3. 看到不少不是本科系,但努力往資料職涯發展的人
這些人普遍會從商業資料分析師的履歷看到,他們有個共同點,都會用公開資源學習 Python,不管是網路上的社群、購買線上課程、直接參加程式競賽,他們都會很努力的爭取。也有不少從行銷角色想跳往資料分析師的人,大部分是因為發現自己對數據很有熱情,且開始也接觸到 SQL 語言,發現自己有程式魂?並擅長製作 Tableau 或 Data Studio 報表。
-
以上現象跟大家分享,同時也給還在迷惘中的人一點參考。但不得不說,因為現在學習資源太多,所以要找到一個規律證明自己並脫穎而出會有些辛苦😣 包含我現在的職涯歷程也是,我們一起加油。
-
-
這張照片是紀錄我剛得到一個小飾品櫃,再來要脫離 WFH 的日子了,趕快把外出用品整理一下😆
#職涯發展
資料科學家商業分析師 在 軟體開發學習資訊分享 Facebook 的最佳解答
NT430 特價中
課程已於 2021 年 7 月更新
如果你打算進入資料科學家或是商業分析師的職業生涯,那麼刷新你的統計技能就是你需要做的事情。
但是很難開始…學習/重新學習所有的統計學似乎是一項艱鉅的任務。
這就是為什麼講師創造了這個課程!
在這裡,你將很快獲得資料科學家或是分析師絕對必要的統計學知識。
這不是另一個無聊的統計學課程。
https://softnshare.com/data-statistics/
資料科學家商業分析師 在 資料工程師、資料科學家,哪個適合我? #補根知識006 的推薦與評價
資料 分析師 # 資料科學家 #資料工程師#補根課程這集補根知識為大家介紹的是資料分析常見的三種工作:資料 分析師 、資料工程師、 資料科學家 ,希望能夠幫助 ... ... <看更多>
資料科學家商業分析師 在 #資料分析師 - Explore | Facebook 的推薦與評價
不論你是資料分析師、資料科學家、產品與專案經理甚至是HR ,現在培養數據思維都能 ... 而最快能上手的技能我認為就是#資料視覺化 技能,我們可以使用坊間的#商業資料 ... ... <看更多>
資料科學家商業分析師 在 [心得] 2021 外商資料科學求職心得- 看板Soft_Job - 批踢踢實業坊 的推薦與評價
從高中以來一直在 PTT 潛水,從前輩們身上學到許多經驗,我也來回饋分享這篇求職經歷
,希望跟我一樣略有工作經驗、想挑戰海內外資料科學家職位的板友,可以少走一點彎路
、為面試戰場做更有效率的準備。
2021 年接近尾聲,這篇文是我今年的求職經驗整理,著重在數據分析或產品分析相關職缺,
我選出我自己覺得面試中最重視的面向:數據指標、溝通能力、與統計學專業知識,
並在此分享重要的面試題目。
為了 PTT 排版我稍微精簡了文章,完整的好讀版文章在我的個人部落格:
https://reurl.cc/g0vW3Q
## 求職背景與結果
我是 112 管理學院學士學歷,開始面試前,我在手機遊戲公司擔任資料科學家已有兩年半
的時間,工作經驗以數據化營運策略、儀表板設計、以及 A/B Testing 為主。本業外的時
間,會拿去打機器學習競賽,都是國內賽事、沒有 Kaggle 成績。
本文的經驗是來自四間我有進入面試關卡的外商:Google、Agoda、Shopee、以及 LINE,
其中只有 Agoda 我主動放棄面試,其他都拿到 Offer。
## 面試經驗與建議
### 數據指標
數據分析最核心的能力,就是為商業策略找出適合的數據指標(Metric),這也是數據分
析面試必定會出現的考點。指標是否「適合」,其實沒有標準答案,面試的重點在於如何
說服對方:你是否知道自己選擇這個指標的優缺點?為什麼選擇使用此指標?
我認為數據指標的面試,最常會問的可分成三種類型:定義、性質、與變化。
#### 指標定義
出現了商業問題,資料科學家需要定義出合適的指標來協助決策。通常會以情境題的方式
出現:如果你是某產品的經營者,你覺得什麼數據最重要?
- 假設 Amazon 要招攬廠商放在首頁、增加曝光,要用什麼數據來兜售這個策略給可能有
興趣的廠商?
- 假設你是 Netflix 老闆,想推出短影片觀看精華片段的功能,要用什麼指標來追蹤新功
能的成效?
- 假設你在 Uber 工作,你會在儀表板上看什麼指標?你覺得什麼指標最重要?
我們設計出的指標需要能夠與商業策略連結、並且指引出下一步該怎麼行動,我們可以用
產品價值(A-Ha Moment)來發想,例如上方的第二個例子,要提高 Netflix 的續訂率,
我們定義看完完整一集影片是 A-Ha Moment、並且此影集完成率指標會提高續訂率,我們
可依此檢驗提高短精華影片的點閱率是否也會提高影集完成率,如果可以,短影片的新功
能就值得推出,這就是用數據引導行動的商業邏輯。
#### 指標性質
面試官會質疑某些數學性質、造成該數據指標不夠好,你需要適當地說服對方你選擇該數
據指標時,做了什麼權衡(Trade-off)。
- 儀表板監看 DAU 可能會有什麼問題?能用什麼指標改進?
- 假設你是餐廳老闆,翻桌率是個好指標嗎?如果冷門時段翻桌率是零,會怎麼影響數據
?
- 想知道使用者喜歡影片的程度,至少觀看 30 秒的人數比例與平均觀看時間,哪個是更
好的指標?
#### 指標變化
老闆盯著數據儀表板,發現某個數字突然變高或變低了,跑來問數據團隊該怎麼辦,這完
全就是資料科學家每天都要面對的情境!
- 某商品購買率這兩天突然變低了,你怎麼找出問題?
- 每日指標必定會上上下下變化、究竟變化多大才值得我們額外花費心力調查?
- 產品經理發現我們的社交軟體產品,這週的按讚人數快速下降,所以來向你求助,你會
怎麼回應他?
- 我們投放了新的廣告,APP 的新使用者明顯比以前多,我們可以立即增加預算在這項新
廣告上嗎?
指標變化的題型重視解決問題的維度,你可以從數據變化的時間範圍、涉及的國家、客群
類型等等角度切入,重點在於展現出自己是用很有條理的方式抽絲剝繭、找出核心問題。
對於此類面試題,我個人喜歡採用的策略是:假設情境,舉例而言,我認為按讚人數的急
劇下降可能來自新使用者的大量導入,在我的分析經驗裡,新使用者的平均沈浸程度相對
較低,因此我會選擇從新舊使用者的客群結構開始調查。
以上數據指標問題的三個面向,也只是概括分類、問題之間可能會有交集,但是整體而言
,都是在檢驗面試者能否結合數據分析與商業思維
Stellar Peers 的部落格 有很多範例題、以及分析模板示範,可以讓你自己練習產品分析
模擬面試。
https://medium.com/@stellarpeers
---
## 溝通能力
如果這段求職旅程重來,我會花更多心力準備溝通能力相關的面試問題。
資料科學家是需要長時間跟不同部門與不同領域專家合作的角色,技術專業與溝通能力同
等重要,因此,資料科學面試的每分每秒也都在檢視你是否善於溝通合作。
### 講清楚自己的經歷
常遇到的經歷相關問題包括:
- 為什麼要做這個專案?目標是什麼?
- 為什麼需要用這個統計模型?原本數據儀表板為什麼不足以幫助決策?
- 這項專案用什麼形式呈現結果?造成了什麼改變?
回答資歷與專案經驗相關問題,許多人推崇使用 STAR 架構 來讓你以更清晰的邏輯來交代
你的實力與貢獻,實際在使用 STAR 架構回答的時候,我個人會格外注意兩個要點:
- 講清楚問題的挑戰性,強調為什麼這項挑戰非我不可
- 盡量用量化、有實際數字的方式來呈現戰績,並且說明的數字需反映出商業目標
經歷相關的面試,我是從 Dan Croitor 的 YouTube 頻道 學習的,他分享了很多大公司在
乎的人格特質,你需要練習讓自己能成功透過敘述專案經驗、向面試官表達出自己具有他
們想要的特質。
https://www.youtube.com/channel/UCw0uQHve23oMWgQcTTpgQsQ
也與板友分享我的失敗經歷,剛開始面試的時候,因為我自己很喜歡統計模型與機器學習
,常常在分享專案經歷的時候,一個不小心就講太多模型架構或實驗流程,最後才發現面
試官覺得這些資訊太過細節、而他們其實只在乎專案最後造成了什麼改變。因此提醒各位
:不要只是一直講你會做超炫超複雜的模型,要講出你的模型提供的商業價值。
### 職場專業溝通的經驗
專業溝通指的是向他人介紹自己的專業技術、以及說服對方自己產出的結果可信,專業溝
通面試要考驗的是你能否順利 與不同背景的人合作:
- 請介紹你被刁難過的經驗
- 你有跟其他部門的人合作過嗎?遇到過什麼困難?
- 你與其他分析師意見不合怎麼辦?又如果是跟你的老闆意見不合呢?
- 你的老闆會看懂你的統計模型嗎?如果他不懂、你怎麼說服他採用你發掘的洞見?
我自己面對這類問題的小技巧,是事先整理多則故事、準備好在面試中分享。以上這些問
題,要是只一味說著「我的能力一定能克服困難、順利溝通」,聽起來太過虛無縹緲,如
果能用實戰經歷的故事來說明,會更有說服力,例如我會說:「在我履歷所寫的某某專案
,主管起初確實反對我提出的洞見,因此我採取的行動是…」。
### 與面試官的溝通
面對面的面試,你需要掌握面試官的一顰一笑、還有他心裡想要的答案可能是什麼,其實
籠統地說就是人與人溝通的技巧,所以這裡三言兩語也說不完,這裡就分享兩個在我的經
驗中、特別重要也容易忽略的面對面溝通要點。
首先,一定要釐清對方問的問題。不管是情境題、經歷問題、甚至是寫程式面試的過程,
時常要注意釐清問題,要搞清楚對方究竟想知道的重點是什麼、還有他希望回答要多少細
節。最忌諱的是面試者不在乎對方想不想聽,自顧自地一直講話,但是講很久之後才發現
,回答內容不是面試官問的核心議題。
第二個要點:當對方想開口的時候,千萬不要搶先他說話,因為他已經沒在聽了。
這是我從以下模擬面試影片學到的溝通要點
https://www.youtube.com/watch?v=CD3V4Z5hCgM
析師前輩也介紹了該如何應對,建議直接從影片中學習這項關於對話節奏的要點,實戰面
試的時候,偶爾的確會遇到這樣有點冷酷的面試官喔。
### 寫程式面試也在考溝通
在我的經驗中,應徵較 Senior 的分析職位,把 SQL 題目 100% 寫正確已是基本要求,要
讓自己在眾多面試者中脫穎而出的得分點,就是溝通。寫程式面試的溝通,請至少需要注
意以下三件事:
- 開始寫程式前釐清問題
- 善用 Pseudo Code 呈現思考流程
- 寫完程式後,分析現有結果
---
## 資料科學專業知識
應徵數據分析工作,具備統計知識是基本、A/B Testing 是超重要技能、因果推斷能幫助
你再加分。
### 統計學
資料分析工作在面試會考的統計學都不會太難,不會超出大學一年級統計課本的範圍,也
沒有人會有閒問你數學證明,大多會問統計學的名詞解釋與應用。
光是 P-value 我就遇見過超多種變化題:
- 請說明什麼是 P-value
- 如果對方從來沒學過統計學,你會怎麼向他介紹 P-value
- P-value 有什麼缺點
假設檢定與迴歸分析問題也是非常常見的:
- 請解釋中央極限定理
- 請介紹一個你使用假設檢定的情境
- 什麼是型一與型二錯誤
- 線性迴歸背後有什麼假設?怎麼檢驗?違反了會怎樣?
- 怎麼解釋羅吉斯迴歸的結果是好是壞?
我面試數據分析與產品分析的相關職位時,機器學習相關的統計學議題通常問得不多、頂
多聊一些應用場景,所以即使機器學習跟人工智慧在現在的資料科學領域是又新潮又炫,
如果你是找數據分析師工作、請不要花太多時間練習機器學習問題。
(此為我的主觀經驗,市場上當然也存在需要大量機器學習技能的數據分析職缺,請各位
以自己看到的職缺要求為準)
要準備統計學的面試題目,如果你大學沒有修過統計學課程、或者已經忘光光了,推薦你
看 YouTube 頻道:JB Statistics 打好基礎
https://www.youtube.com/user/jbstatistics/featured
若是面試在即,可以用以下這個題庫快速複習
https://reurl.cc/OpbA6D
我覺得想在統計學面試題脫穎而出,講得出數學定義與解釋只是第一步,更重要的是要能
用老嫗能解的方式說明。資料科學家非常重視跨部門合作,你未來的溝通對象可能是產品
經理、使用者體驗設計師、或者是 CEO,他們不見得有深厚的數學背景、但你依然需要說
服他們!因此,在數據分析面試,「如何向非技術人員介紹你的分析技術」是重要的考點
。關於這點,StatQuest 這個 YouTube 頻道做得特別好
https://www.youtube.com/channel/UCtYLUTtgS3k1Fg4y5tAhLbw
### A/B Testing
只要是網路相關產業的資料科學工作,A/B Testing 已是必備的技能。雖然像是 Google
Analytics 這樣的工具越來越流行且強大,讓執行 A/B Testing 變得很容易、按幾個按鈕
就能做到,但實際上,商業實驗的作法有太多眉眉角角,如果沒有扎實的統計學知識,實
驗結果就會導向錯誤結論、沒辦法真正提升產品的品質。
A/B Testing 基本款的面試考法,是直接請你說明 A/B Testing 的所有流程,從這個開放
式問題中,面試者回答的分析框架、詳細程度、以及考慮的維度,就可以看出面試者究竟
多有料、對 A/B Testing 實驗熟不熟悉。
A/B Testing 的流程該怎麼回答?我這裡寫其中一種範例:
1. 釐清新功能細節以及商業目標
2. 定義數據指標
3. 建立假說
4. 為假設檢定設定參數:顯著水準與檢定力、期望最小差異、所需樣本數
5. 估計實驗所需時間
6. 執行實驗
7. 解釋結果
以上流程的細節,請參考這篇部落格文章:
https://www.kdnuggets.com/2021/04/ab-testing-data-science-interviews.html
隨著每個人的工作經驗不同,回答的實驗作法或重視的細節也略有差異,要是你的 A/B
Testing 實戰資歷不夠多,請多方參考各個資料科學家的思考方式,例如,可以看看數據
分析師 Passion 在她的粉絲專頁分享的 A/B Testing 實驗流程。
https://www.facebook.com/helloimpassion/posts/194733982665686
A/B Testing 這個領域的水真的很深,些只找有經驗應徵者的 Senior 職缺,面試中還會
問更進階的 A/B Testing 的實驗方法問題:
- 多重檢定(Multiple Testing)是什麼?該怎麼解決?
- 請介紹一個使用 A/B/C Test (Multivariate Test) 的場景
- A/A Test 是什麼?為什麼需要做這個?
- 假設 Uber 想要測試給客人優惠券折扣是否會提升搭乘數,A/B Testing 怎麼設計?可
能遇到什麼問題?
這些進階 A/B Testing 的議題,我常會參考此領域重量級人物 Ron Kohavi 的論文,先推
薦一定要看他個人網站的 FAQ 頁面,準備面試超實用
https://experimentguide.com/faq/
### 加分題:因果推斷
我們都知道 相關不代表因果,因果推斷(Causal Inference)就是辨別出因果關係的科學
方法。
推論因果關係常用的方法就是 A/B Testing,但是在實戰中,有很多 A/B Testing 無法進
行實驗的情境,例如,曾在本版發文的新加坡蝦皮 Eric 前輩在他的工作分享文提到,電
商的雙十一是一年一度的大活動,公司不會接受犧牲鉅額業績來做商業實驗,這時還想推
論某變數的影響力、就需要用到因果推斷方法。
https://www.ptt.cc/bbs/Soft_Job/M.1584274940.A.FA3.html
因果推斷除了在上述 A/B Testing 不適用的場合、也屢見於電商與 MarTech 領域應用,
我得強調,在我 2021 年的面試經驗中,會問起因果推斷的公司還不多,只是我主動提出
因果推斷方法後,面試官都給我正向反饋,所以我自己把因果推斷視為加分項目,有空多
看、調劑身心即可。
如果你還沒接觸過因果推斷的任何方法,我自己與面試官聊起 Uplift Modeling 的經驗都
滿愉快的,推薦你從這項方法開始學習起
例如參考 LINE 的 Uplift Modeling MarTech 應用案例
https://engineering.linecorp.com/zh-hant/blog/lets-play-in-data-park/
較正式的 uplift modeling 學習資源可以看以下這本 eXplainable AI 課本:
https://pbiecek.github.io/xai_stories/story-uplift-marketing1.html
---
## 結語
總結而言,資料科學家百百種,如果你的目標是數據分析或者產品分析職缺,小心不要被
酷炫的機器學習或人工智慧沖昏頭,請專心準備數據指標、溝通能力、以及統計學的專業
知識,我希望這篇文章能幫助到要挑戰海內外資料科學家職位的朋友們
除了數據分析的求職經驗,我在這年同時也挑戰了機器學習開發職缺,我整理好心得後,
未來會再跟 PTT 的板友分享經驗
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.10.15.11 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1640775284.A.AD2.html
※ 編輯: AgileSeptor (101.10.15.11 臺灣), 12/29/2021 18:56:25
但是我沒看過有某本書能涵蓋所有分析需要的技能
我都是看自己少什麼能力、就額外去那個領域找資源學習
如果是軟工的系統設計或演算法複雜度, 我在 DA 面試沒遇到
真的要說類似白板題的
的確會有很多案例分析、這種開放式問題
只是視訊面試時、大多只有口述交流
我面試數據分析的每間公司必考 SQL
形式跟 Leetcode 上的 SQL 題相似
也有公司會考 Python 的 pandas 資料處理
... <看更多>