... <看更多>
cross sectional data中文 在 What is the difference between pooled cross sectional data ... 的推薦與評價
When I see panel data, I think longitudinal data, so observations collected on the same individuals at multiple times, on the same topics. ... <看更多>
cross sectional data中文 在 [請益] cross-sectional 與time-series 的data 檢定 - 批踢踢實業坊 的推薦與評價
記得過去學計量時 老師告訴我們模型中各變數須作共線性、
自我相關、變異數齊一等標準檢定程序
然而近日以來 我所看到的時間序列論文 只有做一般有的
單根、落後期、共整合、誤差修正 即使是 Granger 也多了
衝擊反應與變異數分析
我的問題是:
1. 時間序列不用作共線性、自我相關、變異數齊一性嗎?
2. 如果是 panel data 是不是上述檢定 (含時間序列) 都要呢?
當初修計量時 這些觀念似乎有些混亂 希望有前輩能為小弟梳理指點
感謝...
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.119.206.2
> -------------------------------------------------------------------------- <
作者: s3011 (真‧人肉Matlab) 看板: Economics
標題: Re: [請益] cross-sectional 與 time-series 的 da …
時間: Sat May 17 09:08:06 2008
我個人觀點是這樣
1. time series
為什麼要檢定自我相關、變異數齊一?
很多時候 這是用來檢定你model 設的好不好
如果設的好 error term應該是沒有pattern的 因為都被你的模型給描述了
"沒有pattern" 可以有多種解讀
較弱的標準就是 檢定誤差項是否有自我相關、變異數齊一?
較強的標準就是 檢定誤差項是不是iid
事實上檢定時間序列自我相關、變異數齊一 一直都是文獻很大的一支
如果你有興趣
可以參考
https://www.sinica.edu.tw/~ckuan/pdf/Lec-DiagTest.pdf
收錄了不少這上面的文獻
(不過沒有收錄比較近期的maximum entropy和martingale transform的技巧)
2. panel data
大部分的panel data 時間都很短 2期五期
這麼短的time period 原則上你幾乎沒辦法估計與檢定自我相關的
因為樣本太少了 即使你做出的檢定統計量 意義也不大
至於為什麼你看到的文章很多都沒做?
1. 好死不死你看到的剛好都沒做
2. 作者其實有做 但沒有report 因為不太重要
why 不重要?
因為計量的思潮早就改變了
早年的文獻確實花很大工夫在檢定這些東西
但是後來重點變成
大家原則上承認經濟的資料都有auto 和 hetero的問題
所以重點不是在用檢定 證明這些現象存在
而是改成如何在這些情況下 依然能做出有效的統計推論
在Hal White提出他的White estimator之後 學界的觀點就開始變了
Peter Phillips把這20幾年來的研究方法稱之為HAR
(heteroskedastic and autocorrelation robust)
see https://cowles.econ.yale.edu/P/cd/d14b/d1469.pdf
※ 引述《LoIn (LoIn)》之銘言:
: 記得過去學計量時 老師告訴我們模型中各變數須作共線性、
: 自我相關、變異數齊一等標準檢定程序
: 然而近日以來 我所看到的時間序列論文 只有做一般有的
: 單根、落後期、共整合、誤差修正 即使是 Granger 也多了
: 衝擊反應與變異數分析
: 我的問題是:
: 1. 時間序列不用作共線性、自我相關、變異數齊一性嗎?
: 2. 如果是 panel data 是不是上述檢定 (含時間序列) 都要呢?
: 當初修計量時 這些觀念似乎有些混亂 希望有前輩能為小弟梳理指點
: 感謝...
--
我跟你一起去革命
但是允許我隨時可以逃走
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 207.237.118.51
> -------------------------------------------------------------------------- <
作者: LoIn (LoIn) 看板: Economics
標題: Re: [請益] cross-sectional 與 time-series 的 da …
時間: Sat May 17 11:07:40 2008
※ 引述《s3011 (真‧人肉Matlab)》之銘言:
: 我個人觀點是這樣
: 1. time series
: 為什麼要檢定自我相關、變異數齊一?
: 很多時候 這是用來檢定你model 設的好不好
: 如果設的好 error term應該是沒有pattern的 因為都被你的模型給描述了
: "沒有pattern" 可以有多種解讀
: 較弱的標準就是 檢定誤差項是否有自我相關、變異數齊一?
: 較強的標準就是 檢定誤差項是不是iid
請問 若要檢定自我相關、Hetero、線性重合
若直接援用 cross-sectional 的處理方式
例如 D-W, L-M, B-P...
是否跟 time-series 水土不服呢?
: 2. panel data
: 大部分的panel data 時間都很短 2期五期
: 這麼短的time period 原則上你幾乎沒辦法估計與檢定自我相關的
: 因為樣本太少了 即使你做出的檢定統計量 意義也不大
: 至於為什麼你看到的文章很多都沒做?
老實說 我總覺得 panel data 是為年資料 < 30 而存在
如果時間期數不夠多 主體還是 cross-sectional
算是偽 time-series 吧.. ^^a
: 1. 好死不死你看到的剛好都沒做
: 2. 作者其實有做 但沒有report 因為不太重要
我看的主要是國內經濟相關系所碩士論文
不論是國立或私立 似乎都沒有這一塊
我想我檢索翻閱的篇數 應該符合大樣本了
(而非好死不死的奧梨子 XD..)
: why 不重要?
: 因為計量的思潮早就改變了
: 早年的文獻確實花很大工夫在檢定這些東西
: 但是後來重點變成
: 大家原則上承認經濟的資料都有auto 和 hetero的問題
: 所以重點不是在用檢定 證明這些現象存在
: 而是改成如何在這些情況下 依然能做出有效的統計推論
: 在Hal White提出他的White estimator之後 學界的觀點就開始變了
謝謝你的回答 真的有解答我一部份的疑惑
這些東西 很少有 textbook 會認真談到
還是須要有實戰經驗的前輩分享心得
: ※ 引述《LoIn (LoIn)》之銘言:
: : 記得過去學計量時 老師告訴我們模型中各變數須作共線性、
: : 自我相關、變異數齊一等標準檢定程序
: : 然而近日以來 我所看到的時間序列論文 只有做一般有的
: : 單根、落後期、共整合、誤差修正 即使是 Granger 也多了
: : 衝擊反應與變異數分析
: : 我的問題是:
: : 1. 時間序列不用作共線性、自我相關、變異數齊一性嗎?
: : 2. 如果是 panel data 是不是上述檢定 (含時間序列) 都要呢?
: : 當初修計量時 這些觀念似乎有些混亂 希望有前輩能為小弟梳理指點
: : 感謝...
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.119.206.2
> -------------------------------------------------------------------------- <
作者: cewjlhwj (嗨你好) 看板: Economics
標題: Re: [請益] cross-sectional 與 time-series 的 da …
時間: Sat May 17 22:43:18 2008
以下討論的主要問題都是 iid 的假設和 OLS model
因為panel data通常是 大N小T
the random sampling assumption does allow for temporal correlation.
assume random sampling in the cross section dimension.
The dependentce in the time series dimension can be entirely unrestricted.
但前提是,大N小T。所以如果sample不是大N小T,就麻煩了,不能 justify 上述的假設
如果是N和T數目差不多,目前的討論也不多,wooldridge(2002)在他的書
econometrics analysis of cross section and panel data p.7有介紹相關的文章。
就我所知Panel data可能有的問題
1. multicollinearity
這在panel data下照常test,把有問題的變數去掉吧。
通常regression model 都會直接 drop(test) perfectly correlated variables
但我的經驗是 near correlated 就不一定了
在stata下可以使用coldiag2,
參考文章:Belsley(1991), conditioning diagnostics, collinearity
and weak data in regression
2. time-series方面
如上述的討論,model 通常 allow for temporal correlation
Wooldridge(2002) 提出一個 serial correlation in panel data 的檢定
他的假設很簡單,很好用。
Drukker, D. M. (2003) 提出這個檢定方式
在各種不同假設的模型下perform well。
在Stata中已經有人寫出這個程式了 (xtserial)
可以用 robust to arbitrary autocorrelation 的 estimator
估計 autocorrelation 的 data
但這類的kernel estimator(像是單純時間序列的作法, ex: newey-west)
the asymptotics rely on the number of
periods going off to infinity
又是因為現在的data大部分是大N小T,所以要用要小心,不常用。
3. cross-sectional方面
contemparaneous correlation(不符合 E(x'it uit) =0的假設)
也就是指同一期t下的correlation
stata中有以下兩個test
xtcsd (for small T large N)
xttest2 (for large T small N)
如果發現有問題
可能是
3.1 within-group correlation
指不同i可能是處於同一個群體中,所以他們會相關。
例如: 好幾個不同的人(i)同時是一家公司的員工,則這些i的行為可能會
被同一家公司的特別福利、政策、無法觀察到的文化因素而影響
實際操作上可以用cluster解決,the asymptotics rely on the number of clusters
going off to infinity
很容易做,但clusters要夠多,我看過一個人在stata的討論版說
50 or more being a good rule of thumb
或是調整資料,例如:aggregate 同一個firm下個人的資料,
使用each firm作為不同 i,
這樣可以解決within-group correlation。但可能會面臨下一個問題。
3.2 spatial correlation
若每個 i 是很大的區域資料,不同 i 之間的變數可能會互相影響。
例如:i是指美國不同州的資料,一個州的減稅政策會影響另外一個州的變數。
這個實際操作上很難解決,通常忽略。
4. groupwise heteroskedasticity
變異數齊一性
stata中可以用 xttest3 test fixed effect的model是否符合 Ho: homoskedasticity
如果拒絕Ho,用robust的指令,就會有好的estimator。
原則上 heteroskedasticity multicollinearity autocorrelation
comtemporaneous correlation
在panel data下都有專門的test,理論上和cross-section或time-series時差不多,
但panel data有時候要處理更多假設。
當然用不同的model(ex:fixed effect or ramdom effect),對data的假設就不同,
可能需要不同的test,估計結果才會比較正確
我的作法是先找到統計軟體裡專門的test檢驗data有無上述問題,
如果發現問題,
再利用robust estimator估計出consistent 和 efficient的估計值
建議看看wooldridege(2002)的書,是本關於panel data很好的書,
要不然找到test很容易誤解,也不知道該用什麼model解決,
用錯了估計的結果就不正確
上述的內容和主要說法大部分直接翻譯於wooldridge(2002)的
econometrics analysis of cross section and panel data,
以及我在stata討論版蒐集的心得,有些地方(尤其是time-series方面)
我還有些疑惑,如果有誤很抱歉。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.109.230.252
※ 編輯: cewjlhwj 來自: 140.109.230.252 (05/17 22:53)
> -------------------------------------------------------------------------- <
作者: s3011 (真‧人肉Matlab) 看板: Economics
標題: Re: [請益] cross-sectional 與 time-series 的 da …
時間: Sun May 18 04:50:30 2008
※ 引述《LoIn (LoIn)》之銘言:
: ※ 引述《s3011 (真‧人肉Matlab)》之銘言:
: : 我個人觀點是這樣
: : 1. time series
: : 為什麼要檢定自我相關、變異數齊一?
: : 很多時候 這是用來檢定你model 設的好不好
: : 如果設的好 error term應該是沒有pattern的 因為都被你的模型給描述了
: : "沒有pattern" 可以有多種解讀
: : 較弱的標準就是 檢定誤差項是否有自我相關、變異數齊一?
: : 較強的標準就是 檢定誤差項是不是iid
: 請問 若要檢定自我相關、Hetero、線性重合
: 若直接援用 cross-sectional 的處理方式
: 例如 D-W, L-M, B-P...
: 是否跟 time-series 水土不服呢?
BP在推導的時候 我印象中沒有假設一定要cross section
也就是一般而言 是可以的
: : 2. panel data
: : 大部分的panel data 時間都很短 2期五期
: : 這麼短的time period 原則上你幾乎沒辦法估計與檢定自我相關的
: : 因為樣本太少了 即使你做出的檢定統計量 意義也不大
: : 至於為什麼你看到的文章很多都沒做?
: 老實說 我總覺得 panel data 是為年資料 < 30 而存在
: 如果時間期數不夠多 主體還是 cross-sectional
: 算是偽 time-series 吧.. ^^a
panel data本來就偏向個體計量囉
: : 1. 好死不死你看到的剛好都沒做
: : 2. 作者其實有做 但沒有report 因為不太重要
: 我看的主要是國內經濟相關系所碩士論文
: 不論是國立或私立 似乎都沒有這一塊
: 我想我檢索翻閱的篇數 應該符合大樣本了
: (而非好死不死的奧梨子 XD..)
同學 這顯然是樣本選擇偏誤阿XDXDXD
--
我跟你一起去革命
但是允許我隨時可以逃走
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 207.237.118.51
> -------------------------------------------------------------------------- <
作者: cyz0126 (終於簽了!) 看板: Economics
標題: Re: [請益] cross-sectional 與 time-series 的 da …
時間: Sun May 18 22:54:28 2008
※ 引述《LoIn (LoIn)》之銘言:
: 記得過去學計量時 老師告訴我們模型中各變數須作共線性、
: 自我相關、變異數齊一等標準檢定程序
: 然而近日以來 我所看到的時間序列論文 只有做一般有的
: 單根、落後期、共整合、誤差修正 即使是 Granger 也多了
: 衝擊反應與變異數分析
: 我的問題是:
: 1. 時間序列不用作共線性、自我相關、變異數齊一性嗎?
恰好我的碩士論文是做時間序列的 我以我的認知來回答您的問題
時間序列使用Q檢定來檢定是否有自我相關
Q平方檢定來檢定是否有變異數齊一
若有自我相關 , 則是必須要找出最適的落後期(使用AIC SBC法)
然後配適AR(P)的模型 , 或是ARMA(p,q)
若有變異數不齊一 , 則要配適ARCH或GARCH模型
所以常常會看到論文有AR-GARCH , VEC-GARCH等等等
: 2. 如果是 panel data 是不是上述檢定 (含時間序列) 都要呢?
: 當初修計量時 這些觀念似乎有些混亂 希望有前輩能為小弟梳理指點
: 感謝...
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 59.112.139.58
... <看更多>