RE 모형
RE 프로빗
- RE 모형은 설명변수와 오차항이 서로 독립이라 가정하고 \((u_{i1}, \ldots, u_{iT})\)에 대하여 특정 결합확률분포를 가정
- 특히 \(u_{it} = \mu_i + \varepsilon_{it}\)로 모형화하고 \(\mu_i, \varepsilon_{i1}, \ldots, \varepsilon_{iT}\)가 모두 서로간에 독립이라고 가정
- RE 프로빗 모형은 \(\varepsilon_{it}\sim N(0,1)\)이라고 가정. \(\mu_i\)도 정규분포를 가지며 분산은 일반적으로 둠 \(N(0, \sigma_{\mu}^2)\)
- (중요) PA 모형에서는 \(u_{it} \sim N(0,1)\)이라고 가정 ≠ RE 프로빗에서는 \(N(0,1+\sigma_{\mu}^2)\)
-
그 결과, RE 추정값 \(\approx (1+\sigma_{\mu}^2)^{1/2}\) · PAexc 추정값
- PA 프로빗 모형은 \(u_{it} \sim N(0,1)\)이라고 가정함에 반하여 RE 프로빗 모형은 \(\varepsilon_{it} \sim N(0,1)\)이라 가정하기 때문
-
RE 프로빗 모형의 경우 \(u_{it} \sim N(0, 1+\sigma_{\mu}^2)\)이고 PA 모형의 경우 \(u_{it} \sim N(0,1)\)을 가정하므로, RE 모형과 PA 모형의 계수를 비교하기 위해 PA 모형을 다음과 같이 변환
\[y_{it}=1 \;\mathsf{if}\; \lambda \alpha_{pa,t} + X_{it} (\lambda \beta_{pa}) + \lambda u_{it} > 0, \quad \lambda = \sqrt{1+\sigma_{\mu}^2}\] -
이렇게 변환하면 \(u_{it} \sim N(0,1)\)이라는 가정하에서 변환된 오차항 \(\lambda u_{it}\)의 분산이 \(1+\sigma_{\mu}^2\)이 되어 RE 프로빗과 같은 스케일이 됨
- 따라서
(분포 가정이 맞다면) \(\beta_{re} = \beta_{pa} (1+\sigma_{\mu}^2)^{1/2}\) - PA 프로빗 추정 계수보다 RE 프로빗 추정 계수가 더 부풀려지는 것은 당연함
-
Stata에서는
xtprobit ..., re명령 사용 -
우도함수는 복잡(적분이 들어가며 수치적분에 시간이 많이 걸림)
\[\sum_{i=1}^n \log \int \prod_{t=1}^T \Phi(\alpha_t + X_{it}\beta + \mu)^{y_{it}} [1-\Phi(\alpha_t + X_{it}\beta + \mu)]^{1-y_{it}} \frac{1}{\sigma_{\mu}} \phi \left( \frac{\mu}{\sigma_{\mu}} \right) d\mu\]
kids와 lhinc 계수 추정값을 exchangeability 가정하의 GEE 추정 결과와 비교하라. PA 추정값과 RE 추정값에 상당한 차이가 보이는 이유는 무엇인가?
코드 보기
CRE 프로빗
- CRE 프로빗은 시변하는 설명변수들의 \(\bar{\mathbf{x}}_i\) 혹은 \((\mathbf{x}_{i1}, \ldots, \mathbf{x}_{iT})\)를 우변에 추가하고 RE 프로빗 추정을 하는 것
lfp.dta를 사용한 실습을 계속하는데, xtsum 명령을 이용하여, 연도별 더미를 제외한 설명변수들 중 어느 것이 시변하고 어느 것이 시간불변인지 찾은 후, 시변하는 설명변수들의 개별 평균(\(\bar{\mathbf{x}}_i\))을 우변에 추가하여 RE프로빗 추정을 하라(이것이 CRE 프로빗).