RE 모형

RE 프로빗

RE 모형은 설명변수와 오차항이 서로 독립이라 가정하고 \((u_{i1}, \ldots, u_{iT})\)에 대하여 특정 결합확률분포를 가정
특히 \(u_{it} = \mu_i + \varepsilon_{it}\)로 모형화하고 \(\mu_i, \varepsilon_{i1}, \ldots, \varepsilon_{iT}\)가 모두 서로간에 독립이라고 가정
RE 프로빗 모형은 \(\varepsilon_{it}\sim N(0,1)\)이라고 가정. \(\mu_i\)도 정규분포를 가지며 분산은 일반적으로 둠 \(N(0, \sigma_{\mu}^2)\)
(중요) PA 모형에서는 \(u_{it} \sim N(0,1)\)이라고 가정 ≠ RE 프로빗에서는 \(N(0,1+\sigma_{\mu}^2)\)
그 결과, RE 추정값 \(\approx (1+\sigma_{\mu}^2)^{1/2}\) · PA_exc 추정값
- PA 프로빗 모형은 \(u_{it} \sim N(0,1)\)이라고 가정함에 반하여 RE 프로빗 모형은 \(\varepsilon_{it} \sim N(0,1)\)이라 가정하기 때문
- RE 프로빗 모형의 경우 \(u_{it} \sim N(0, 1+\sigma_{\mu}^2)\)이고 PA 모형의 경우 \(u_{it} \sim N(0,1)\)을 가정하므로, RE 모형과 PA 모형의 계수를 비교하기 위해 PA 모형을 다음과 같이 변환
  
  \[y_{it}=1 \;\mathsf{if}\; \lambda \alpha_{pa,t} + X_{it} (\lambda \beta_{pa}) + \lambda u_{it} > 0, \quad \lambda = \sqrt{1+\sigma_{\mu}^2}\]
- 이렇게 변환하면 \(u_{it} \sim N(0,1)\)이라는 가정하에서 변환된 오차항 \(\lambda u_{it}\)의 분산이 \(1+\sigma_{\mu}^2\)이 되어 RE 프로빗과 같은 스케일이 됨
- 따라서 (분포 가정이 맞다면) \(\beta_{re} = \beta_{pa} (1+\sigma_{\mu}^2)^{1/2}\)
- PA 프로빗 추정 계수보다 RE 프로빗 추정 계수가 더 부풀려지는 것은 당연함
Stata에서는 xtprobit ..., re 명령 사용
우도함수는 복잡(적분이 들어가며 수치적분에 시간이 많이 걸림)

\[\sum_{i=1}^n \log \int \prod_{t=1}^T \Phi(\alpha_t + X_{it}\beta + \mu)^{y_{it}} [1-\Phi(\alpha_t + X_{it}\beta + \mu)]^{1-y_{it}} \frac{1}{\sigma_{\mu}} \phi \left( \frac{\mu}{\sigma_{\mu}} \right) d\mu\]

앞의 경제활동참가에 관한 PA 추정과 동일한 모형을 RE probit으로 추정하라. RE probit의 속도는 어떤가? kids와 lhinc 계수 추정값을 exchangeability 가정하의 GEE 추정 결과와 비교하라. PA 추정값과 RE 추정값에 상당한 차이가 보이는 이유는 무엇인가?

코드 보기

use lfp, clear
global z "educ black age agesq"
xtprobit lfp kids lhinc ${z} i.period, re
est store re
xtprobit lfp kids lhinc ${z} i.period, pa c(exc) vce(r)
est store pa
est tab pa re, eq(1)

CRE 프로빗

CRE 프로빗은 시변하는 설명변수들의 \(\bar{\mathbf{x}}_i\) 혹은 \((\mathbf{x}_{i1}, \ldots, \mathbf{x}_{iT})\)를 우변에 추가하고 RE 프로빗 추정을 하는 것

lfp.dta를 사용한 실습을 계속하는데, xtsum 명령을 이용하여, 연도별 더미를 제외한 설명변수들 중 어느 것이 시변하고 어느 것이 시간불변인지 찾은 후, 시변하는 설명변수들의 개별 평균(\(\bar{\mathbf{x}}_i\))을 우변에 추가하여 RE프로빗 추정을 하라(이것이 CRE 프로빗).

코드 보기

use lfp, clear
xtsum
global z "educ black age agesq"
foreach v of varlist kids lhinc {
    by id: egen bar_`v' = mean(`v')
}
xtprobit lfp kids lhinc ${z} bar_* i.period, re