Restricted Model 에서의 R square 의 정의가 궁금합니다.
(R모델과 U모델의 R square 비교가 가능한지가 궁극적으로 궁금해요)
U 모델 : y = Xb + u
R 모델 : y*=X*b + u 라고 둘때 (y*와 X*는, Rb=ro라는 제약을 U에 대입하여 정리하여 나온 벡터와 매트릭스)
e tilde = y - X(b tilde) <- 프린트에 나온 대로 씀
y tilde = X(b tilde) <- 제 생각(U 모델에가 b tilde를 집어넣어서 fitted 된 y 벡터)
이라고 e tilde와 y tilde를 define했습니다.
이때 R모델에서 R square는 sample correlation coefficient of (y, y tilde) 인지
of (y*, y tilde) 인지
of (y, X* 곱하기 b tilde) 이 세가지 중에 무엇을 뜻하는지 궁금합니다.
R 모델에서 R square의 후보 1의 경우, R의 TSS가 U의 TSS가 일치하다고 생각했고,
후보 2의 경우, T의 TSS와 U의 TSS가 일치하지 않으므로(unless Rb=ro의 제약이 0의 제약), 일반적으로는 TSS 비교 불가,
후보 3의 경우, R의 TSS가 U의 TSS와 일치한다고 생각했습니다.
이 세가지 후보군 중에 어떤 개념이 R 모델에서의 R square 인가요??
그리고 각 후보군에 따른 R 모델 TSS와 U 모델 TSS의 비교가 올바른가요??
R^2는 모형이 종속변수의 변동을 얼마나 설명하는지를 나타내는 지표. 즉 종속변수에 의존. 제약된 모형의 종속변수는 (제약식을 대입하여 얻은 경우) 다양한 것이 일반적. 이 경우 R^2는 해당 회기식의 종속변수가 얼마나 잘 설명되는지를 나타냄(당연). 그러나 제약식을 고려하는 동기를 생각하면 제약된 모형은 원 모형의 종속변수를 설명하는 모형이되 계수에 제약이 가해진 것이라고 보는 것이 대부분의 경우 타당. 이런 관점에서는 위에 열거한 것 중 처음 것이 될 것임. 그런 시각이 없다면 처음에 언급한 대로 그냥 추정된 식의 종속변수의 변동성을 설명하는 지표가 될 것임.