교수님 강의노트 내용을 공부하다가 궁금한 점이 생겨서 질문 드립니다.
1. 통계학 복습 프린트에서 확률적 독립이라는 개념에 대한 질문 입니다.
확률적 독립의 개념 자체에 대한 이해는 크게 어려움이 없었는데요. 이걸 그냥 독립이라고 말 해도 괜찮은지 궁금합니다.
확률변수 X, Y가 확률적 독립이라는 것과 확률변수 X,Y가 독립이라는 것에 차이가 있을까요?
몇 가지 자료를 찾아보았는데 그냥 독립이라고 적혀있고 동일하게 정의해 놓은 것도 있는 것 같아서요.
만약 저게 동일하다면, X, Y가 확률적 독립이면 g(X), h(Y)도 확률적 독립이다 라는 정리에서도 '확률적'이라는 말이 들어가지 않아도 괜찮은 건가요?
2. 두번째 과제의 마지막 문제였던 p53 쪽의 맨 밑의 TF 문제에 대한 질문 입니다.
(1)의 경우에는 B^(베타헷)의 분산 식을 생각해 보았습니다. 그 분산 식의 분자 부분에 1/n을 곱하면 표본분산이 됩니다.
그래서 표본분산이 커지면 분자 부분이 커져서 분산이 작아지므로 베타를 정교하게 추정할 수 있다고 했습니다.
다만 1/n이 곱해지는 것이기 때문에 위의 설명은 n이 고정이라는 것이 전제되어야 맞습니다.
이 경우 n이 고정되어 있다고 봐야하는 건가요?
(2)의 경우는 특이치를 어떻게 보아야 할 것 인지 부터 조금 어렵습니다. 통계학에서는 보통 특이치라고 판단되면 많은 경우에 제외시키고 분석하는 것으로 알고 있는데요. 그런 의미에서는 특이치가 포함되어 있는 것이 바람직하지 않다고 생각합니다. 다만 특이치에도 의미가 있다고 판단되면 연구자 주관에 따라 포함시키기도 하는데 이럴 때는 베타를 더욱 정교하게 추정한다는 의미가 맞는 것 같습니다. 어떻게 생각해야 맞는 것인가요?
(3)의 경우에는 잔차항과 연결지어 생각해야 되는 것인지 궁금합니다. Y가 특이치라는 것은 곧 잔차가 매우 크다는 거라고 생각해 보았습니다. 잔차가 크다는 것은 추정이 잘 이루어지지 않았다는 것이니까 바람직하지 않은 것이라고 생각했습니다. 다만 이렇게 생각하는 것이 맞는지 확신이 안 듭니다. 이렇게 생각하는 것이 맞는 것인가요?
감사합니다.
1. 홍길동의 정식 이름은 홍길동. 혼동의 여지가 없을 때는 길동, 홍군, 홍씨,...
확률적 독립은 정식 명칭. 독립은 오직 혼동의 여지가 없을 때만 확률적 독립을 대신하여 사용 가능.
정식 명칭을 사용하면 혼동의 여지가 없음.(고지식하다는 평을 들을 수는 있을지언정). 약칭은 상황이 절대적으로 혼동의 여지가 없는 경우에만 사용해야 함.
참고로 선형독립과 확률적독립은 확연히 다른 개념. 그러므로 아무 때나 독립이라고 줄이면 안됨. 혼동의 여지가 없는 경우에만 그리 할 수 있음..
2. (1) "n이 주어져 있다고 보면 True, 그렇지 않으면 이러이러한 경우에는 false일 수 있음"이라고 답하면 매우 훌륭.
(2) x가 비확률변수인 경우 특이치는 바람직하다고 하여야 할 것임.(why?)
(3) (A.1)~(A.5) 아래, y의 데이터가 특이치를 포함하고 있으면 beta를 정교하게 추정하는데 방해가 될 수 있음. (why?)
True or false 질문은 사고의 영역을 넓히고 토론을 활성화하고자 하는 목적이 있음. 정답이다 아니다 보다 그 이유를 생각하는 것이 가치있는 일.