연속 확률분포: 정규,카이제곱, t&F 분포

확률실험, 표본공간, 확률변수

연속확률변수

확률밀도함수: 확률변수가 연속적인 값을 취할 때.

연속확률변수이면 어떻게 하느냐?

실수 구간이 있고, 이게 연속이다 보니까 무한개의 값이 존재한다, 끊어지지 않는다

무한개의 값 중에서 1개 값을 관심을 가질 때,

어떤 상수든지간에 무한대로 가지면, 이를 0으로 본다.

특정 x값에 대해서 확률을 가지려고 하는데, 확률밀도함수가 뭔가가 다른 특성을 가지는데, f(x)값이 0 이상의 값을 가진다

밀도는 0이상이다. 이 값을 가질 것인가? 그럼 확률은 어떻게 구할 것인가?

연속확률

구간을 넓히면 확률이 높아진다. 구간과 관련해서 확률을 구한다

x값이 a~b 구간에서, 적분을 이용해서 구한다

전체 면적 중에서 f(x) 구간의 확률을 본다

구간을 좁혀놓으면,

A=b이면? 구간과 관련지어서 확률을 생각해야 한다

누적분포함수: 𝐹𝑥는 확률변수 𝑋가(위로) 특정한 값 𝑥까지의 구간에 어떤 값을 가질 확률

연속확률분포

정규분포: 평균과 표준편차에 의해서 분포의 모양이 결정

현실에서의 정규분포

* 인간의 신체크기(키,몸무게, 허리둘레 등)는 일반적으로 정규분포를 따른다고 본다

* 오차를 포함하는 측정 결과. 예를 들어서 자를 가지고 컵의 크기를 측정할때, 무수히 많은 측정을 반복하면 정확한 길이에 수렴한다고 본다

* 한 모집단에서 무작위로 선발된 표본의 통계

* 인간의 심리적인 특징결과의 가정

자유도: 사례수를 의미한다

카이제곱(𝜒2)분포: 이를 쉽게 말하자면, 표준정규분포로부터 변수들을 임의적으로 "제곱"해서 더한다. 그러면 더해주는 변수의 수가 많으면 정규분포에 가깝다. (중심극한정리)

그래서 r(자유도, 변수의 갯수)가 많을수록 표준정규분포에 가까워진다

t 분포

표본이 적을때 사용하는 분포

자유도가 높을 수록 표준정규분포에 가까워진다

F 분포

2개의 집단 간의 표분 분산의 비율

F분포 = 집단내 분산 / 집단간 분산 으로 설명된다

F 통계량 1보다 크면 집단 간의 차이가 있다. 1근처이면 집단간에 차이가 없다

쉽게 말해서 t검정이나 F검정이나 둘 다 집단 간의 차이점을 알고자 하는 것이다

t검정은 평균을 검증하기 위함이고 F검정은 분산을 검증하기 위함이다