통계학의 기초

통계학은 크게 기술 통계학과 추리 통계학으로 구분되며

기술 통계학은 관찰된 자료를 수집하고 정리 및 요약해 현재의 상황을 이해하는 것이 목적이다.

추리 통계학은 모집단에서 추출된 표본 자료를 분석해 확률이론을 바탕으로 모집단의 특성을 추리하는데 중점을 둔다.

상관분석 : 독립변수와 종속변수 간의 관계의 강도를 분석하는 것으로 상관계수를 구하는 것이 핵심 (얼마나 밀접하게 관련되있는지, 인과관계X)

상관분석은 독립변수와 종속변수의 관계 정도를 -1과 1 사이로 정량화한것으로 독립변수와 종속변수가 함께 변하는 정도를 독립변수와 종속변수가 따로 변하는 정도로 나눈 값이다.

r=0이면 관계가 없음. r=1이거나 r=-1이면 관계가 매우 강해 추가적인 회귀분석을 통해 새로운 입력값에 대한 예측값을 알아낼 수 있음.

회귀분석 : 독립변수와 종속변수의 관계를 함수식으로 설명.

결정계수는 독립변수를 가지고 얼마만큼 의미있게 종속변수를 예측할 수 있는지를 판별할 때 사용한다.

보통 r의 제곱이 0.65 이상이면 의미있는 회귀식이라 한다.

선형회귀: 독립변수가 1차함. 입력값과 예상값의 관계가 2차원에서는 직선 형태로, 3차원 공간에서는 평면으로 나타남

상위의 식을 만족하면 선형 and 최소제곱법을 통해서 회귀식을 구한다.

선형회귀분석에서 독립변수의 수에 따라 단순선형회귀(x1)와 다중선형회귀(x1,x2)로 구분한다.

로지스틱 회귀 : 종속변수가 0,1과 같은 범주형으로 표현될 때 사용

로지스틱 회귀식에서는 최대가능도법을 사용해 를 구한다.

Tags:

Categories:

Updated: