본문 바로가기
경영학 용어 정리

추세분석과 회귀분석

by choish 2019. 4. 18.
반응형

추세분석. 정의 : 주어진 자료의 패턴(흐름) 을 수식 또는 그림 으로 분석하여 이를 근거로 하여 해당 자료의 미래 추세를 예측하는 단순예측 의사 결정 기법. 분석방법의 종류 : 지수, 선형, 로그, 다항식 2~6차, 거듭제곱, 이동평균 : 사용하지 않는다 전제 조건 - 과거 자료의 패턴(흐름)이 미래에도 반복된다.

분석방법. 항목을 포함하여 전체를 드래그한다꺽은선 선택 추세선 추가 (분석가의 판단). 이 때 '수식을 차트에 표시' 'R제곱값을 차트에 표시' 를 체크 및 앞으로 **단의 에 해당 숫자 삽입

분석결과 해석. R2 : 추세선을 통해서 얻은 추정값(근사값)으로서 해당 자료(, 실제자료)에 대한 설명력을 나타내며, 일명 설명력 이라고 부른다동일한 조건이면 R2이 높은게 좋다. 하지만 무조건 R2 값이 높다고 좋은게 아니다.

Law of Parsimony : 다형식을 이용한 분석에서 차수 값을 높이면 도출된 결과의 함수모형이 복잡해진다. 물론 R2의 값이 전 차수에 비해 크게 변화된게 없으면 수식이 간단한 것을 선택하는 것이 바람직하다지수보다 선형이 맞출 확률이 조금 더 높다. 선형 수식이 훨씬 간단하다. 수식이 간단한 선형 수식을 선택하는게 현명. 설명식이 비슷할때는 수식이 간단한 것을 선택하는 것이 바람직하다회귀분석의 개념. 독립변수(설명변수)와 종속변수(반응변수) 간의 인과관계 분석하는 예측기법. 레그레이션라는 용어는 영국의 우생학자인 칼톤(1822-1911)에 의해 주장되었으며, 그는 1885년 아버지와 아들의 신장()에 대한 관계를 연구하여 종국적으로 평균에 수렴하는 경향을 발견: y= a0 + a1 + a2 + anxn + 회귀분석의 목적. 종속변수에 영향을 미치는 독립변수를 파악하며, 이때 95% 신뢰수준 하에서 종속변수에 영향을 미치는 통계적으로 유의한 영향을 주는 독립변수 파악. 독립변수가 종속변수에 영향을 미치는 정도는 회귀계수 값을 통해 파악 회귀분석의 가정 각각의 독립변수 간에는 상호 독립적, 즉 상관관계가 없음독립변수와 종속변수 간에는 통계적으로 유의한 인과관계가 있어야 함 (만약에 인과관계가 없거나 통계적으로 유의하지 않으면 회귀식이 의미가 없음). 모든 회귀계수가 95% 신뢰수준 하에서 통계적으로 유의한지를 검증한 후에 해당 회귀식을 해석해야 함. ei 는 서로 독립이며, 평균이 0, 분산이 82 인 정규분포를 따름. 회귀분석의 종류.  단순회귀분석 하나의 독립변수와 하나의종속변수간의 인과 관계 분석. 다중회귀분석(multiple R.A): 종속변수를 설명하는 독립변수가 2개 이상인 회귀분석. 더미회귀분석(dummy R.A): 성별, 계절 등과 같이 숫자로 표현 할 수 없는 통제변수를 이용한 회귀분석 (더미변수의 수는 통제 하고자 하는 대상의 수에 1을 차감한 값을 사용). 회귀분석 해석방법 - 조정된 결정계수를 살펴본다. 추정한 회귀식이 해당자료를 얼마나 잘 설명하느냐의 정도를 나타낸다. 이 값은 0~1 사이 값을 가지며, 1에 가까울수록 추정회귀식이 해당 자료를 잘 설명함을 의미한다유의한 F를 본다. 이는 전체 회귀식이 성립하는지의 여부를 판단한다. 따라서 이는 최소한 하나 이상의 회귀계수가 0이 아니어야 한다. 이는 회귀계수가 모두 0이면 회귀식이 무의미하기 때문이며, F값이 0.05(95% 신뢰수준)보다 작으면 '회귀식이 모든 회귀계수가 0이다' 라는 귀무가설을 기각하게 되며, 따라서 적어도 하나 이상은 0이 아니기 때문에 회귀식이 성립하게 된다P-값을 본다. 이는 해당 회귀계수가 통계적으로 0이 아닌지를 판단한다.

, 유의한지의 여부 판단은 P-값이 0.05(95% 신뢰수준)보다 작으면 '해당 독립변수의 회귀계수가 0이다' 라는 귀무가설을 기각하게 됨앞에서 본 P-값이 0.05 이상인 독립변수의 경우에는 이를 제거하고 다시 회귀분석을 실시한다.

Y 절편에 대한 P-값은 아무런 의미가 없기 때문에 해석하지 않는다계수를 이용하여 해당 회귀식을 직접 구한다.

더미회귀분석 해석더미변수의 수는 통제하고자 하는 수(n)에서 1을 차감한 값만큼 사용한다예를 들면 통제변수가 계절(, 여름, 가을, 겨울)인 경우 더미변수의 개수는 4-1=3으로 한다해석 : 더미변수에 대한 t-검증은 하지 않는다. , 더미변수는 독립변수가 아니기 때문에 P-값을 해석하지 않는다.

 

반응형

댓글