본문 바로가기

통계: 이 또한 기본이라

EDA(탐색적 데이터 분석): 측정 지표와 추정값

 

통계학자들은 보통 데이터로부터 얻은 값과

실제 상태를 나타내는 이론적인 참값을 구분하기 위해,

데이터로부터 계산된 값들에 보통 추정값(estimate)이라는 용어를 사용한다.

 

반면,

데이터 과학자나 비즈니스 분석가들은 이렇 값들을 측정 지표(metric)라고 부른다.

 

이러한 차이는 곧 통계학과 데이터 과학의 접근법의 차이를 반영한다.

 

통계학이라는 분야는 궁극적으로 불확실성을 이해하고자 하는 반면,

데이터 과학구체적인 비지니스나 조직의 목표치에 관심을 둔다.

 

그러므로 통계학자들은 추정한다고 하고,

데이터 과학자들을 측정한다고 한다.

 

통계학에서의 추정은 어떤 참값을 어림잡아 추측한다는 의미가 강한 반면,

데이터과학에서의 측정 지표는 어떠한 기준값(혹은 목푯값)과의 거리(혹은 오차)를 표현하는 계측량이라고 할 수 있다.

 

출처: Bruce, P., Bruce, A., & Gedeck, P. (2020). Practical Statistics for Data Scientists (2nd ed.). O'Reilly Media.