머신러닝 개발자로 일을하다보면, “예측”과 “추론” 이라는 단어를 많이 듣는다. 이 둘의 차이가 무엇일까?

예측

예측은 미래 가치를 추정하는 값을 말한다.
예를 들어 주식 예측, 집값 예측, 버스 도착 시간 예측 등이 있을 수 있다.

그리고 예측에는 온라인 예측과 배치 예측 두가지 종류가 있다.

  • 온라인 예측(oneline prediction)은 거의 실시간으로 적은 수의 예측값을 얻고자할 때 사용된다.
  • 배치 예측(batch prediction)은 오프라인에서 많은 양의 데이터에 대한 예측을 생성하는 것을 말한다.

온라인 예측의 경우 어떻게 사용할 수 있을까?

쉽게 생각하면 인스타그램에서 사용될 수 있는데, 예를 들어 내가 어떠한 해시태그를 검색 했을 때, 실시간 데이터에 의해 30분 후 관련 추천 게시물이 나에게 뜨는 것이 예로 볼 수 있다.

oneline

30분마다 데이터를 받아서 예측하는 모델이라 가정

배치 예측 작업은 많은 양의 데이터에 대한 예측을 분석할 때 유용하다. 배치 예측은 온라인 예측보다 더 많은 데이터를 다루기 때문에 배치 예측이 온라인 예측보다 오래걸린다.

추론

그렇다면 추론은 무엇일까?

우리는 이미지를 분류하거나, 텍스트 리뷰에 대한 감정 분류와 같은 모델을 보고 예측이라는 말을 사용하지 않는다.
예측은 미래를 뜻하는 단어이기 때문이기 때문에 ‘예측’이라는 용어를 사용하긴 어렵다. 이런 경우에는 ‘예측’이라는 용어를 대체할 수 있는 ‘추론’이라는 용어를 사용한다.

inference