본문 바로가기

Data Science

[논문 리뷰] 카카오 모빌리티 택시 수요 예측 모델 TGNET

 

카카오 T 앱

오늘 소개할 논문은 카카오 브레인과 카카오 모빌리티에서 발표한 택시 수요 예측 모델인 TGNet 입니다. 원문은 이곳 에서 확인할 수 있습니다.

  • 모델의 의의
    • 교통량, 날씨와 같은 외부데이터를 사용하지 않고 높은 성능을 보임
    • CNN 과 temporal guided embedding, 을 사용함
    • 택시 공급량을 측정, Late fusion 하여 갑작스러운 수요 예측에 성능 향상을 보임
  • TGNet의 전체 모델은 크게 세 파트로 구성되어 있습니다.
    • 1) Basic Model Architecture
    • 2) Temporal Embedding
    • 3) Supplement Embedding

모델의 전체적인 구조

1. Basic Model Architecture

  • 데이터 도메인
    • 카카오 모빌리티의 택시 수요 예측은 단순히 시계열 예측이 아닌 시공간상의 수요 예측임
    • Spatio-Temporal Data Mining
  • 데이터 표현
    • 택시 수요를 시간에 따라 변화하는 이미지 형태로 데이터를 구성함
    • 서울시를 50x50 의 총 2,500개의 grid로 분할함
    • 해당 grid cell 에서 발생한 택시 수요를 카운팅하여 매핑함
    • 해당 grid cell에서 발생한 수요가 많을수록 값이 커짐
    • 일반적인 이미지 데이터 처럼 grid cell의 값이 클수록 밝은색을 띄게 됨

공간 데이터를 grid 형태로 표현한 방식

  • 입력 / 출력 구성
    • 수요 데이터를 30분 간격 으로 종합한 뒤 과거 4시간 을 입력, 미래 30분 을 출력으로 사용함
    • 30분 동안의 이미지가 총 8장 겹쳐진 형태로 데이터를 표현 (8채널의 2D 이미지)

수요 데이터를 이미지 형태로 표현

2. Temporal guided Embedding

  • 데이터 구성
    • 택시 수요는 공간적인 상관성 뿐만 아니라 시간적인 상관성도 존재
    • 예측하려는 시점의 시간 정보를 입력으로 활용함
    • 요일(7), 시간+분(48), 공휴일 여부(1), 공휴일 다음날 여부(1) 의 총 57 차원으로 시간을 표현할 수 있음
    • Temporarl Matrix 를 입력으로 활용하여 추후에 공간 데이터와 결합함
    • 정답을 맞추는 것을 안내(guided) 한다고 하여 Temporal guided Embedding이라고 표현 함
      시간 데이터를 표현한 방식
  • 이전의 Basic Model Architecture 와 결합
    • 8차원으로 임베딩된 Temporal Information of Target 을 이전 단계에서 만들어준 이미지와 결합해줌
    • (None, 8) 의 이미지를 RepeatVector 를 사용해 (None, 2500, 8) 형태로 변환
    • 이후 이미지 데이터와 차원 결합을 하기 위해 (None, 50, 50, 8) 형태로 Reshape 해줌
    • 이전의 이미지 데이터는 (None, 50, 50, 8) 차원이기 때문에 모양을 바꿔준 시간 데이와 axis=-1 로 concatenate 이 가능함.

3. Late Fusion with Supplemental Data Sources

  • 목적
    • Late Fusion을 활용해 외부 데이터를 쉽게 결합할 수 있는 구조
    • 본 논문에서는 하차량(공급량)과 관련된 정보를 결합하여 평상시와 다른 상황에서 발생한 수요에 효과적으로 대응함
    • 예를 들어 서울 월드컵경기장에서 축구 경기와 같은 이벤트가 존재할 경우 해당지역에서 하차완료한 차량의 숫자는 많아질 것이며 이와 관련된 정보를 입력으로 활용함

4. Training

  • 학습 과정
    • Historical Demand와 Temporal Information of Target이 결합된 3차원 텐서에 3x3 CNN 을 적용
    • 이후 Deconvolution(CNN의 반대 연산) 을 적용하여 feature map을 역추적하는 방식으로 학습을 진행함
    • 최종 출력값인 (None, 50, 50, 1) 사이즈의 입력이 나오도록 전체적인 모델 아키텍쳐를 설계함

4. 모델 성능

  • 택시 수요 예측에서 주로 사용하는 평가지표
    • 1) MAPE
      • 공식: | (실제값 - 예측값) / 실제값 |
      • 의미: 예측값이 실제값에서 몇 %정도 오차가 있는가
      • 특징: 작은 예측값에 민감함
    • 2) RMSE
      • 공식: (실제값 - 예측값) ^ 2
      • 의미: 예측값이 실제값에서 떨어져있는 정도의 제곱
      • 특징: 큰 값의 예측에 민감함
  • 성능
    • 외부데이터를 사용하지 않고 STDN을 제외하고는 높은 성능을 보임
    • STDN에 비해 파라미터 개수는 20%로 감소함
    모델 성능 정리

5. 느낀점

  1. 30분 단위 수요 예측은 배치성 모델 이다. 정확도와 어느정도의 속도를 모두 잡을 수 있다는 점에서 TGNet 은 훌륭한 모델이다.
  2. Late Fusion 을 통해 도메인에 맞춰 다양한 외부데이터를 결합할 수 있다는 점에서 매력적이다.
  3. 모델 구조는 단순하지만 논리적이다.

 

출처