오늘 소개할 논문은 카카오 브레인과 카카오 모빌리티에서 발표한 택시 수요 예측 모델인 TGNet 입니다. 원문은 이곳 에서 확인할 수 있습니다.
- 모델의 의의
- 교통량, 날씨와 같은 외부데이터를 사용하지 않고 높은 성능을 보임
- CNN 과 temporal guided embedding, 을 사용함
- 택시 공급량을 측정, Late fusion 하여 갑작스러운 수요 예측에 성능 향상을 보임
- TGNet의 전체 모델은 크게 세 파트로 구성되어 있습니다.
- 1) Basic Model Architecture
- 2) Temporal Embedding
- 3) Supplement Embedding
1. Basic Model Architecture
- 데이터 도메인
- 카카오 모빌리티의 택시 수요 예측은 단순히 시계열 예측이 아닌 시공간상의 수요 예측임
- Spatio-Temporal Data Mining
- 데이터 표현
- 택시 수요를 시간에 따라 변화하는 이미지 형태로 데이터를 구성함
- 서울시를 50x50 의 총 2,500개의 grid로 분할함
- 해당 grid cell 에서 발생한 택시 수요를 카운팅하여 매핑함
- 해당 grid cell에서 발생한 수요가 많을수록 값이 커짐
- 일반적인 이미지 데이터 처럼 grid cell의 값이 클수록 밝은색을 띄게 됨
- 입력 / 출력 구성
- 수요 데이터를 30분 간격 으로 종합한 뒤 과거 4시간 을 입력, 미래 30분 을 출력으로 사용함
- 30분 동안의 이미지가 총 8장 겹쳐진 형태로 데이터를 표현 (8채널의 2D 이미지)
2. Temporal guided Embedding
- 데이터 구성
- 택시 수요는 공간적인 상관성 뿐만 아니라 시간적인 상관성도 존재
- 예측하려는 시점의 시간 정보를 입력으로 활용함
- 요일(7), 시간+분(48), 공휴일 여부(1), 공휴일 다음날 여부(1) 의 총 57 차원으로 시간을 표현할 수 있음
- Temporarl Matrix 를 입력으로 활용하여 추후에 공간 데이터와 결합함
- 정답을 맞추는 것을 안내(guided) 한다고 하여 Temporal guided Embedding이라고 표현 함
- 이전의 Basic Model Architecture 와 결합
- 8차원으로 임베딩된 Temporal Information of Target 을 이전 단계에서 만들어준 이미지와 결합해줌
- (None, 8) 의 이미지를 RepeatVector 를 사용해 (None, 2500, 8) 형태로 변환
- 이후 이미지 데이터와 차원 결합을 하기 위해 (None, 50, 50, 8) 형태로 Reshape 해줌
- 이전의 이미지 데이터는 (None, 50, 50, 8) 차원이기 때문에 모양을 바꿔준 시간 데이와 axis=-1 로 concatenate 이 가능함.
3. Late Fusion with Supplemental Data Sources
- 목적
- Late Fusion을 활용해 외부 데이터를 쉽게 결합할 수 있는 구조
- 본 논문에서는 하차량(공급량)과 관련된 정보를 결합하여 평상시와 다른 상황에서 발생한 수요에 효과적으로 대응함
- 예를 들어 서울 월드컵경기장에서 축구 경기와 같은 이벤트가 존재할 경우 해당지역에서 하차완료한 차량의 숫자는 많아질 것이며 이와 관련된 정보를 입력으로 활용함
4. Training
- 학습 과정
- Historical Demand와 Temporal Information of Target이 결합된 3차원 텐서에 3x3 CNN 을 적용
- 이후 Deconvolution(CNN의 반대 연산) 을 적용하여 feature map을 역추적하는 방식으로 학습을 진행함
- 최종 출력값인 (None, 50, 50, 1) 사이즈의 입력이 나오도록 전체적인 모델 아키텍쳐를 설계함
4. 모델 성능
- 택시 수요 예측에서 주로 사용하는 평가지표
- 1) MAPE
- 공식: | (실제값 - 예측값) / 실제값 |
- 의미: 예측값이 실제값에서 몇 %정도 오차가 있는가
- 특징: 작은 예측값에 민감함
- 2) RMSE
- 공식: (실제값 - 예측값) ^ 2
- 의미: 예측값이 실제값에서 떨어져있는 정도의 제곱
- 특징: 큰 값의 예측에 민감함
- 1) MAPE
- 성능
- 외부데이터를 사용하지 않고 STDN을 제외하고는 높은 성능을 보임
- STDN에 비해 파라미터 개수는 20%로 감소함
5. 느낀점
- 30분 단위 수요 예측은 배치성 모델 이다. 정확도와 어느정도의 속도를 모두 잡을 수 있다는 점에서 TGNet 은 훌륭한 모델이다.
- Late Fusion 을 통해 도메인에 맞춰 다양한 외부데이터를 결합할 수 있다는 점에서 매력적이다.
- 모델 구조는 단순하지만 논리적이다.
출처
- 논문 원문: https://openreview.net/pdf?id=BygF00DuiX
- 카카오 브레인 Tech Blog: https://www.kakaobrain.com/blog/43