본문 바로가기

Data Science

(7)
p-value에 대한 짤막한 지식 정리 p-value 란 ? 귀무 가설(연구에서 검증하려는 가설)이 맞다는 전제하에 내가 구한 통계값이 얼마나 자주 나올 것인가? 추출한 데이터의 평균이 원래의 전체 데이터 평균과 얼마나 다른 값인지를 알 수 있는 방법 p-value가 필요한 이유 모집단을 통해 검정을 하는게 아니라 sampling 된 데이터를 바탕으로 가설 검정을 하기 때문에 필요하다. 아무리 무작위 추출을 잘 한다 하더라도 추출된 데이터의 평균은 전체 데이터의 평균에서 멀어질 수 있다. p-value = 0.05 이 나왔다. 어떻게 해석할 수 있을까? 100번의 실험을 했을 때 95번의 실험이 연구자의 가설대로 재현이 되었고 5번의 예외적 경우가 있었다. AB Test를 수행했는데 그 결과의 p-value 가 높았다. 어떻게 하면 좋을까? ..
그랩이 라이드 헤일링 서비스에서 수요 공급을 정의하고 불균형을 해소한 방법 그랩(grab) 은 동남아시아 8개 국에서 라이드 헤일링 서비스 플랫폼을 제공하고 있는 모빌리티 회사입니다. 택시 서비스를 호출할 수 있는 Grabtaxi, 우버처럼 일반인이 운행하는 택시를 부르는 GrabCar, 오토바이를 호출할 수 있는 GrabBike, 소형 화물을 포함한 퀵 서비스를 이용할 수 있는 GrabExpress, 카풀 서비스인 GrabShare 등 정말 다양한 종류의 이동과 관련된 서비스를 제공하고 있습니다. 오늘 포스팅은 다양한 IT 기술을 활용해 동남아시아의 모빌리티 서비스를 혁신 하고 있는 그랩이 라이드 헤일링 서비스에서 수요 공급을 표현하고 발생하는 수요 공급 불균형을 해결하는 액션 아이템에 대한 포스팅입니다. Grab tech blog 에 있는 Understanding Suppl..
[논문 리뷰] A Unified Neural Network Approach for Estimating Travel Time and Distance for a Taxi Trip 이번에 리뷰할 논문은 디디추싱(DiDiChuXing)에서 발표한 A Unified Neural Network Approach for Estimating Travel Time and Distance for a Taxi Trip 이라는 논문입니다. 위 논문에서는 Taxi Trip의 이동 시간과 이동 거리를 동시에 예측할 수 있는 모델인 ST-NN(Spatio-Temporal Neural Network)에 대해서 소개하고 있습니다. 1. Abstract ST-NN은 출발지와 목적지 사이의 이동 거리를 먼저 예측한 다음, 이를 시간 정보와 결합하여 이동 시간을 예측한다. Feature Engineering없이 출도착지의 GPS Point와 시간 정보만을 활용하여 이동 시간과 거리를 동시에 예측 할 수 있다. T..
[논문 리뷰] 카카오 모빌리티 택시 수요 예측 모델 TGNET 오늘 소개할 논문은 카카오 브레인과 카카오 모빌리티에서 발표한 택시 수요 예측 모델인 TGNet 입니다. 원문은 이곳 에서 확인할 수 있습니다. 모델의 의의 교통량, 날씨와 같은 외부데이터를 사용하지 않고 높은 성능을 보임 CNN 과 temporal guided embedding, 을 사용함 택시 공급량을 측정, Late fusion 하여 갑작스러운 수요 예측에 성능 향상을 보임 TGNet의 전체 모델은 크게 세 파트로 구성되어 있습니다. 1) Basic Model Architecture 2) Temporal Embedding 3) Supplement Embedding 1. Basic Model Architecture 데이터 도메인 카카오 모빌리티의 택시 수요 예측은 단순히 시계열 예측이 아닌 시공간상의..