본문 바로가기

All

(23)
2021년 회고 2021년은 정말 변화가 많은 해였다. 올해 겪었던 일들을 정리해보면 아래와 같다. 집 청년 임차 보증금 대출을 받아서 군자역 인근에 만족스러운 전세집을 얻었다. 태어나서 처음으로 자금 계획을 세우고 대출을 받아서 집 문제를 해결했다는 점에서 대견스럽다. 내 집 마련도 화이팅이다. 회사의 변화 회사가 서울숲으로 이사가게 되면서 SOCAR 데이터 그룹에 소속되어 업무를 했다. 데이터 직군에서 전문성을 가지고 있는 다양한 사람들에게 영감을 받을 수 있었다. 타다가 토스에게 인수되었다. 토스에 있는 사람들에게 많은 영감을 받고 있다. 토스의 몰입 정신과 피드백 중심의 업무 문화, 그리고 단순함을 추구하는 제품 원칙은 추후에 창업을 했을 때 꼭 도입하고 싶다. 약 2달 동안 타다 넥스트 신사업을 준비하는 유닛의..
p-value에 대한 짤막한 지식 정리 p-value 란 ? 귀무 가설(연구에서 검증하려는 가설)이 맞다는 전제하에 내가 구한 통계값이 얼마나 자주 나올 것인가? 추출한 데이터의 평균이 원래의 전체 데이터 평균과 얼마나 다른 값인지를 알 수 있는 방법 p-value가 필요한 이유 모집단을 통해 검정을 하는게 아니라 sampling 된 데이터를 바탕으로 가설 검정을 하기 때문에 필요하다. 아무리 무작위 추출을 잘 한다 하더라도 추출된 데이터의 평균은 전체 데이터의 평균에서 멀어질 수 있다. p-value = 0.05 이 나왔다. 어떻게 해석할 수 있을까? 100번의 실험을 했을 때 95번의 실험이 연구자의 가설대로 재현이 되었고 5번의 예외적 경우가 있었다. AB Test를 수행했는데 그 결과의 p-value 가 높았다. 어떻게 하면 좋을까? ..
Anaconda를 활용한 가상환경 만들기 아나콘다(Anaconda) 는 수학과 과학 분야에서 사용되는 여러 패키지들을 묶어 놓은 파이썬 배포판으로서 SciPy, Numpy, Matplotlib, Pandas 등을 비롯한 많은 패키지들을 포함하고 있습니다. 특히 최근에 데이터 사이언스와 머신 러닝 분야에서 파이썬을 사용하기 위해 기본적으로 설치하는 배포판이 되어왔습니다. 최근에 머신러닝 관련 프로젝트를 진행하면서 패키지 간의 의존성 문제 때문에 약간 골치 아팠던 경험이 있는데요. 아나콘다 가상환경을 통해 이를 해결할 수 있었습니다. 가상환경은 말 그대로 가상의 환경을 의미하는데요. 머신러닝 프로젝트를 진행할 때는 python 버전 관리 와 패키지 충돌 방지를 위해 프로젝트 별로 각각의 독립된 가상환경을 만들고 이 환경에서 개발을 하는 것이 좋습니..
PMF(Product Market Fit)을 데이터로 확인하는 방법 0. PMF 의 정의와 중요성 PMF(Product Market Fit : 제품 시장 적합성)이란 좋은 시장에, 그 시장을 만족시킬 수 있는 제품을 갖고 있는 것을 의미합니다. 제품을 만들어 나가면서 빠지기 쉬운 가장 큰 함정은 아무도 원하지 않는 것을 만드는 것입니다. 제품에 기능을 추가하고 데이터 기반으로 여러가지 실험을 하기에 앞서서 해야될 일은 우리 제품이 PMF를 충족시켰는지 확인하는 것 입니다. PMF를 찾지 못한 상태라면 그 어떤 기능의 추가나 실험도 의미가 없습니다. 애초에 수요가 없는 제품이기 때문입니다. 그렇다면 우리 제품이 PMF를 충족시켰는지 확인하는 방법에는 어떤 것이 있을까요? 1. PMF 를 확인할 수 있는 지표 - 리텐션 리텐션은 고객들이 제품이나 서비스에 얼마나 꾸준히 남아..