목록ETRI(한국전자통신연구원) (9)
JUINTINATION
마지막 후기.. 2달 동안의 ETRI 연구연수생 생활이 끝이 났다. 드디어라는 표현도 애매하고 결국이라는 표현도 애매한.. 뭐 그렇게 끝이 났는데 결론은 경험적으로 얻어 가는 것도 많았고 좋은 사람들도 많이 만나게 돼서 감사한 시간이었던 것 같다. Weekly 추천에서 Monthly 추천으로 지난 글에서 적지 않았던 마지막 과제가 있는데 바로 기존의 주별로 상품을 추천하던 모델을 월별로 상품을 추천하도록 모델을 수정하는 것이다. 주별로 데이터를 자르게 된다면 그냥 7일 단위로 자르면 되기 때문에 아무런 문제 없이 진행했는데 월별로 자르려고 하니까 각 월마다 30일인 월이 있고 31일 월이 있고.. 2월은 또 윤년까지.. 이런 조건들을 만족시키는 로직을 작성하려고 하니까 코드가 너무 지저분해질 것 같고 귀..
8주차 후기 이제야 윤곽을 잡은 것만 같은 느낌이 드는데.. 다음주면 벌써 ETRI도 마지막이다. 이제 다시 대학생이 된다니.. 시원섭섭하다. 맡은 과제를 완벽하게 끝내고 싶다는 생각은 내 욕심이었던 것만 같고 잘 마무리하고 다시 조치원으로 이사할 계획이나 완벽하게 짜야겠다. 마지막 회의 나의 마지막 회의는 아니고 입사 동기의 마지막 회의가 화요일에 진행됐다. 나는 박사님이 말씀하신 모든 상품에 대한 판매량 예측을 적용하고 실제 데이터의 판매량 기준 top N과의 정밀도 비교를 kan4에서 kan6, kan8까지 모두 오류를 해결하고 발표했고 동기는 추가적인 전처리와 TFT 모델에 대해 발표했다. 발표 이후에 내가 받은 피드백은 크게 다음과 같다. XGBoost 모델과 CatBoost 모델의 예측값을 가..
7주차 후기 설 연휴는 눈 깜빡하니까 사라져있었고, 에트리는 벌써 6주차라는게 믿기지 않을 정도로 시간이 참 빠른 것 같다. 퇴직 관련 서류 제출 안내 메일도 날아오고.. 이제 다시 대학생이 되는 날이 진짜 얼마 남지 않았다니.. 늦은 환영회 월요일에 출근하니까 메일이 한 통 와있었다. 오늘 저녁 식사 괜찮은지에 대한 메일이었다. 물론 며칠 전에 보내신거긴 하지만 회사 인트라넷 메일로 보내신거라 확인을 못 한 것일 뿐이다. 아무튼 우리는 산촌쌈밥이라는 곳에서 회식을 하게 되었다. 뭔가 술을 먹을 것 같아서 점심시간에 차를 집 앞에 주차해두고 버스타고 다시 돌아올까 고민중이었는데 같이 가는 동기 형이 내가 차가 있다는 사실을 박사님께 말씀드린 것 같다. 그래서 박사님이 내 자리로 오시더니 "인턴들은 학생 ..
6주차 후기 이번 주는 설 연휴가 껴있어서 일주일 내내 목요일만 기다렸던 것 같다. 박사님들도 다 휴가 가시고 안 계셔서 목요일엔 진짜 집중 안 돼서 죽는 줄 알았다. 아무튼 일주일동안 있었던 일들을.. 적어보자. vscode Remote - SSH 이슈 나는 지금까지 로컬에서 모델을 돌린 것이 아니라 내 자리에 있는 서버에 vscode에서 SSH로 연결하여 가상환경을 만들고 거기서 모델을 돌렸다. 그런데 월요일에 출근하자마자 아무것도 건든 것이 없는데 SSH로 접속이 안 되는 것이다. 물론 처음에 vsc에서 업데이트가 되었다고 릴리즈 노트가 뜨긴 했지만 당연히 대수롭지 않게 넘겼었다. 그래서 로그메시지 보면서 연결 config 파일도 계속 수정해보고, 서버에 있는 관련 파일도 재설히해보고 등등 계속 삽..
5주차 후기 역대급으로 아무런 성과를 내지 못한 일주일이었던 것 같다. 그 어떤 시계열 모델을 학습시켜봐도 r2_score는 음수가 나오고 손실 값은 하늘 높은 줄 모르고 치솟았다. 진짜 열심히 뭔가 뚝딱뚝딱 한 것 같은데.. 그만큼 성과가 나오지 않으니까 현타도 많이 오고 스트레스도 이만저만이 아니었던 것 같다. Neural Prophet에 Event 적용 LSTM과 추가적인 데이터 전처리는 동기가 맡고 나는 Neural Prophet에 event를 적용할 수 있다는 사실을 알게 되어서 시도해보고 있었다. 아무래도 상품 판매같은 경우는 일반 시계열 데이터처럼 매일매일 하루도 빠짐없이 특정 정보를 얻을 수 있는 것이 아니라 최신 트렌드, 할인 등등 여러 상황에 따라 아무 상품도 판매하지 않는 날도 있을 ..
4주차 후기 처음에는 과제가 너무 막막했지만.. 아직도 너무 막막하다! 지난 3주차 후기에 fastai의 회귀 모델인 Tabular_learner를 사용했다고 했는데 여러 이유로 지금은 다른 시계열 모델로 넘어가는 과정에 있다. 데이터를 계속 분석하다 보니 이 데이터는 협업 필터링 모델과는 맞지 않다는 생각이 계속해서 들고 있고, 동기와 얘기하면서 협업 필터링 모델을 통해 어떤 달에 대해 점수가 가장 높게 예측되는 상품을 추천하면 시계열 모델로 그 상품의 예상 판매량을 뽑는 방향으로 갈 것 같다. Tabular_learner의 문제점 일단 가장 큰 문제는 cuda를 사용하면 오류가 난다는 것이다. 정확한 원인은 모르겠지만.. 추측하기론 특정 데이터셋에만 오류 없이 모델이 돌아가는 것도 그렇고, 학습 데이..