JUINTINATION

ETRI 2024 동계 연구연수생 - 5주차 본문

ETRI(한국전자통신연구원)

ETRI 2024 동계 연구연수생 - 5주차

DEOKJAE KWON 2024. 2. 4. 22:06
반응형

5주차 후기

역대급으로 아무런 성과를 내지 못한 일주일이었던 것 같다. 그 어떤 시계열 모델을 학습시켜봐도 r2_score는 음수가 나오고 손실 값은 하늘 높은 줄 모르고 치솟았다. 진짜 열심히 뭔가 뚝딱뚝딱 한 것 같은데.. 그만큼 성과가 나오지 않으니까 현타도 많이 오고 스트레스도 이만저만이 아니었던 것 같다.

Neural Prophet에 Event 적용

LSTM과 추가적인 데이터 전처리는 동기가 맡고 나는 Neural Prophet에 event를 적용할 수 있다는 사실을 알게 되어서 시도해보고 있었다. 아무래도 상품 판매같은 경우는 일반 시계열 데이터처럼 매일매일 하루도 빠짐없이 특정 정보를 얻을 수 있는 것이 아니라 최신 트렌드, 할인 등등 여러 상황에 따라 아무 상품도 판매하지 않는 날도 있을 것이고 또 어느 날은 갑자기 많이 팔릴 수도 있는 것이고.. 해서 이런 이벤트를 모델 학습에 적용시킬 수 있다는 사실이 너무 반가웠다. 그래서 바로 박사님이 만들어주셨던 할인 이벤트 정보를 event_df로 만들어서 적용했는데.. 성능의 변화는 오차 범위 안이라고 봐도 될 정도로 미미했다.

XGBoost

XGBoost는 여러가지 경우에서 꾸준히 높은 성능을 보였다고 하는 모델이다. 누군가 깃허브에 Apple 주식의 전망을 예측하는 모델을 XGBoost로 구현했길래 해당 코드를 참고하여 우리 모델에 적용했다. 이 모델은 주가의 로그 증가율의 누적곱을 그래프로 나타내면서 모델이 예측한 값에 손실값에 따른 변동 가능한 값의 범위까지 나타냈는데 우리 데이터를 적용하니 맨 처음에 없는 데이터의 판매량을 전부 0으로 처리해둬서 누적곱을 적용하니 그래프가 일직선으로 나오는 문제가 있어서 누적곱을 사용하지 않기로 했으며 어찌저찌 그래프를 그려서 모델을 전부 완성했는데.. 예측한 값에 대한 손실 범위가 음수부터 양수까지.. 너무 넓었다. 이거론 판매량이 증가할지 환불량이 증가할지 알 수 없다. 아무튼 둘 중 어떤 모델을 사용할지는 더 고민해봐야겠지만.. 이제 다른 모델을 더 찾아보고 구현하는 것은 비효율적인 것 같다.

UST 입시설명회

지난 2월 2일에 ETRI 안에서 UST 과학기술연합대학원대학교 입시설명회가 있어서 참석했다. 사실 관심이 있어서 갔다기보단.. 도시락과 기념품 제공이라고 적혀있어서 간 것이긴 하지만 이런 연구쪽에 관심이 있는 동기들, 후배들에게 추천해주고 싶다는 생각이 들 정도로 환경도 나쁘지 않았고 메리트도 많아보였다.

일단 도시락은 너무 맛있었다. 공짜로 먹은 것 치고는 아주 마음에 들었다.
기념품은 여행용 칫솔 세트랑 텀블러였다.
퇴근 직전에 보는 일몰은 언제나 예쁘다.


결론

스퍼트 프로젝트도 오늘을 기준으로 마무리가 되었고.. 도커라이징을 결국 실패하긴 했지만 아무튼 내가 크게 성장할 수 있는 기회가 되었던 것 같다. 이렇게 성장한 내 실력이 ETRI 성과에도 도움이 되면 좋겠다.. 다음주도 즐거운 마음으로 감사한 마음으로 열심히 살아보자

728x90
Comments