자연어처리를 활용해서 주가를 예측한다. 이야기가 들리기 시작했던 건 상당히 오래 전으로 기억합니다만, 최근 딥러닝 알고리즘의 발전에 힘입어 다시 떠오르는 주제입니다. 오늘은 벡터 차이의 의미를 동시발생 확률 비율의 차이로 파악하는 GloVe 모델과 함께, 주가 예측 목적으로 자연어 텍스트를 전처리하는 방법 등에 대해 살펴봅니다.
네이버 블로그 리뷰 크롤링
작성일
|
In
Web Crawling
우리에게 보여지는 네이버 블로그 URL은 사실 가짜 주소인 것을 알고 계신가요? 이번 포스팅에서는 네이버 블로그의 도서 리뷰를 크롤링하는 과정에서 학습한 내용을 공유합니다.
Write Code Every Day
작성일
|
In
Soft Skill
매일매일 코드를 작성하라. 개발자에게 사이드 프로젝트는 숙명과 같고, 이는 언제나 본업과 일 바깥의 삶과 시간을 조율해야 함을 의미합니다. 이번 포스팅은 사이드 프로젝트와 워크라이프 밸런스에 관한 John Resig의 이야기를 소개합니다.
Word2Vec for Finance
작성일
|
In
Machine Learning
,
Finance
What’s the next factor for $\alpha$? 시장수익률 이상을 넘어서는 초과수익은 불가능하다는 효율적 시장가설(Efficient Market Hypothesis)이 존재함에도, 금융시장의 플레이어들은 남들이 모르는 정보를 기반으로 초과수익을 달성하고자 합니다. 최근 주가예측과 관련해 새로이 개척되고 있는 자연어처리(NLP, Natural Language Process)를 Word Embedding과 Word2Vec 중심으로 살펴봅니다.
Linear Regressor vs. Linear Classifier
작성일
|
In
Machine Learning
Linear Model은 선형방정식을 이용하여 벡터를 연산하는, 머신러닝에서 가장 기본적인 모델 중 하나입니다. 이 모델은 회귀와 분류 문제에 모두 활용할 수 있으며, 문제에 따라 각기 다른 학습 방법을 사용합니다. 이 주제에 대하여, 최근 수강하고 있는 딥러닝의 깊이 있는 이해를 위한 머신러닝(k-mooc) 수업에 제출한 레포트를 공유합니다.