데이터과학70 이동평균선과 RSI를 이용한 알고리즘 투자전략 (feat. 파이썬) 이 글은 교육적인 목적으로 작성되었습니다. 투자 조언으로 받아 들여서는 안되며, 투자는 본인의 재량에 따라 하십시오. 주식 시장의 기술 지표란? 주식 시장의 기술 지표란 주식 가격의 추이 또는 회사의 재무 데이터를 해석하여 미래의 가격 변동을 예측하는데 사용되는 일종의 참고 자료라고 할 수 있습니다. 주식 시장의 기술 지표는 투자자가 보유하고 있는 종목을 매도 할 타이밍인지? 아니면, 새로운 종목을 매수 할 타이밍인지? 등을 결정하는데 참고로 활용할 수 있습니다. 기본적인 기술 지표 단순 이동 평균(Simple Moving Average, SMA) : 단순 이동 평균선은 "이평선"이라고도 불리며, 현재 주가의 트렌드가 계속 될지 또는 하락 추세를 반전하는 계기가 될지 여부를 판단하는데 도움이 될 수있는 .. 2020. 12. 25. 고차원 데이터의 차원 축소와 시각화 방법 (PCA vs. t-SNE) 데이터분석과 관련하여 가장 중요한 것은 데이터가 어떻게 생겼는지 탐색하는 과정입니다. 이 과정에 데이터의 특정 변수의 분포를 관찰할 수도 있고, 서로 상관관계가 있는 변수들이 어떻것이 있는지 살표보는 과정이 있을 수도 있다. 하지만, 최근에는 데이터셋이 갖고 있는 변수의 숫자가 늘어남에 따라서 몇몇 특정 변수의 분포를 살펴보는 것으로 데이터를 탐색한다고 말하기가 어려운 상황입니다. 고차원의 데이터로부터 핵심적인 정보를 추려내고 시각화 한 후에야 데이터가 어떤 특징을 갖고 있는지 탐색하는게 가능합니다. 이러한 문제점을 해결해 줄 수 있는 방법으로 고차원 데이터의 차원을 줄여서 시각화 하는 기술은 매우 중요합니다. 이러한 기술로 주성분분석(Principle Component Analysis, PCA)와 t-.. 2020. 12. 25. 추천시스템: 컨텐츠 기반 필터링 컨텐츠 기반 필터링이란? 컨텐츠 기반 필터링은 사용자가 과거에 경험했던 아이템 중 비슷한 아이템을 현재 시점에서 추천하는 것입니다. Information Retrieval과 Machine Learning의 중간 지점 정도라고 생각할 수 있습니다. 즉, 컨텐츠 기반 추천시스템은 정보(아이템)를 찾는 과정과 과거 정보를 활용해서 유저의 성향을 배우는 문제라고 볼 수 있습니다. 아래 그림에서 볼 수 있듯이, 협업필터링과는 개념이 다릅니다. 가령, 웹사이트, 블로그, 뉴스를 구독하고 있는 고객에서 비슷한 컨텐츠의 게시글(item)을 찾아서 추천해 주는 모델을 생각해 보시면 됩니다. 하지만, 컨텐츠 기반 추천시스템은 계속 편향적으로 유저에게 아이템을 추천하는 경우가 많으니 모형을 개발할때 주의해야 합니다. 컨텐츠.. 2020. 12. 18. 인공지능(Artificial Intelligence)의 4가지 유형 이번 포스팅은 미국 미시간 주립 대학교의 Ared Nintze 교수가 Cloud & Computing에 기고한 글을 변역한 것입니다. 원문을 여기를 통해서 읽어보실 수 있습니다. 인공 지능 최신 연구에 따르면 지각 능력과 지능을 갖춘 기계가 완성되기까지 오랜시간이 걸리지 않을 것 같습니다. 기계는 언어 명령을 이해하고, 그림을 구별하고, 자동차를 운전하고 게임을 우리보다 더 잘합니다. 2016년 백악관 보고서에 따르면 인공지능의 미래에 대해 일부 회의적인 견해를 가지고 있습니다. 향후 20년 동안 기계는 "인간과 비슷하거나 그 이상으로 광범위하게 적용 가능한 지능을 보여주지 않을 것"이라고 말합니다. 하지만 앞으로 몇 년 동안 "기계는 더 많은 분야에서 인간 수준의 성능에 도달하고 더 많은 작업에서 인간.. 2020. 12. 13. 시계열 데이터 분석 및 예측을 위한 완벽한 가이드 금융 시장의 추세 또는 전기 소비량을 예측하는 모델에서 시간은 중요한 요소입니다. 예를 들어, 전기 생산량이나 전기 요금을 조정하기 위해 하루 중 어느 시간에 전력 소비가 가장 많을지 예측하는 것은 생각해 볼 수 있습니다. 시계열은 단순히 시간 순서로 정렬된 일련의 데이터 포인트입니다. 시계열 모형에서 시간 정보는 독립 변수이며 최종 목표는 일반적으로 미래를 예측하는 것입니다. 시계열 데이터를 다룰때 다음의 두가지를 중요하게 고려해야 합니다. 시계열의 안정성(by examining stationary test) 시계열의 주기적인 변동성을 의미하는 계정성(seasonality) 오차항의 자기상관(by examining Durbin-Watson statistics) 이번 포스팅에서는 시계열의 다양한 특성과 .. 2020. 12. 11. 코호트 retention을 통한 고객 고객평생가치 (LTV) 추정 이번 포스팅은 고객의 lifetime 가치를 추정하는 2부작 시리즈의 1부입니다. 이 글에서는 2부에서 Python 코호트 분석 예제를 설명하기 위해 필요한 개념석 수준의 고객평생가치(lifetime value, LTV) 추정 방법을 설명합니다. 왜 LTV가 필요할까요? 고객 획득 비용(customer acquisition costs, CAC)에 대한 벤치 마크를 만들고, 고객을 비교하는 데에는 두 가지 이유가 있습니다. LTV를 추정하기 위해 이탈 또는 retention을 사용하는 것에 대해 설명하는 여러 이론들의 핵심 아이디어는 동일하지만 계산 방식은 크게 다릅니다. 따라서, 어떤 분석가는 이번 포스팅을 읽으면 이익을 얻을 수도 있습니다. 하지만 이번 포스팅의 주요 목표는 과거 보유 데이터를 사용하여.. 2020. 11. 14. 이전 1 ··· 3 4 5 6 7 8 9 ··· 12 다음 728x90