使用机器学习预测股价
股票价格预测有助于确定未来几天或几周内股票的走势,或者至少显示趋势。股票价格取决于多种因素,例如:
基本因素:收入,利润,市场份额,业务的潜在增长前景
外部因素:大流行病,例如新冠,外汇汇率,石油价格,黄金价格,债券收益率,全球股票市场
技术因素:价格走势,交易量,移动平均线,macd(移动平均趋同差异),rsi(相对强度指数),mfi(资金流量指数),支点,衍生产品到期日,期权未平仓合约,期货价格
不管有没有这些因素,
- 股票价格不是随机的,它们的确遵循过去的历史趋势
- 人为的决定是情感和理性的结合,倾向于查看过去的数据
- 市场永远是对的。他们只会惩罚错误的决定
- 贪婪,盲目打电话,高风险的食欲,谨慎行事可以根据时间奖励或惩罚投资者。
在本文中,我们将尝试使用facebook的prophet
预测
为了这个分析,我选择了cdsl(印度*存托服务有限公司)的股票。数据可以从https://www.nseindia.com/get-quotes/equity?symbol=cdsl下载,并点击历史数据。考虑到2020年3月的市场崩盘是一个黑天鹅事件,我取了从2020年4月到2021年4月的一年数据。
import pandas as pd cdsl = pd.read_csv(‘/users/ravindraprasad/01-elicherla/01-datascience/cdslapril.csv’
上面的代码是导入_pandas _并下载数据。请在代码中使用适当的文件夹。
cdsl在下面显示带有标题的数据。
列名有一个小问题。以免在列中列出
list(cdsl.columns)
如您所见,在列名的末尾有一个空格
我正在更改列名
df = cdsl.rename(columns = {‘date ‘: ‘date’, ‘series ‘: ‘series’, ‘open ‘: ‘open’ , ‘high ‘: ‘high’, ‘low ‘: ‘low’, ‘prev. close ‘: ‘prev. close’, ‘ltp ‘: ‘ltp’, ‘close ‘: ‘close’, ‘vwap ‘: ‘vwap’, ‘52w h ‘: ‘52w h’, ‘52w l ‘: ‘52w l’ , ‘volume ‘: ‘volume’, ‘no of trades ‘:’no of trades’ }, inplace = false)
现在,所有列名称都更改为相同的名称,但没有空格
要使用先知,日期是重要的变量。
cdsl ['date']
看起来确实是正确的日期。但是,当我们进行排序时,就会遇到挑战。如您在下面看到的,它没有正确排序。这是因为日期格式不正确。
现在,让我们更改日期格式。
df[‘date’] = pd.to_datetime(df.date,format=’%d-%b-%y’) df.sort_values(by=[‘date’], inplace=true, ascending=true) df
现在日期已经整理好了。让我们使用matplotlib绘制数据
from matplotlib import pyplot as plt import numpy as np x = df[‘date’] y = df[‘ltp’] plt.plot(x, y)
现在是时候为先知准备数据了。先知只需要两个变量。我们将使用date和ltp(这是最后交易价格)
dfdata = df[[“date”,”ltp”]] dfdata.rename(columns={“date”:”ds”}, inplace=true) dfdata.rename(columns={“ltp”:”y”}, inplace=true)
对于先知,我们需要在上面将其重命名为" ds"和" y"两个变量。在进行预测之前,让我们快速查看数据
导入先知并使用数据创建模型。
from fbprophet import prophet m = prophet() m.fit(dfdata)
让我们预测接下来的300天。
future = m.make_future_dataframe(periods=300) future.tail()
forecast = m.predict(future) dfforecast= forecast[[“ds”, “yhat”, “yhat_lower”, “yhat_upper”]] pd.set_option(‘display.max_rows’, dfforecast.shape[0]+1) dfforecast
fig1 = m.plot(forecast)
fig2 = m.plot_components(预测)
让我们建立交互式图形。
from fbprophet.plot import plot_plotly import plotly.offline as py py.init_notebook_mode() fig = plot_plotly(m, forecast) # this returns a plotly figure py.iplot(fig)
该模型预测cdsl达到rs。2021在11月1日当周,而卢比的下限较低。859卢比以上。1164.让我们拭目以待!!!
最后友情提醒:股市有风险,入市需谨慎!
最近准备看一些机器学习、深度学习方面的论文为后面读研打基础!在学习过程中搜集了入门器学习、深度学习经典书籍,关注公众号[程序员石磊],回复“机器学习”即可免费获得!
上一篇: 现在后端都在用什么数据库存储数据?