欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

短线买股赚钱的概率有多大?python带你来分析

程序员文章站 2022-04-15 21:58:04
股票操作讲究低买高卖,如果你能买在低点,卖在高点,那么你就是高手;如果你能买在高点,卖在低点,那么你就是“韭菜”。所谓“一盈两平七亏”,对应的是中国的 A 股市场中有 10% 的高手和 70% 的韭菜。进入股市买卖的都觉得自己是高手,最后亏得底裤都没了。 今天我们从一个简单的模型来看看短线交易的成功 ......

股票操作讲究低买高卖,如果你能买在低点,卖在高点,那么你就是高手;如果你能买在高点,卖在低点,那么你就是“韭菜”。所谓“一盈两平七亏”,对应的是中国的 a 股市场中有 10% 的高手和 70% 的韭菜。进入股市买卖的都觉得自己是高手,最后亏得底裤都没了。 今天我们从一个简单的模型来看看短线交易的成功率有多大?

短线交易模型的由来短线买股赚钱的概率有多大?python带你来分析

所谓短线交易,就是在一个股价的地点买进,然后在几天之内卖出。

a 股大多数交易者都喜欢短线交易,他们都希望今天买入,明天就卖出,以此来赚快钱,殊不知短线交易是大多数人亏损最快的方式。

a 股市场上有一批最顶尖的高手,他们可以做到八年一万倍的神话,这类高手惊人收益率的来源就是短线交易,他们的镰刀专门伸向追涨杀跌的韭菜。

正式因为有这群人的存在,a 股还有一个著名的榜单,叫做“龙虎榜”。

沪深交易龙虎榜指每日两市中涨跌幅、换手率等由大到小的排名榜单,并从中可以看到龙虎榜单中的股票在哪个证券营业部的成交量较大。该数据有助于了解当日异动个股的资金进出情况,判断是游资所为还是机构所为。

我们的短线交易模型就是要从这个龙虎榜说起。 我在浏览东方财富网的龙虎榜时,无意中发现他们有个奇怪的数据,如下图所示:

短线买股赚钱的概率有多大?python带你来分析

这一栏数据表示的是近三个月内该营业部买入个股后3天个股上涨的概率。

我们都知道股票就是个概率游戏,如果我能够计算出一只股票的上涨概率,那么我就能根据概率来进行博弈了。如果我每次买入之后上涨的概率大于50%,那么每次下注的话,长期来看,稳赢啊!

我越想越兴奋,感觉发现了一座金矿!

我的脑海中顿时闪现了一个思路:根据每个营业部买入后3天个股上涨的概率以及营业部买入的金额占总买入金额的比例,我计算出每只上榜股票后面3天上涨的概率。

具体的步骤如下:

  1. 先将买入的营业部买入净额排序,换算成比例,例如:买入1:买入2:买入3:买入4:买入5=a 短线买股赚钱的概率有多大?python带你来分析 c:d:e;
  2. 查看营业部上榜后的上涨概率,例如为:a,b,c,d,e;
  3. 查看营业部上榜后的平均涨幅,例如为:a1,b1,c1,d1,e1;
  4. 计算综合上涨概率,公式为:(a a+b b+c c+d d+e*e)/(a+b+c+d+e)
  5. 计算综合涨幅,公式为:(a a1+b b1+c c1+d d1+e*e1)/(a+b+c+d+e)
  6. 计算得到的概率值越大越好,越大越值得搏击

数据准备

以上只是初步设想的一个简单模型,要进行实践,我们首先必须用历史数据来验证,看看这个模型是否可靠。

要验证这个模型的可靠性,我们需要龙虎榜数据和个股行情数据。

下面简单介绍一下这两个数据的获取方法。

龙虎榜数据

我们从东方财富的网页上来获取龙虎榜数据:http://data.eastmoney.com/stock/tradedetail/2020-03-20.html ,打开页面如下:

短线买股赚钱的概率有多大?python带你来分析

这个页面可以自定义查询日期区间,这就很方便的查询一段时间的数据了。

我们接着打开开发者工具,点击查询,就可以很容易地找到查询数据的请求:

短线买股赚钱的概率有多大?python带你来分析

我们获取到的请求为:

http://data.eastmoney.com/datacenter_v3/stock2016/tradedetail/pagesize=50,page=1,sortrule=-1,sorttype=,startdate=2020-03-20,enddate=2020-03-23,gpfw=0,js=var%20data_tab_2.html?rt=26416119

在请求中,你可以带上开始和结束日期,将pagesize设置大一些,就可以一次性将一段时间的数据查询出来。

这里就是一个简单的 requests 请求,请求获取的数据也可以很方便的解析,我就不放代码了。

请求到龙虎榜的列表后,我们就可以查询每一个股票的龙虎榜详情数据了,我们点击列表中的“明细”,就可以跳到龙虎榜详情页面了,对应的 url 为:http://data.eastmoney.com/stock/lhb,2020-03-23,002727.html

我们使用 requests 请求这个 url,就可以获取到这个页面的 html 内容,然后解析 html 内容即可得到龙虎榜详情数据。

解析的核心代码如下:

def parse_data(self, html, lhb_date, scode):
        pattern_all = re.compile(' [\s\s]*?<div class="content-sepe">[\s\s]*?<table cellpadding="0" cellspacing="0" class="default_tab stock-detail-tab" id="tab-2">[\s\s]*?</thead>[\s\s]*?<tbody>([\s\s]*?)</tbody>[\s\s]*?</table>[\s\s]*?<table cellpadding="0" cellspacing="0" class="default_tab tab-2" id="tab-4">[\s\s]*?</thead>[\s\s]*?<tbody>([\s\s]*?)</tbody>[\s\s]*?</table>[\s\s]*?</div>[\s\s]*?数据来源[\s\s]*?')
        all_content = re.findall(pattern_all, html)
        #print(all_content[0][1])

        obj_list=[]
        if len(all_content):
            buy_content = str(all_content[0][0])
            sell_content = str(all_content[0][1])

            buy_objs = self.parse_detail(buy_content, 0, lhb_date, scode)
            sell_objs = self.parse_detail(sell_content, 1, lhb_date, scode)
            obj_list.extend(buy_objs)
            obj_list.extend(sell_objs)

        return obj_list

    def parse_detail(self, content, type, lhb_date, scode):
        pattern = re.compile('[\s\s]*?<tr>[\s\s]*?<div class="sc-name">[\s\s]*?<a href=""><a href="/stock/([\s\s]*?).html">([\s\s]*?)</a></a>[\s\s]*?<div class="times-percent[\s\s]*?<div class="left">[\s\s]*?<span class="times">([\s\s]*?)</span><span[\s\s]*?>([\s\s]*?)</span>[\s\s]*?<div class="right">[\s\s]*?<td[\s\s]*?>([\s\s]*?)</td>[\s\s]*?<td>([\s\s]*?)</td>[\s\s]*?<td[\s\s]*?>([\s\s]*?)</td>[\s\s]*?<td[\s\s]*?>([\s\s]*?)</td>[\s\s]*?<td[\s\s]*?>([\s\s]*?)</td>[\s\s]*?</tr>[\s\s]*?')
        items = re.findall(pattern, content)
        obj_list=[]
        for item in items:
            obj = {}
            obj['sales_code'] = self.clear_quote(item[0]) #营业部code
            obj['sales_name'] = self.clear_quote(item[1]) #营业部名称
            obj['his_rank_times'] = numutils.trans_int(self.clear_quote(item[2])) #历史上榜次数
            obj['his_rank_rate'] = numutils.trans_float(self.clear_quote(item[3])) #历史买入3天上涨概率
            obj['buy_money'] = numutils.trans_float(self.clear_quote(item[4])) #买入额
            obj['buy_of_total_rate'] = numutils.trans_float(self.clear_quote(item[5])) #买入额占成交额比例
            obj['sell_money'] = numutils.trans_float(self.clear_quote(item[6])) #卖出额
            obj['sell_of_total_rate'] = numutils.trans_float(self.clear_quote(item[7])) #卖出额占成交额比例
            obj['net_money'] = numutils.trans_float(self.clear_quote(item[8])) #净买入额
            obj['type'] = type #买卖类型,0-买入,1-卖出
            obj['tdate'] = lhb_date
            obj['scode'] = scode
            obj_list.append(obj)

        return obj_list

通过这两步,我们的龙虎榜数据就得到了,我们把它存储到数据库。

个股详情数据

由于没有地方可以一次性获取到一段时间的个股数据,但是我们可以在东方财富网站上以找到当天所有个股的行情数据,url 为:http://quote.eastmoney.com/center/gridlist.html#hs_a_board ,所以这个只能每天获取一次,然后累积一段时间了。

这个个股详情数据页面如下:

短线买股赚钱的概率有多大?python带你来分析

跟龙虎榜列表页面一样,我们可以很容易地找到获取数据的请求:

短线买股赚钱的概率有多大?python带你来分析

请求里面的主要参数有三个:

pn:页码

pz:每页记录数

fields:个股详情字段

同样地,我们可以将每页记录数设置足够大,以确保一次性获取所有个股数据。

获取方式很简单,我们就不贴代码了。但是有一点需要注意,这个个股数据是实时的,所以我们得每天收盘(下午三点)过后再获取,才能得到收盘数据。

回溯验证

每日选股

根据我们前面所讲的模型的步骤,我们的选股核心代码如下:

def ana(self, detail_list):
        scode_dict = {}
        rank_list = []
        for detail in detail_list:
            if detail['scode'] not in scode_dict.keys():
                sub_list = [detail]
                scode_dict[detail['scode']] = sub_list
            else:
                sub_list = scode_dict[detail['scode']]
                sub_list.append(detail)
                scode_dict[detail['scode']] = sub_list

        for key in scode_dict.keys():
            scode = key
            sub_list = scode_dict[key]
            # 总买入额
            total_money = float(0)
            # 营业部上涨概率
            yyb_avg_rate_list = []
            for detail in sub_list:
                total_money = total_money + float(detail['buy_money'])
                yyb_avg_rate_list.append(float(detail['his_rank_rate']))

            # 买入额占比
            money_rate_list = [float(item['buy_money'])/total_money for item in sub_list]
            total_rate = float(0)
            for i in range(0, len(sub_list)):
                total_rate = float(total_rate) + float(yyb_avg_rate_list[i] * money_rate_list[i])
            rank_list.append({'scode': scode, 'total_rate': total_rate})

        rank_list.sort(key=lambda it: it.get('total_rate'), reverse=true)
        return rank_list

这里是严格按照前面的步骤来做的,最后将结果按照上涨概率倒序排列。

计算选股的上涨幅度

从龙虎榜中按照上涨概率将个股排序后,我准备选取最大上涨概率的股票来进行回溯。如果最大上涨概率的股票第二天开盘直接涨停,那么舍弃,再选择第二大概率的,以此类推。

由于股票的买卖价位决定了收益率的高低,我们无法知道真实操作中的买卖价格,所以这里我用三种策略来进行对比:

乐观值:第一天最低价买进,第二天最高价卖出。

悲观值:第一天最高价买进,第二天最低价卖出。

平均值:第一天平均价买进,第二天平均价卖出。

由于我们的上涨概率是上榜后3天的上涨概率,所以我们的买卖方式可能是:

第一天买入,第二天卖出;

第一天买入,第三天卖出;

第二天买入,第三天卖出。

这里我把上述情况归结为两种:第一天买入第二天卖出和前两天某一天买入第三天卖出。

根据上面的思路,我们的核心代码为:

def compute(self, date, stat_type):
        ### stat_type 表示统计类型,1-计算两天,2-计算三天 ###
        # 1. 获取每日的龙虎榜选股(根据概率倒序)
        lhbpick = lhb_history_pick.lhbhispick()
        pick_list = lhbpick.deal(date)

        if not len(pick_list):
            return none

        # 2. 根据选股计算上涨点数
        for stock in pick_list:
            # 将退市警示股和新股排除
            if 'st' in stock['name'] or '*st' in stock['name'] or 'n' in stock['name']:
                continue

            # 获取股票三日行情数据
            stock_day_detail = self.query_stock_detail(stock['scode'], date)
            # 选股当天收盘价
            day_close_price = stock_day_detail[0]['close_price']
            # 选股后一天涨停价
            first_day_limit = stock_utils.stockutils.calc_limit_price(day_close_price)
            # 选股后一天最低价
            first_day_low_price = stock_day_detail[1]['low_price']
            # 选股后一天最高价
            first_day_top_price = stock_day_detail[1]['top_price']
            # 选股后一天开盘价
            first_day_open = stock_day_detail[1]['open_price']
            # 选股后一天平均价
            first_day_avg_price = (first_day_top_price + first_day_low_price) / 2
            # 开盘即涨停并且一天未开板,买不进,放弃
            if first_day_low_price == first_day_top_price or first_day_limit == first_day_open:
                continue

            # 选股后二天最低价
            second_day_low_price = stock_day_detail[2]['low_price']
            # 选股后二天最高价
            second_day_top_price = stock_day_detail[2]['top_price']
            # 选股后二天平均价
            second_day_avg_price = (second_day_top_price + second_day_low_price) / 2

            # 计算上榜后两天的情况
            optim_up2 = (second_day_top_price - first_day_low_price) / first_day_low_price
            pessim_up2 = (second_day_low_price - first_day_top_price) / first_day_top_price
            avg_up2 = (second_day_avg_price - first_day_avg_price) / first_day_avg_price

            if stat_type == 1:
                # print(optim_up2, pessim_up2, avg_up2)
                return optim_up2, pessim_up2, avg_up2

            # 选股后三天最低价
            third_day_low_price = stock_day_detail[3]['low_price']
            # 选股后三天最高价
            third_day_top_price = stock_day_detail[3]['top_price']
            # 选股后三天平均价
            third_day_avg_price = (second_day_top_price + second_day_low_price) / 2

            # 计算上榜后三天的情况
            max2 = max(first_day_top_price, second_day_top_price)
            min2 = min(first_day_low_price, second_day_low_price)
            avg2 = (first_day_avg_price + second_day_avg_price) / 2

            optim_up3 = (third_day_top_price - min2) / min2
            pessim_up3 = (third_day_low_price - max2) / max2
            avg_up3 = (third_day_avg_price - avg2) / avg2

            return optim_up3, pessim_up3, avg_up3

        return none

通过上述方法,我们就获得了某一天所选出的股票的后三天上涨的幅度。

结果展示

我准备从三段不同趋势的行情来验证模型,分别是趋势上涨,趋势震荡,趋势下跌三种。

选取的时间周期都是一周,对应的大盘指数日k图如下:

短线买股赚钱的概率有多大?python带你来分析

为了更直观地展示效果,我将每个周期的上涨幅度用折线图来展示。

我们来看看上涨趋势的收益图:

短线买股赚钱的概率有多大?python带你来分析

短线买股赚钱的概率有多大?python带你来分析

下跌趋势的收益图:

短线买股赚钱的概率有多大?python带你来分析

短线买股赚钱的概率有多大?python带你来分析

震荡趋势的收益图:

短线买股赚钱的概率有多大?python带你来分析

短线买股赚钱的概率有多大?python带你来分析

我们先来进行纵向对比,很明显,不论在哪种趋势下,收益率的关系都是:乐观 > 平均 > 悲观。这也跟我们的常理相吻合,毕竟乐观和悲观是两种极端操作方法,而平均是介于这两者极端之间的。

我们再从上榜后2天和上榜后3天的方面来对比,我们可以看到,不论在哪种趋势下,上榜后3天的总体收益率比上榜后两天高,这也应该可以事先预想到。

接着,我们可以看到三种趋势下总体收益率的情况:三种趋势下,收益率并没有跟随不同的趋势而出现显著的特点,所以在三种趋势下,最大上涨概率的股票收益率没有显著的区别。换句话说,就是不管在何种趋势下,最好的短线操作都可以赚到差不多的收益。

我们来总结一下:如果你是市场上顶尖的选手,可以买在最低价卖在最高价,那么不论行情怎么样,你都可以获取不菲的收益;如果你是追涨杀跌型的韭菜,那么你做短线注定会亏损;如果你只是平均水平,那么你的收益很微薄,所以要想参与短线操作,你的水平至少必须在平均水平以上。

当然,股票市场上的变量很多,这只是一个简单的模型,考虑的变量也很少,而且验证的数据也相对较少,只能大致说明短线操作的收益情况,并不是严谨的论证。