复权算法详解与代码实现细节解析(tgw)——量化数据中台系列(六)

03-18 1118阅读

github   

1. tgw 

   https://github.com/tgw2023/tgw

2. AmazingQuant

https://github.com/zhanggao2013/AmazingQuant

上文已经详细介绍了K线的获取方式,有了行情数据就可以做指标计算了。

       但由于上市公司的分红送股,股价除权除息,导致除权除息前后的行情数据不连续,影响了指标计算的连续性。因此,需要先计算复权行情数据,再做指标计算。

一、复权算法介绍

1. 单次复权因子

单次复权因子的计算有两种计算方法:

          (1) 根据交易所行情数据计算

复权算法详解与代码实现细节解析(tgw)——量化数据中台系列(六)​  

 这种计算方式与交易所价格一致,但策略回测时的收益计算不包含分红再投资收益,对收益率有一定影响。

         (2) 根据除权除息数据计算

                   比例 = 送股比例 + 转增比例 + 缩减比例

                复权算法详解与代码实现细节解析(tgw)——量化数据中台系列(六)

  这种计算方式与交易所价格不一致,但策略回测时的收益计算包含分红再投资收益。

第一种方式简单实用,第二种方式收益计算更准确,个人认为第一种完全可以适用,但也对两种方式都做出说明和代码示例。

        2. 前复权

      最近的交易日作为基点,原始行情数据乘以前复权因子,得到前复权行情数据,从使得最新的真实行情数据与前复权行情数据相等;

      前复权的优点在于,指标计算的最新行情数据与委托价格相等;

        3. 后复权

       最早的交易日作为基点,原始行情数据乘以后前复权因子,得到前复权行情数据,从使得最新的真实行情数据与前复权行情数据相等;

       后复权的优点在于,策略回测可避免一部分因分红配股产生的未来数据;

       4. 累计复权因子计算

      为方便与原始行情数据相乘,累计复权因子的数据结构为矩阵,column为股票代码,index为交易日历。

       后复权因子的计算步骤如下:

       (1)单次复权因子累乘;

       (2)矩阵的index,从只有股份变动日扩充为全历史交易日历,并赋值nan延续前值;

       (3)由于上市初期的一段时间可能没有分红配股,所以赋值这段时间的为1;        

        前复权因子等于后复权因子除以最新的单次复权因子;

二、根据交易所行情数据

 tgw提供的复权因子接口为QueryExFactorTable,计算方法是根据交易所行情数据计算的;

获取并规整dataframe数据格式的核心代码如下

class UpdateAdjFactor(object):
    def __init__(self):
        pass
    def get_backward_factor(self, code_sh_list, code_sz_list, calendar_index):
        backward_factor = pd.DataFrame(index=calendar_index)
        market = 'SH'
        for market_type in [tgw.MarketType.kSSE, tgw.MarketType.kSZSE]:
            code_list = code_sh_list
            if market_type == tgw.MarketType.kSZSE:
                code_list = code_sz_list
                market = 'SZ'
            for code in code_list[:5]:
                adj_factor, _ = tgw.QueryExFactorTable(code)
                adj_factor.set_index(["ex_date"], inplace=True)
                adj_factor.sort_index(inplace=True)
                backward_factor[code+'.'+market] = adj_factor['cum_factor']
        backward_factor.replace([np.inf, 0], np.nan, inplace=True)
        backward_factor.fillna(method='ffill', inplace=True)
        backward_factor.fillna(1, inplace=True)
        return backward_factor

三、根据除权除息数据计算

 tgw提供的除权除息数据接口为QueryThirdInfo,

根据除权除息数据,结合日线收盘价,实现后复权因子计算的核心代码如下

class UpdateAdjFactor(object):
    def __init__(self):
        pass
    def get_backward_factor_ratio(self, close_df, code_sh_list, code_sz_list, calendar_index):
        """
        取当日收盘价,作为转、送的股价,
        再计算复权因子更新到AShareExRightDividend, 复权因子adj_factor
        比例 = 送股比例 + 转增比例 + 缩减比例
        单次复权因子 = 股权登记日收盘价 * (1 + 比例 + 配股比例 + 增发比例) /
        (股权登记日收盘价 - 派息比例 + 股权登记日收盘价 * 比例 + 配股价格 * 配股比例 + 增发价格 * 增发比例)
        :return:
        """
        ex_right_dividend_df = None
        market = 'SH'
        for market_type in [tgw.MarketType.kSSE, tgw.MarketType.kSZSE]:
            code_list = code_sh_list
            if market_type == tgw.MarketType.kSZSE:
                code_list = code_sz_list
                market = 'SZ'
            for code in code_list[:5]:
                task_id = tgw.GetTaskID()
                tgw.SetThirdInfoParam(task_id, "function_id", "A010030003")
                tgw.SetThirdInfoParam(task_id, "start_date", "20130101")
                tgw.SetThirdInfoParam(task_id, "end_date", "20991231")
                tgw.SetThirdInfoParam(task_id, "market_code", code+'.'+market)
                df, _ = tgw.QueryThirdInfo(task_id)
                if ex_right_dividend_df is None:
                    ex_right_dividend_df = df
                else:
                    ex_right_dividend_df = ex_right_dividend_df.append(df)
        ex_right_dividend_df['close'] = ex_right_dividend_df.apply(
            lambda x: self.get_adj_day_close(x['MARKET_CODE'], int(x['EX_RD_DATE']), close_df), axis=1)
        ex_right_dividend_df = ex_right_dividend_df.fillna(0)
        ratio = ex_right_dividend_df['BONUS_SHARE_RATIO'] + ex_right_dividend_df['CONVER_INCR_RATIO'] + ex_right_dividend_df['REDUCED_RATIO']
        ex_right_dividend_df['adj_factor'] = ex_right_dividend_df['close'] * (
                1 + ratio + ex_right_dividend_df['RIGHT_ISSUE_RATIO'] + ex_right_dividend_df['SEO_RATIO']) / (
                ex_right_dividend_df['close'] - ex_right_dividend_df['DIV_PAYOUT_RATIO'] + ex_right_dividend_df['close']
                * ratio + ex_right_dividend_df['RIGHT_ISSUE_PRICE'] * ex_right_dividend_df['RIGHT_ISSUE_RATIO'] +
                                          ex_right_dividend_df['SEO_PRICE'] * ex_right_dividend_df['SEO_RATIO'])
        ex_right_dividend_df = ex_right_dividend_df.reindex(columns=['MARKET_CODE', 'EX_RD_DATE', 'adj_factor','close'])
        ex_right_dividend_df.set_index(["EX_RD_DATE"], inplace=True)
        ex_right_dividend_df.sort_index(inplace=True)
        ex_right_dividend_df.fillna(method='ffill', inplace=True)
        backward_factor_ratio = pd.DataFrame(index=calendar_index)
        data_dict = dict(list(ex_right_dividend_df.groupby(ex_right_dividend_df['MARKET_CODE'])))
        for security_code, adj_data in data_dict.items():
            backward_factor_ratio[security_code] = adj_data['adj_factor'].cumprod(axis=0)
            print(backward_factor_ratio[security_code])
            print(adj_data['adj_factor'])
        backward_factor_ratio.replace([np.inf, 0], np.nan, inplace=True)
        backward_factor_ratio.fillna(method='ffill', inplace=True)
        backward_factor_ratio.fillna(1, inplace=True)
        backward_factor_ratio.sort_index(inplace=True)
        return backward_factor_ratio, ex_right_dividend_df, data_dict
    def get_adj_day_close(self, security_code, date, close_df):
        security_code_market_data = 0
        try:
            security_code_market_data = close_df.loc[date, security_code]/1000000
        except KeyError:
            print(security_code, date, security_code_market_data)
        return security_code_market_data

四、前复权因子计算

前复权因子,需要每日计算更新,代码如下:

def cal_forward_factor(self, backward_factor):
        return backward_factor.div(backward_factor.iloc[-1])
VPS购买请点击我

文章版权声明:除非注明,否则均为主机测评原创文章,转载或复制请以超链接形式并注明出处。

目录[+]