程序员简书面面观

量化交易入门笔记-数据获取函数 二

2018-10-11  本文已影响60人  东南有大树

gt_fundamentals() 函数

该函数可查询一只股票或多只股票的财务数据,其语法如下:

get_fundamentals(query_object, date=None, statDate=None)

参数解析:

实例代码:

import pandas as pd

# query表示查询
# filter表示条件筛选
# valuation是内置市值数据对象(这里表示查询valuation下所有的属性)
# 最终返回一个Query对象
myq = query(valuation).filter(valuation.code=='000001.XSHE')
df = get_fundamentals(myq,'2018-4-12')
df
id code pe_ratio turnover_ratio pb_ratio ps_ratio pcf_ratio capitalization market_cap circulating_cap circulating_market_cap day pe_ratio_lyr
0 16898314 000001.XSHE 8.53 0.6934 0.9787 1.8698 -2.0521 1717041.125 1978.0314 1691798.375 1948.9517 2018-04-12 8.53

valuation市值数据对象中的字段有:

示例:输出指定字段

import pandas as pd

# query表示查询
# filter表示条件筛选
# valuation是内置市值数据对象(这里表示查询valuation下所有的属性)
# 最终返回一个Query对象
myq = query(valuation).filter(valuation.code=='000001.XSHE')
df = get_fundamentals(myq,'2018-4-12')

print("当日动态市盈率是:", df['pe_ratio'])
print('当日换手率是:', df['turnover_ratio'])
print('当日市销率是:', df['ps_ratio'])

当日动态市盈率是: 0    8.53
Name: pe_ratio, dtype: float64
当日换手率是: 0    0.6934
Name: turnover_ratio, dtype: float64
当日市销率是: 0    1.8698
Name: ps_ratio, dtype: float64

示例:显示多只股票的财务数据

import pandas as pd

# query表示查询
# filter表示条件筛选
# valuation是内置市值数据对象(  这里表示查询valuation下所有的属性)
# 最终返回一个Query对象
myq = query(valuation).filter(valuation.code.in_(['000001.XSHE', '600000.XSHG', '000009.XSHE']))
df = get_fundamentals(myq,'2018-4-12')
df
id code pe_ratio turnover_ratio pb_ratio ps_ratio pcf_ratio capitalization market_cap circulating_cap circulating_market_cap day pe_ratio_lyr
0 16898314 000001.XSHE 8.5300 0.6934 0.9787 1.8698 -2.0521 1717041.125 1978.0314 1691798.3750 1948.9517 2018-04-12 8.530
1 16898321 000009.XSHE 66.1183 0.8175 2.8934 1.8857 7.0958 214934.500 134.5490 212008.9062 132.7176 2018-04-12 57.651
2 16900412 600000.XSHG 6.3748 0.0670 0.8743 2.0506 -1.8573 2935208.000 3457.6750 2810376.5000 3310.6233 2018-04-12 6.375

示例:更多不同的财务数据条件筛选

import pandas as pd

df = get_fundamentals(query(
    valuation
    ).filter(
        valuation.market_cap > 1000,  # 筛选市值大于1000的
        valuation.pe_ratio < 10,  # 筛选市盈率小于10的
        ).order_by(
            valuation.market_cap.desc()  # 按照市值倒序排列
            ).limit(
                5  # 最多只显示5条数据
                ), date='2018-4-12')
df
id code pe_ratio turnover_ratio pb_ratio ps_ratio pcf_ratio capitalization market_cap circulating_cap circulating_market_cap day pe_ratio_lyr
0 16901309 601398.XSHG 7.5755 0.0770 1.0615 2.9827 6.5474 35640624.0 21144.6426 26961222.00 16392.4219 2018-04-12 7.575
1 16901380 601939.XSHG 7.9565 1.4751 1.1338 3.1007 -69.3750 25001098.0 16366.5508 959365.75 739.6710 2018-04-12 7.957
2 16901293 601288.XSHG 6.5645 0.1031 0.9407 2.3587 7.2988 32479412.0 12577.8789 29405530.00 11468.1562 2018-04-12 6.564
3 16901389 601988.XSHG 6.6764 0.0825 0.8244 2.3818 -19.0273 29438780.0 11065.7139 21076552.00 8240.9316 2018-04-12 6.676
4 16901297 601328.XSHG 6.5778 0.1831 0.7557 2.3566 -5.2804 7426272.5 4207.0605 3925086.50 2441.4038 2018-04-12 6.578

示例:显示某股票2016年第四季度的季报,并放到列表中显示

# query这里指定了要查询显示的字段
q = query(
    # income为利润数据对象
    income.statDate, # 统计日期
    income.code,  # 股票代码
    income.basic_eps,  # 基本每股收益
    # balance为负债数据对象
    balance.cash_equivalents,  # 货币资金
    # cash_flow为现金流数据对象
    cash_flow.goods_sale_and_service_render_cash  # 销售商品、提供劳务获得的现金
    ).filter(
        income.code == '000001.XSHE'
        )

rets = [get_fundamentals(q, statDate='2016q'+str(i)) for i in range(1, 5)]
rets

[     statDate         code  basic_eps  cash_equivalents  \
 0  2016-03-31  000001.XSHE       0.43      2.961440e+11   
 
    goods_sale_and_service_render_cash  
 0                                 NaN  ,
      statDate         code  basic_eps  cash_equivalents  \
 0  2016-06-30  000001.XSHE       0.29      2.781780e+11   
 
    goods_sale_and_service_render_cash  
 0                                 NaN  ,
      statDate         code  basic_eps  cash_equivalents  \
 0  2016-09-30  000001.XSHE       0.37      3.039360e+11   
 
    goods_sale_and_service_render_cash  
 0                                 NaN  ,
      statDate         code  basic_eps  cash_equivalents  \
 0  2016-12-31  000001.XSHE       0.23      3.112580e+11   
 
    goods_sale_and_service_render_cash  
 0                                 NaN  ]

各财务数据的意义:

get_fundamentals_continuously() 函数

get_fundamentals()函数只能查询某一交易日的股票财务数信息,如果要查询多个交易日的股票财务数据信息,就要使用本函数;其语法如下:

get_fundamentls_continuously(query_object, end_date=None, count=None)

参数意义:

本函数返回值是一个pandas.Panel

出于性能考虑,返回总条数不超过10000条的限制

示例:查询平安银行和浦发银行的财务信息

import pandas as pd

q = query(
    valuation
).filter(
    valuation.code.in_(
        ['000001.XSHE', '600000.XSHG']))
panel = get_fundamentals_continuously(q, end_date='2018-01-01', count=5)
panel.minor_xs('600000.XSHG')
id code.1 pe_ratio turnover_ratio pb_ratio ps_ratio pcf_ratio capitalization market_cap circulating_cap circulating_market_cap day.1 pe_ratio_lyr
day
2017-12-25 15990853 600000.XSHG 6.8044 0.0687 0.9538 2.2447 -1.9850 2935208 3695.4270 2810376.5 3538.2639 2017-12-25 6.9595
2017-12-26 16006159 600000.XSHG 6.8315 0.0542 0.9576 2.2536 -1.9929 2935208 3710.1030 2810376.5 3552.3159 2017-12-26 6.9871
2017-12-27 16018676 600000.XSHG 6.8207 0.1165 0.9561 2.2500 -1.9897 2935208 3704.2324 2810376.5 3546.6951 2017-12-27 6.9761
2017-12-28 16031214 600000.XSHG 6.7774 0.0849 0.9500 2.2357 -1.9771 2935208 3680.7510 2810376.5 3524.2119 2017-12-28 6.9319
2017-12-29 16043748 600000.XSHG 6.8044 0.0582 0.9538 2.2447 -1.9850 2935208 3695.4270 2810376.5 3538.2639 2017-12-29 6.9595

get_index_stocks() 函数

该函数可以获取一个指数给定日期的平台可交易的成分股列表;其语法如下:

get_index_stocks(index_symbol, date=None)

参数解析:

代码实例:获得沪深300指数的所有股票代码

stocks = get_index_stocks('000300.XSHG')
stocks
['000001.XSHE',
 '000002.XSHE',
 '000060.XSHE',
 '000063.XSHE',
 ......,
 '603833.XSHG',
 '603858.XSHG',
 '603993.XSHG']

get_industry_stocks()函数

该函数可以获取在给定日期一个行业的所有股票代码;其语法如下:

get_industry_stocks(industry_code, date=None)

参数解析:

代码示例:获得汽车制造业指数的所有股票代码

stocks = get_industry_stocks('C36')
stocks
['000030.XSHE',
 '000338.XSHE',
 '000549.XSHE',
 '000550.XSHE',
......,
'603809.XSHG',
 '603922.XSHG',
 '603926.XSHG',
 '603997.XSHG']

get_concept_stocks() 函数

该函数可以获取在给定日期一个概念板块的所有股票;其语法如下:

get_concept_stocks(conpect_code, date=None)

参数解析:

代码示例:获得一带一中概念板块的所有股票代码:

stocks = get_concept_stocks('GN181')
stocks
['000018.XSHE',
 '000022.XSHE',
 '000063.XSHE',
 '000065.XSHE',
 ......,
  '601857.XSHG',
 '601872.XSHG',
 '601880.XSHG',
 '601919.XSHG',
 '601989.XSHG',
 '603169.XSHG']

get_all_secruities()函数

本函数可以获取平台支持的所有股票、基金、指数、期货信息;其语法如下:

get_all_securities(types=[], date=None)

参数解析:

本函数返回的类型是 pandas.DataFrame 类型

代码实例:获取所有的股票信息

# 下面两行代码显示的结果是一样的
df = get_all_securities(['stock'])
stocks = get_all_securities()
stocks
display_name name start_date end_date type
000001.XSHE 平安银行 PAYH 1991-04-03 2200-01-01 stock
000002.XSHE 万科A WKA 1991-01-29 2200-01-01 stock
000004.XSHE 国农科技 GNKJ 1990-12-01 2200-01-01 stock
... ... ... ... ... ...
603996.XSHG 中新科技 ZXKJ 2015-12-22 2200-01-01 stock
603997.XSHG 继峰股份 JFGF 2015-03-02 2200-01-01 stock
603998.XSHG 方盛制药 FSZY 2014-12-05 2200-01-01 stock
603999.XSHG 读者传媒 DZCM 2015-12-10 2200-01-01 stock

3551 rows × 5 columns

列名字段解析:

代码示例:显示所有分级A与分级B的信息

df = get_all_securities(['stock'])
stocks = get_all_securities()
stocks
display_name name start_date end_date type
150008.XSHE 瑞和小康 RHXK 2009-11-19 2200-01-01 fja
150009.XSHE 瑞和远见 RHYJ 2009-11-19 2200-01-01 fjb
150012.XSHE 中证100A ZZ100A 2010-06-18 2200-01-01 fja
150013.XSHE 中证100B ZZ100B 2010-06-18 2200-01-01 fjb
150016.XSHE 合润A HRA 2010-05-31 2200-01-01 fja
... ... ... ... ... ...
502054.XSHG 券商A QSA 2015-08-24 2200-01-01 fja
502055.XSHG 券商B QSB 2015-08-24 2200-01-01 fjb
502057.XSHG 医疗A YLA 2015-07-31 2200-01-01 fja
502058.XSHG 医疗B YLB 2015-07-31 2200-01-01 fjb

254 rows × 5 columns

示例代码:显示2017-10-10日还在上市的eft和lof基金信息

df = get_all_securities(['etf', 'lof'], '2017-10-10')
df
display_name name start_date end_date type
159901.XSHE 深100ETF S100ETF 2006-04-24 2200-01-01 etf
159902.XSHE 中小板 ZXB 2006-09-05 2200-01-01 etf
159903.XSHE 深成ETF SCETF 2010-02-02 2200-01-01 etf
159905.XSHE 深红利 SHL 2011-01-11 2200-01-01 etf
159906.XSHE 深成长 SCZ 2011-02-23 2200-01-01 etf
159907.XSHE 中小300 ZX300 2011-08-10 2200-01-01 etf
159929.XSHE 医药ETF YYETF 2013-09-16 2200-01-01 etf
159930.XSHE 能源ETF NYETF 2013-09-16 2200-01-01 etf
159931.XSHE 金融ETF JRETF 2013-09-16 2200-01-01 etf
159932.XSHE 500深ETF 500SETF 2013-10-21 2200-01-01 etf
159933.XSHE 金地ETF JDETF 2013-10-16 2200-01-01 etf
... ... ... ... ... ...
513100.XSHG 纳指ETF NZETF 2013-05-15 2200-01-01 etf
513500.XSHG 标普500 BP500 2014-01-16 2200-01-01 etf
513600.XSHG 恒指ETF HZETF 2015-01-26 2200-01-01 etf
513660.XSHG 恒生通 HST 2015-01-26 2200-01-01 etf
518800.XSHG 黄金基金 GTHJ 2013-07-29 2200-01-01 etf
518880.XSHG 黄金ETF HJETF 2013-07-29 2200-01-01 etf

396 rows × 5 columns

get_security_info()函数

本函数可以获取一只股票(基金或指数)的信息,其语法如下:

get_security_info(code)

参数解析:

代码示例:

print('代码502050的证券名:', get_security_info('502050.XSHG').display_name)
print('代码502050的证券缩写简称:', get_security_info('502050.XSHG').name)
print('代码502050的证券上市日期:', get_security_info('502050.XSHG').start_date)
print('代码502050的证券退市日期:', get_security_info('502050.XSHG').end_date)
print('代码502050的证券类型:', get_security_info('502050.XSHG').type)
print('代码502050的证券分级基金的母基金:', get_security_info('502050.XSHG').parent)
代码502050的证券名: 上证50B
代码502050的证券缩写简称: SZ50B
代码502050的证券上市日期: 2015-04-27
代码502050的证券退市日期: 2200-01-01
代码502050的证券类型: fjb
代码502050的证券分级基金的母基金: 502048.XSHG

get_billboard_list()函数

本函数可以获取指定日期区间内的龙虎榜数据,语法如下:

get_billboard_list(stock_list, start_date, end_date, count)

参数解析:

返回类型: pandas.DataFrame

代码示例:

df = get_billboard_list(stock_list=None, end_date='2018-04-09', count=1)
df
code day direction rank abnormal_code abnormal_name sales_depart_name buy_value buy_rate sell_value sell_rate total_value net_value amount
0 603648.XSHG 2018-04-09 SELL 1 106006 连续三个交易日内收盘价格涨幅偏离值累计达到20%的证券 东方证券股份有限公司桂林中山中路证券营业部 NaN NaN 2.235940e+07 1.2155 2.235940e+07 -2.235940e+07 1839596193
1 603648.XSHG 2018-04-09 ALL 0 106006 连续三个交易日内收盘价格涨幅偏离值累计达到20%的证券 None 9.009827e+07 4.8977 8.433712e+07 4.5845 1.744354e+08 5.761157e+06 1839596193
2 603648.XSHG 2018-04-09 BUY 5 106006 连续三个交易日内收盘价格涨幅偏离值累计达到20%的证券 华鑫证券有限责任公司南昌红谷中大道证券营业部 1.502713e+07 0.8169 NaN NaN 1.502713e+07 1.502713e+07 1839596193
3 603648.XSHG 2018-04-09 BUY 4 106006 连续三个交易日内收盘价格涨幅偏离值累计达到20%的证券 招商证券股份有限公司深圳后海证券营业部 1.626907e+07 0.8844 NaN NaN 1.626907e+07 1.626907e+07 1839596193

869 rows × 14 columns

各字段含义如下:

get_locked_shares()函数

本函数可以获取指定日期区间内的限售解禁数据,其语法如下:

get_locked_shares(stock_list, start_date, end_date, forward_count)

参数解析:各项参数与get_billbord_list差不多

这里只说一下返回信息中字段的意义

代码示例:

df = get_locked_shares(stock_list=['000001.XSHE','000002.XSHG','000009.XSHE'], start_date='2016-4-16',forward_count=1200)
df
day code num rate1 rate2
0 2016-05-23 000001.XSHE 388595743 0.0272 0.0329
1 2016-07-08 000009.XSHE 15716892 0.0096 0.0098
2 2017-01-09 000001.XSHE 2286809264 0.1332 0.1563
3 2018-05-21 000001.XSHE 252247983 0.0147 0.0149

注:本文章为个人学习笔记,参考了一些书籍与官方教程,不作任何商业用途!

上一篇 下一篇

猜你喜欢

热点阅读