中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

最簡潔的Python時間序列可視化:數據科學分析價格趨勢,預測價格,探索價格

發布時間:2020-07-14 15:07:03 來源:網絡 閱讀:466 作者:學Python派森 欄目:編程語言

時間序列數據在數據科學領域無處不在,在量化金融領域也十分常見,可以用于分析價格趨勢,預測價格,探索價格行為等。

學會對時間序列數據進行可視化,能夠幫助我們更加直觀地探索時間序列數據,尋找其潛在的規律。

本文會利用Python中的matplotlib【1】庫,并配合實例進行講解。matplotlib庫是?個?于創建出版質量圖表的桌?繪圖包(2D繪圖庫),是Python中最基本的可視化工具。

【工具】Python 3

【數據】Tushare

【注】示例注重的是方法的講解,請大家靈活掌握。

01

單個時間序列

首先,我們從tushare.pro獲取指數日線行情數據,并查看數據類型。

import tushare as ts
import pandas as pd

pd.set_option('expand_frame_repr', False)  # 顯示所有列
ts.set_token('your token')
pro = ts.pro_api()

df = pro.index_daily(ts_code='399300.SZ')[['trade_date', 'close']]
df.sort_values('trade_date', inplace=True) 
df.reset_index(inplace=True, drop=True)

print(df.head())

  trade_date    close
0   20050104  982.794
1   20050105  992.564
2   20050106  983.174
3   20050107  983.958
4   20050110  993.879

print(df.dtypes)

trade_date     object
close         float64
dtype: object

交易時間列'trade_date'?不是時間類型,而且也不是索引,需要先進行轉化。

df['trade_date'] = pd.to_datetime(df['trade_date'])
df.set_index('trade_date', inplace=True)

print(df.head())

              close
trade_date         
2005-01-04  982.794
2005-01-05  992.564
2005-01-06  983.174
2005-01-07  983.958
2005-01-10  993.879

接下來,就可以開始畫圖了,我們需要導入matplotlib.pyplot【2】,然后通過設置set_xlabel()set_xlabel()為x軸和y軸添加標簽。

import matplotlib.pyplot as plt

ax = df.plot(color='')
ax.set_xlabel('trade_date')
ax.set_ylabel('399300.SZ close')
plt.show()

最簡潔的Python時間序列可視化:數據科學分析價格趨勢,預測價格,探索價格

matplotlib庫中有很多內置圖表樣式可以選擇,通過打印plt.style.available查看具體都有哪些選項,應用的時候直接調用plt.style.use('fivethirtyeight')即可。

print(plt.style.available)

['bmh', 'classic', 'dark_background', 'fast', 'fivethirtyeight', 'ggplot', 'grayscale', 'seaborn-bright', 'seaborn-colorblind', 'seaborn-dark-palette', 'seaborn-dark', 'seaborn-darkgrid', 'seaborn-deep', 'seaborn-muted', 'seaborn-notebook', 'seaborn-paper', 'seaborn-pastel', 'seaborn-poster', 'seaborn-talk', 'seaborn-ticks', 'seaborn-white', 'seaborn-whitegrid', 'seaborn', 'Solarize_Light2', 'tableau-colorblind10', '_classic_test']

plt.style.use('fivethirtyeight')
ax1 = df.plot()
ax1.set_title('FiveThirtyEight Style')
plt.show()

最簡潔的Python時間序列可視化:數據科學分析價格趨勢,預測價格,探索價格

02

設置更多細節

上面畫出的是一個很簡單的折線圖,其實可以在plot()里面通過設置不同參數的值,為圖添加更多細節,使其更美觀、清晰。

figsize(width, height)設置圖的大小,linewidth設置線的寬度,fontsize設置字體大小。然后,調用set_title()方法設置標題。

ax = df.plot(color='blue', figsize=(8, 3), linewidth=2, fontsize=6)
ax.set_title('399300.SZ close from 2005-01-04 to 2019-07-04', fontsize=8)
plt.show()

最簡潔的Python時間序列可視化:數據科學分析價格趨勢,預測價格,探索價格

如果想要看某一個子時間段內的折線變化情況,可以直接截取該時間段再作圖即可,如df['2018-01-01': '2019-01-01']

df_subset_1 = df['2018-01-01':'2019-01-01']
ax = df_subset_1.plot(color='blue', fontsize=10)
plt.show()

最簡潔的Python時間序列可視化:數據科學分析價格趨勢,預測價格,探索價格

如果想要突出圖中的某一日期或者觀察值,可以調用.axvline().axhline()方法添加垂直和水平參考線。

ax = df.plot(color='blue', fontsize=6)
ax.axvline('2019-01-01', color='red', linestyle='--')
ax.axhline(3000, color='green', linestyle='--')
plt.show()

最簡潔的Python時間序列可視化:數據科學分析價格趨勢,預測價格,探索價格

也可以調用axvspan()的方法為一段時間添加陰影標注,其中alpha參數設置的是陰影的透明度,0代表完全透明,1代表全色。

大家在學python的時候肯定會遇到很多難題,以及對于新技術的追求,這里推薦一下我們的Python資源分享秋秋裙:855408893 內有安裝包,學習視頻資料。這里是Python學習者的聚集地,零基礎,進階,都歡迎每日分享一些學習的方法和需要注意的小細節

ax = df.plot(color='blue', fontsize=6)
ax.axvspan('2018-01-01', '2019-01-01', color='red', alpha=0.3)
ax.axhspan(2000, 3000, color='green', alpha=0.7)
plt.show()

最簡潔的Python時間序列可視化:數據科學分析價格趨勢,預測價格,探索價格

03

移動平均時間序列

有時候,我們想要觀察某個窗口期的移動平均值的變化趨勢,可以通過調用窗口函數rolling來實現。下面實例中顯示的是,以250天為窗口期的移動平均線close,以及與移動標準差的關系構建的上下兩個通道線upper和lower。

ma = df.rolling(window=250).mean()
mstd = df.rolling(window=250).std()

ma['upper'] = ma['close'] + (mstd['close'] * 2)
ma['lower'] = ma['close'] - (mstd['close'] * 2)

ax = ma.plot(linewidth=0.8, fontsize=6)
ax.set_xlabel('trade_date', fontsize=8)
ax.set_ylabel('399300.SZ close from 2005-01-04 to 2019-07-04', fontsize=8)
ax.set_title('Rolling mean and variance of 399300.SZ cloe from 2005-01-04 to 2019-07-04', fontsize=10)
plt.show()

最簡潔的Python時間序列可視化:數據科學分析價格趨勢,預測價格,探索價格

04

多個時間序列

如果想要可視化多個時間序列數據,同樣可以直接調用plot()方法。示例中我們從tushare.pro上面選取三只股票的日線行情數據進行分析。

# 獲取數據
code_list = ['000001.SZ', '000002.SZ', '600000.SH']
data_list = []
for code in code_list:
    print(code)
    df = pro.daily(ts_code=code, start_date='20180101', end_date='20190101')[['trade_date', 'close']]
    df.sort_values('trade_date', inplace=True)
    df.rename(columns={'close': code}, inplace=True)
    df.set_index('trade_date', inplace=True)
    data_list.append(df)
df = pd.concat(data_list, axis=1)
print(df.head())

000001.SZ
000002.SZ
600000.SH
            000001.SZ  000002.SZ  600000.SH
trade_date                                 
20180102        13.70      32.56      12.72
20180103        13.33      32.33      12.66
20180104        13.25      33.12      12.66
20180105        13.30      34.76      12.69
20180108        12.96      35.99      12.68

# 畫圖
ax = df.plot(linewidth=2, fontsize=12)
ax.set_xlabel('trade_date')
ax.legend(fontsize=15)
plt.show()

最簡潔的Python時間序列可視化:數據科學分析價格趨勢,預測價格,探索價格

調用.plot.area()方法可以生成時間序列數據的面積圖,顯示累計的總數。

ax = df.plot.area(fontsize=12)
ax.set_xlabel('trade_date')
ax.legend(fontsize=15)
plt.show()

最簡潔的Python時間序列可視化:數據科學分析價格趨勢,預測價格,探索價格

如果想要在不同子圖中單獨顯示每一個時間序列,可以通過設置參數subplots=True來實現。layout指定要使用的行列數,sharexsharey用于設置是否共享行和列,colormap='viridis'?為每條線設置不同的顏色。

df.plot(subplots=True,
          layout=(2, 2),
          sharex=False,
          sharey=False,
          colormap='viridis',
          fontsize=7,
          legend=False,
          linewidth=0.3)

plt.show()

最簡潔的Python時間序列可視化:數據科學分析價格趨勢,預測價格,探索價格

05

總結

本文主要介紹了如何利用Python中的matplotlib庫對時間序列數據進行一些簡單的可視化操作,包括可視化單個時間序列并設置圖中的細節,可視化移動平均時間序列和多個時間序列。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

民县| 石嘴山市| 中山市| 金湖县| 武功县| 磐安县| 天气| 肇源县| 崇义县| 绍兴市| 马边| 天门市| 额尔古纳市| 棋牌| 长垣县| 密山市| 西盟| 临泽县| 长汀县| 保亭| 都昌县| 江孜县| 兴义市| 临洮县| 榕江县| 清镇市| 喀什市| 锡林郭勒盟| 防城港市| 紫阳县| 广德县| 农安县| 东乡| 边坝县| 柯坪县| 肥城市| 沾化县| 榆社县| 花垣县| 页游| 四子王旗|