上篇文章Python 爬取每日股價(1)學會了找到所需資料和爬取的方法。
接下來資料要儲存成xlsx格式。
先安裝pandas和xlsxwriter
pip install pandas
pip install xlsxwriter
如果是colab,使用!pip install xlsxwriter
藉由上篇找到的資料位置"data9″,以及觀察到資料是根據每天做儲存。
因此我們使用基於每天的資料處理方式,把所需要的股票資料、開盤價、收盤價等等存放。
import requests
import pandas as pd
from pprint import pprint as pprint
date = "20210827"
url = f"https://www.twse.com.tw/exchangeReport/MI_INDEX?response=json&date={date}&type=ALLBUT0999&_=1630244648174"
res = requests.get(url)
data = res.json()
data_list = data["data9"]
columns = data["fields9"]
df = pd.DataFrame(data_list, columns=columns)
writer = pd.ExcelWriter('twse_data.xlsx', engine='xlsxwriter')
df.to_excel(writer, sheet_name=date, index=False)
writer.save()
# pprint(data_list)
f-strings in Python PEP 498
打開儲存的"twse_data.xlsx"
我們可以依靠改變日期獲得過去的資料,
存成不同分頁或是檔案。
也可以依據未來需要的使用資料方式來改變儲存格式。