Pandas获取网页上的表格内容
直接使用pandas即可。
首先要安装pandas和beautifulsoup4,接着编写以下代码即可获取网页表格内容为dataframe。
获取体彩开奖历史:
|
1 2 3 4 5 6 7 8 9 10 11 12 |
# coding: utf-8 import pandas as pd # 开始期数和结束期数 start_term = "18001" end_term = "18048" # 构建url url = "http://www.lottery.gov.cn/historykj/history.jspx?page=false&_ltype=qxc&termNum=0&startTerm=%s&endTerm=%s" % (start_term, end_term) data = pd.read_html(url)[0] |
以下是获取体彩开奖历史的结果:

