前言 这里数据来源是很关键的一步,因为部分平台数据来源有一定异议,导致有误,这里我采用腾讯的数据来源。
1.确定数据源
数据源:腾讯疫情实时追踪
首先对该网站F12,点击Network刷新页面,看看每个页面的Response:
代码语言:javascript
复制
{\"confirm\":126286,\"heal\":117638,\"dead\":5696,\"nowConfirm\":2952,\"suspect\ 确诊 治愈 死亡 现存确证 疑似病例
Response URL:
https://view.inews.qq.com/g2/getOnsInfo?
name=disease_h5&callback=jQuery35105860806421333924_1635943488534&_=1635943488535
但是再刷新一下会发现callback后面的东西就变了,推测这是一个时间戳,把它去了用这个:
代码语言:javascript
复制
这个就是我的数据源了,现在开始码代码:
2.写代码
这里需要引入的数据块:
代码语言:javascript
复制
import json
import requests
import pandas as pd
from pyecharts.charts import *
from pyechrats import options as opts
from pyecharts.commons.utils import JsCode
from pyecharts.globals import ThemeType, chartType
from bs4 import Beautifulsoup
这里开始写抓取数据的代码: