2021兰州疫情-新型冠状病毒疫情实时爬虫-3(实时更新)

前言 这里数据来源是很关键的一步,因为部分平台数据来源有一定异议,导致有误,这里我采用腾讯的数据来源。

1.确定数据源

数据源:腾讯疫情实时追踪

首先对该网站F12,点击Network刷新页面,看看每个页面的Response:

代码语言:javascript
复制
{\"confirm\":126286,\"heal\":117638,\"dead\":5696,\"nowConfirm\":2952,\"suspect\
     确诊              治愈             死亡            现存确证            疑似病例

Response URL:
https://view.inews.qq.com/g2/getOnsInfo?
name=disease_h5&callback=jQuery35105860806421333924_1635943488534&_=1635943488535

但是再刷新一下会发现callback后面的东西就变了,推测这是一个时间戳,把它去了用这个:

这个就是我的数据源了,现在开始码代码:

2.写代码

这里需要引入的数据块:

代码语言:javascript
复制
import json
import requests
import pandas as pd
from pyecharts.charts import *
from pyechrats import options as opts
from pyecharts.commons.utils import JsCode
from pyecharts.globals import ThemeType, chartType
from bs4 import Beautifulsoup

这里开始写抓取数据的代码: