『Part』全球 100 万确诊!Python 爬取微博热搜,回顾魔幻的 2020 年

北京联盟_原题是:全球 100 万确诊!Python 爬取微博热搜 , 回顾魔幻的 2020 年
『Part』全球 100 万确诊!Python 爬取微博热搜,回顾魔幻的 2020 年
文章图片

文章图片

前言
北京时间4月3日凌晨 , 全球新冠病毒感染人数突破100万 , 死亡人数超过5万 。而这一切都在2020年刚开始的三个月内发生 。可能你觉得这三个月很快 , 有些事情已经逐渐忘记 , 而互联网的记忆不会消失 , 数据也会说话 。因此作者抓取了2020年1月1日至4月2日的 每天微博排名前50条热搜共近5000条数据 , 通过分析微博热搜数据带你回顾这不平凡的90天 。
Part1
首先我们制作这三个月 全部热搜的词云图
『Part』全球 100 万确诊!Python 爬取微博热搜,回顾魔幻的 2020 年
文章图片

文章图片

可以看到 , 疫情下的微博热搜主要以 疫情相关词汇组成 ,我们再根据每一条热搜的 热度大小进行排序 , 得到这三个月中 热度最高的十条热搜 , 猜猜是什么
『Part』全球 100 万确诊!Python 爬取微博热搜,回顾魔幻的 2020 年
文章图片

文章图片

令人惊讶的的是 , 在这三个月内的 每日热度排名前十的热搜中娱乐相关的热搜为4条 , 疫情相关热搜为5条 。并且 第一第二的并不是疫情相关热搜 , 而是两位明星相关的资讯
Part2
我们接着提取中国各省市在热搜中出现的次数 , 以此来代表网友对 各省的关注度绘制 关注度地图与 词云图
『Part』全球 100 万确诊!Python 爬取微博热搜,回顾魔幻的 2020 年
文章图片

文章图片

『Part』全球 100 万确诊!Python 爬取微博热搜,回顾魔幻的 2020 年
文章图片

文章图片

从热搜出现的省份来看最受关注的还是 湖北省 , 其次是 北京、上海、浙江、四川等省市 , 从热搜出现的城市来看 ,武汉、广州、北京、杭州、上海等城市出现次数较多 。同时值得关注的是:境外和公主号邮轮也频上热搜 。
Part3 疫情来袭
现在我们分析三个月内每天50条热搜中 疫情相关热搜数量的变化 ,
?
『Part』全球 100 万确诊!Python 爬取微博热搜,回顾魔幻的 2020 年
文章图片

文章图片

不难看出 , 在 1月19日之前 , 关于疫情相关的热搜基本保持在5条以下 , 甚至有几天并未出现相关热搜 , 但是 自1月20日开始 , 突然暴增 20+条 , 并且最高曾一天有 30+条相关热搜 , 其中最主要集中在1月23至25日 , 我们再回顾那几天的热搜
『Part』全球 100 万确诊!Python 爬取微博热搜,回顾魔幻的 2020 年
文章图片

文章图片

『Part』全球 100 万确诊!Python 爬取微博热搜,回顾魔幻的 2020 年
文章图片

文章图片

可以看到 , 虽然正值新春佳节 , 但是全国网友的关注点基本都集中 在疫情 , 在湖北 , 在武汉 。而现在今天这条热搜已经有10亿+的阅读了 。当然在这场疫情之下的热搜还有很多值得关注的热搜 , 比如 河南硬核防疫频登热搜、 买不到的口罩也曾霸屏微博、 封闭式管理虽受吐槽但是颇有成效
『Part』全球 100 万确诊!Python 爬取微博热搜,回顾魔幻的 2020 年


推荐阅读