爬虫怎样抓取b站评论，弹幕等内容 import reque

import requestsimport reimport osimport sysimport json# B站API详情 https://github.com/Vespa314/bilibili-api/blob/master/api.md# 视频AV号列表aid_list = # 评论用户及其信息info_list = # 获取指定UP的所有视频的AV号 mid:用户编号 size:单次拉取数目 page:页数def getAllAVList(mid, size, page): # 获取UP主视频列表 for n in range(1,page+1): url = "http://space.bilibili.com/ajax/member/getSubmitVideos?mid=" + \\ str(mid) + "\u0026amp;pagesize=" + str(size) + "\u0026amp;page=" + str(n) r = requests.get(url) text = r.text json_text = json.loads(text) # 遍历JSON格式信息，获取视频aid for item in json_text: aid_list.append(item) print(aid_list)# 获取一个AV号视频下所有评论def getAllCommentList(item): url = "http://api.bilibili.com/x/reply?type=1\u0026amp;oid=" + str(item) + "\u0026amp;pn=1\u0026amp;nohot=1\u0026amp;sort=0" r = requests.get(url) numtext = r.text json_text = json.loads(numtext) commentsNum = json_text page = commentsNum // 20 + 1 for n in range(1,page): url = "https://api.bilibili.com/x/v2/reply?jsonp=jsonp\u0026amp;pn="+str(n)+"\u0026amp;type=1\u0026amp;oid="+str(item)+"\u0026amp;sort=1\u0026amp;nohot=1" req = requests.get(url) text = req.text json_text_list = json.loads(text) for i in json_text_list: info_list.append(,i]) # print(info_list)# 保存评论文件为txtdef saveTxt(filename,filecontent): filename = str(filename) + ".txt" for content in filecontent: with open(filename, "a", encoding=\u0026#39;utf-8\u0026#39;) as txt: txt.write(content +\u0026#39; \u0026#39;+content.replace(\u0026#39;\\u0026#39;,\u0026#39;\u0026#39;) + \u0026#39;\\\u0026#39;) print("文件写入中")if __name__ == "__main__": # 爬取逆风笑只爬取第一页的第一个 getAllAVList(2019740,1,1) for item in aid_list: info_list.clear() getAllCommentList(item) saveTxt(item,info_list)数据接口可以参考Vespa314的github
Vespa314/bilibili-api推荐工具
chorme的F12调试模式和chorme应用POSTMAN

■网友
弹幕的爬虫之前我写过，你可以参考下-\u0026gt; LewisTian/Crawler
看了下评论其实也不麻烦，善用Chrome

API如下，改变av号即可得到不同视频的评论，pn是页数
https://api.bilibili.com/x/v2/reply?jsonp=jsonp\u0026amp;pn=1\u0026amp;type=1\u0026amp;oid={av}\u0026amp;sort=0随便找的一个视频，一条评论以及对应api得到的数据

原视频评论

API得到的评论最后推荐自己另一个爬虫，爬取了b站绘画区60w条数据和爬取up主相簿 LewisTian/bilibili-album

■网友
我也是想抓B站弹幕玩玩才搜到这个问题的
1.先关闭浏览器的js功能，这样打开视频页面以后看到的页面和你用爬虫请求到的页面是一样的。然后查看源码。用xpath查找到这个script标签：

爬虫怎样抓取b站评论，弹幕等内容

推荐阅读

「梁铉锡承认非法赌博嫌疑」YG娱乐前代表梁铉锡承认非法赌博嫌疑

科学家|地球要降温了？拉尼娜发生概率明显增强，我国要进入“寒冬”了？

梦见很多老鼠爬到自己身上还咬人梦见很多老鼠爬到自己身上咬自己

穿搭|宋佳仗着高真敢穿，牛仔外套配低腰包臀裙，像裹着棉被走路太臃肿

网友|台湾名嘴称“大陆经济大崩溃”，网友：井底之蛙

win7系统还原怎么操作（win7如何系统还原怎么还原win7系

青年|小乐言首播，从包哥到包子与老大哥形同陌路，小乐言人设崩塌？

中金网@4 月来最高涨 23% 整体仍深度亏损，油气基金

最新！这个国家总统确诊，日感染人数破万，已有中国公民确诊，中使馆紧急提醒…

人生，以平静的心，待不平的事平静的心

在产业前沿借势起飞榆林羊绒闪耀2020国际冬季运动博览会

鼻子上长痘痘的原因有哪些？鼻子上长痘痘是什么原因

明星八卦|72岁蒋大为一家近照曝光，女儿蒋怡长相清新甜美，老婆的颜值却一言难尽

电竞花生|女装大佬艾比热舞被吐槽，裙子有点短，粉丝：他是男孩子！

观察者|即将崩溃！真相曝光，三峡大坝已变形

|网曝三字S姓女星是娱乐圈内的“女海王”：曾经睡过多位男顶流

傻丫头看搞笑|都变演完了，还在这蹲着干啥？等着过年啊！，搞笑GIF：走啦蠢蛋

在王思聪微博下说“操我”的妹子们都在想啥

[JD妈妈]退休校长支招：家有"拖延症"的孩子，父母牢记这7招，招招管用！

弟弟婚礼上，有人告诉我新娘的身份，我气得不打一处来！