Python爬虫实现刷B站、爱奇艺等视频网站播放量

很幸运 , 这篇文章能够被发出来 。 之所以归类的Python爬虫 , 因为他的访问机制跟爬虫类似 。
私信小编01即可获取大量Python学习资料
先上代码 , 然后再分析:
import requestsfrom selenium import webdriverfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support.ui import WebDriverWaitfrom selenium.webdriver.support import expected_conditions as ECimport timewhile True:chromeOptions = webdriver.ChromeOptions()browser = webdriver.Chrome('C:\Program Files (x86)\\Google\\Chrome\\Application\\chromedriver.exe', options=chromeOptions) #浏览器驱动browser.delete_all_cookies()# 删除cookiebrowser.get("") #视频地址element = WebDriverWait(browser, 15).until( #等待播放按钮能够被加载并且能够被点击 , 15s后如果还没加载完成并且不满足被点击的条件 , 就抛出异常EC.element_to_be_clickable((By.XPATH, '//*[@id="bilibiliPlayer"]/div[1]/div[1]/div[8]/video')))element.click()print(browser.get_cookies())time.sleep(100)# 等待时常browser.quit()【Python爬虫实现刷B站、爱奇艺等视频网站播放量】代码分析:
1.库的调用
调用了这一堆库 , 不会安装库的看一看我的这篇博客:python库安装
import requests from selenium import webdriverfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support.ui import WebDriverWaitfrom selenium.webdriver.support import expected_conditions as ECimport time有人会问我 , 为什么不直接导入一个selenium库呢?养成好习惯 , 不要让你的代码很冗杂 , 不然打包的时候 , 把一整个库都会打包 。 记住 , 这个习惯很重要!!!!!
2. 浏览器调试驱动
chromeOptions = webdriver.ChromeOptions()browser = webdriver.Chrome('C:\Program Files (x86)\\Google\\Chrome\\Application\\chromedriver.exe', options=chromeOptions) #浏览器驱动这里要下载浏览器调试的驱动 , 要跟你的浏览器的版本一样 。 网址:

  • Chrom浏览器的web driver(chromedriver.exe):点这儿
  • Firefox(火狐浏览器)的web driver (geckodriver.exe):点这儿
  • Microsoft Edge :戳这里
  • Apple Safari : Click it
然后放在浏览器根目录下 , 再把浏览器根目录下的驱动的地址 , 放到代码里即可 。
browser = webdriver.Chrome('驱动路径', options=chromeOptions) #浏览器驱动3.删除cookie
browser.delete_all_cookies()# 删除cookieCookie 并不是它的原意“甜饼”的意思, 而是一个保存在客户机中的简单的文本文件, 这个文件与特定的 Web 文档关联在一起,保存了该客户机访问这个Web 文档时的信息, 当客户机再次访问这个 Web文档时这些信息可供该文档使用 。 由于“Cookie”具有可以保存在客户机上的神奇特性, 因此它可以帮助我们实现记录用户个人信息的功能,而这一切都不必使用复杂的CGI等程序。举例来说, 一个 Web 站点可能会为每一个访问者产生一个唯一的ID, 然后以 Cookie文件的形式保存在每个用户的机器上 。 如果使用浏览器访问 Web, 会看到所有保存在硬盘上的Cookie 。 在这个文件夹里每一个文件都是一个由“名/值”对组成的文本文件,另外还有一个文件保存有所有对应的 Web站点的信息 。 在这里的每个 Cookie 文件都是一个简单而又普通的文本文件 。 透过文件名, 就可以看到是哪个 Web站点在机器上放置了Cookie(当然站点信息在文件里也有保存)
为了避免 , 多次访问 , cookie记录的情况 。


推荐阅读