1、相同的网址,为啥浏览器http和https都能登录,而爬虫不行\n2、网页下载内容不全

1、有的网页是javascript 生成的,这个抓取需要抓包,模拟。2、终极大法:selenium+PhantomJs
■网友
resp = s.get(get_url, headers=headers, allow_redirects=False)你使用这个 resp = s.get(get_url, headers=headers)让他自动跳转,如果resp.url != get_url 表示你没有登陆成功。。。应该是验证码没有提交这时候你有两种解决方法把浏览器的cookies手动放到程序内识别完验证码再提交


    推荐阅读