怎么样在自己的网站上做一个搜索框搜索结果来源于另一个网站 (ps另一个网站需要登录账号)
谢邀这样的网站必须要有后端后端可以用php:Snoopy downloadnodejs:GitHub - request/request: Simplified HTTP request client.python:Requests: HTTP for Humansjava:jsoup开发指南,jsoup中文使用手册,jsoup中文文档这四个都是可以模拟访问网站并解析页面的功能模块你要在前端把你的搜索参数传到自己的后端,然后在后端模拟访问你要获取数据的网站,然后再从自己的后端返回自己的前端。感觉跟绕口令一样。
■网友
您这就是想抓人家网站的内容吧,直说嘛……另一个网站需要登录这样的话你不能保证用户是不是在它那边有登录了(当然,你可以引导用户这么做),但是它本身是否提供可以给你跨站调用的搜索接口呢?通常来说当然是不会的。甚至,你要抓的那个网站可能本身连搜索功能都没有。那你就得用一个能做登录身份的spider抓它内容,下来自己建索引。毕竟拿别人的东西不是那么容易的。
■网友
百度站内搜索?
■网友
扒别人的网站是不对的。
■网友
嵌入百度站内搜索
■网友
前端实现是不可能的,ajax有跨域限制,jsonp需要对方网站开通你的域名,所以最保险的还是后端实现,后端用爬虫解析对方HTML返回,然后提取关注信息返回给你的前端,JAVA的话,可以用jsoup做解析。jsoup用的时候设置好cookies就可以了,浏览器登录后有个cookies的ID,并不需要你用问号代入参数。只要是用cookies维持session的(99%的网站都使用cookies机制),根本不用考虑验证码机制,只要在普通浏览器中登陆一遍,然后拿到cookies的ID,即可在程序中伪装访问。如果网站展现出来的最终渲染HTTP是通过ajax将核心数据加载过来的,那就有点复杂了,需要在程序中内嵌一个可以完整模拟JS的浏览器,常用的简单做法是内置一个标准WebView,通用一些的做法是使用CEF内置一个chromium,最终也能拿到渲染过的HTTP,继而用DOM去爬数据。总之熟悉WEB开发前后端各种机制,以不变应万变。
■网友
第一反映是谷歌镜像...
■网友
JSONP办不到么
推荐阅读
- 设计专业学生上传自己的作品,用哪个网站比较好
- 商家通过低保户购物而把自己的利润返还赠送低保户安装宽带或者旧电脑可行吗
- 学的自动化却对IT比较感兴趣。。感觉对自己的专业帮助不大,好苦恼,要不要继续是专精还是学点感兴趣的?
- dart这编程语言现在发展怎么样了,语法与Java,c#很相似,甚至更简洁
- 青年|一汽奔腾T77怎么样?车主吐槽:后排座椅太短,和坐小板凳似的
- 电商网站支付流程的流失率是怎么样的从用户点击充值/支付按钮,到支付完成,其中每一步的流失比率都是咋样的
- 作为一个服装供应商,怎么样与淘宝卖家沟通才能卖出自己的产品或者拿到订单
- 在丁丁租房工作的感受是怎么样的
- 城市数据团是怎么样一个团队
- win7中本地连接跟无线网卡同时使用时是怎么样的模式