在HTTP头中设置Content-Type为image/jpeg,而将该JPEG文件后缀改为HTML
首先,文件的类型不是由后缀名决定的,是由文件头决定的,一般取文件内容的前两个字节来判断(十六进制)。另外,对于浏览器来说,Content-Type 也不是浏览器判断文件类型的唯一标准,你将 JavaScript 文件的 Content-Type 设置为 text/html,正常情况下也是会正常执行的。至于浏览器把 url 的那个东西如何处理,你可以还可以了解一下 Content-Disposition 这个 HTTP 头。对于 SEO 来说,他并不傻。我没有太深入的研究过,不过爬虫也不会仅仅根据 Content-Type 来判断文件类型的,另外影响 SEO 的还有 HTML 的 title description keywords 甚至语义化等等,特别的复杂,单个维度出现差错并不会太影响整体的结果。另外爬虫累不累你也不用考虑,你看 Google 也能直接搜出文档。本身爬虫也有这项工作。
■网友
浏览器会嗅探文件的MIME类型的。不过如果你设置了X-Content-Type-Options为nosniff的话它就会老老实实地根据content type识别了。至于文件后缀名,大部分情况下是起不到什么作用的。但ie的话,不让浏览器自动嗅探的情况下,如果后缀名和文件类型对不上,可能会导致解析失败。其它不太了解。
推荐阅读
- 沈阳全员检测:已设置1549个检测点64万余人检测结果均阴性
- 禁停标志|南通市沿河路终点路段设置禁停标志,附近有车族存异议?
- 咋解决电信营业厅对http网址的污染
- 关于用phpfsocket 写Post, 模拟http 报文怎样写入要传输的处理数据
- 如果把DNS从godaddy转到DNSPOD是不是所有的二级域名都要重新设置,然后等这个各个ISP的缓存重新解析啊
- 为啥iphone这样的手机不设置关机需要密码
- Python3.4和3.5区别大么
- 1、相同的网址,为啥浏览器http和https都能登录,而爬虫不行\n2、网页下载内容不全
- C语言指数函数代码
- 如果要在手机上做一款FPS+MOBA,你会咋设置操作模式来让其获得最佳体验