在HTTP头中设置Content-Type为image/jpeg,而将该JPEG文件后缀改为HTML

首先,文件的类型不是由后缀名决定的,是由文件头决定的,一般取文件内容的前两个字节来判断(十六进制)。另外,对于浏览器来说,Content-Type 也不是浏览器判断文件类型的唯一标准,你将 JavaScript 文件的 Content-Type 设置为 text/html,正常情况下也是会正常执行的。至于浏览器把 url 的那个东西如何处理,你可以还可以了解一下 Content-Disposition 这个 HTTP 头。对于 SEO 来说,他并不傻。我没有太深入的研究过,不过爬虫也不会仅仅根据 Content-Type 来判断文件类型的,另外影响 SEO 的还有 HTML 的 title description keywords 甚至语义化等等,特别的复杂,单个维度出现差错并不会太影响整体的结果。另外爬虫累不累你也不用考虑,你看 Google 也能直接搜出文档。本身爬虫也有这项工作。
■网友
浏览器会嗅探文件的MIME类型的。不过如果你设置了X-Content-Type-Options为nosniff的话它就会老老实实地根据content type识别了。至于文件后缀名,大部分情况下是起不到什么作用的。但ie的话,不让浏览器自动嗅探的情况下,如果后缀名和文件类型对不上,可能会导致解析失败。其它不太了解。


    推荐阅读