搜索引擎原理及工作流程 seo搜索引擎优化原理是什么

学习引擎
优化 , 搜索引擎的工作原理是必须要了解的 , 今天我们要说的是百度搜索引擎的工作原理 , 在了解了搜索引擎的工作原理之后 , 就会涉及到收录方面的一些问题 , 那么网站不收录又与那些因素有关系呢?
我们先来了解一下什么是搜索引擎蜘蛛 。搜索引擎蜘蛛是一个抓取信息的程序 。各大搜索引擎对应的蜘蛛是不一样的 。
百度蜘蛛
:baiduspider
谷歌:谷歌机器人
【搜索引擎原理及工作流程 seo搜索引擎优化原理是什么】30蜘蛛:360蜘蛛
搜狗蜘蛛:搜狗新闻蜘蛛
……
一、搜索引擎工作流程
1.抓取:沿着链接抓取页面信息 。
蜘蛛沿着链接爬行 , 然后爬行 , 深度和广度的爬行 。广度抓取:抓取首页、分栏页、分栏页 , 一级抓取 。深度爬行:首页、栏目页、栏目页分页、栏目页)蜘蛛沿着链接爬行 。
2.过滤:过滤内容质量不好的 , 例如:收藏的内容 , 无关的内容 , 不丰富的内容 。如果一些质量好的内容被延迟 , 过一段时间就会被收录 , 因为这需要一个周期 。
3.存储索引数据库:提取和组织质量信息 , 建立索引数据库 。
4.显示:将内容存储在临时索引数据库中 。经过一些算法的排序后 , 当用户搜索一个关键词时 , 检索器在索引数据库中快速检测出有价值的内容 , 并根据用户输入的查询关键词显示出来 。
二、网站不收录的原因
1.是否允许蜘蛛抓取 。首先要看你的网站有没有蜘蛛爬 , 然后再分析其他原因 。Robots文件中禁止蜘蛛爬行 , 所以蜘蛛不会爬行 。
2.这需要一个周期 。好的内容放在临时索引数据库中 , 通过一些算法进行排序 。如果一些质量好的内容延迟了 , 那是因为它也需要一个周期 。
3.内容质量不好 。过滤时 , 直接过滤 。
4.蜘蛛识别不了的 , 那蜘蛛直接过滤 。有哪些是蜘蛛无法识别的?
(1)Js蜘蛛无法识别 。建议只用一两个地方 。
(2)图片上的内容人眼可以识别 , 蜘蛛不能 , 所以需要添加alt属性 。
(3)视频等Flash 。这个视频的主要内容需要在视频的上下文中解释 。
(4)iframe框架 。有很多层次 。
(5)嵌套表 。
5.要登录的信息页面 。蜘蛛无法访问这样的页面 。
三 。注意事项
1.对于收录的内容 , 不要改变整篇文章的内容 , 尤其是标题 , 不要移动或者删除 , 否则会形成死链 。
2.需要一定的时间才能显现结果(2个月内都是正常的) 。网站上线一周了还没收录 , 需要一个周期时间 。
3.内容丰富 。文字、图片、视频等 。
4.吸引蜘蛛 。主动提交到搜索引擎(可重复提交) , 链接 。主动出击 。
5.蜘蛛跟踪 , 网站IIS日志 。


    推荐阅读