搜索引擎工作原理,百度蜘蛛抓取顺序以及原理详细介绍

时间:2018-10-07 22:45:44 阅读:296次


搜索引擎工作原理,百度蜘蛛抓取顺序以及原理介绍

什么是搜索引擎?

我们常见的搜索引擎有百度,360,搜狗,谷歌,还有必应,搜搜等,搜索引擎优化,就是针对这些搜索引擎优化自己的网站,

搜索引擎怎么赚钱的


百度就是靠竞价赚钱的,如上图,带有广告的标志,都是靠金钱才能出现的。360推广也是一样的。

我们做seo有什么好处呢?

最主要的就是省钱,seo是自然排名,搭建好网站后不需要再花钱,获得的都是自然流量!

搜索引擎工作原理顺序

抓取-过滤-收录-索引

怎么让百度蜘蛛来到自己的网站

1、 做好网站后等待一段时间,百度会自己爬取自己的网站;

2、 在百度站长平台进行提交,提交后,百度蜘蛛会主动来到自己的网站抓取;

怎么知道百度蜘蛛来过我们网站

1、 通过百度站长平台的抓取频次

2、 通过网站服务器日志分析。

影响百度蜘蛛抓取网站的因素

1、网站的网址太长,或者路径层次太多,比如:

www.zxczxc.cc/a/acc/zhen/2018/10/7/122.html

2、中文路径,常见的就是TAG标签,不经过优化的话,搜索引擎会把中文变成一长串的字符,是非常不利于优化的。也是非常不利于抓取的。

3、网址服务器不稳定,如果空间不稳定,经常打不开或者速度特别慢,当然是不利于蜘蛛抓取的,也不利于用户体验,因此服务器的稳定性是非常重要的。

4、一些需要登录才能看到的页面,百度蜘蛛是机器人,不会登录的,因此你做的再好,也是无法抓取的。

5、动态路径是可以抓取的,但是对抓取是有很大影响的,不利于抓取,因此大家常见的也是静态路径。

百度蜘蛛会过滤掉那些页面?

过滤一些低质量的页面,比如空白页面,样板页面(也就是相似的页面)不想关的页面(也就是和主题不符合的内容直接清除),

百度蜘蛛不能抓取flash,js,视频,图片,因此需要文本说明,比如图片一定要添加alt属性,告诉蜘蛛这是什么东西。

还有一些标签,比如table标签,会导致蜘蛛抓取困难,因此最好不要用table标签,大家在搜索一些常用的织梦模板的时候也会发现,很多说明上,显示本站采用纯div+css手写,利于seo优化。

收录:

对于质量比较好的文章进行收录,怎么看百度是否收录了这个页面?

1、 直接百度搜索这个网址,如下图:表示已收录


2、 选择第三方工具,查询是否收录?输入自己的网址直接查询即可。


以上两种是查询某个网址是否收录,还有一种,site:www.taiyuanseo.top,表示查询这个网站所有收录的页面,当然也不是十分准确的,只是个大概数字,具体数据还是要通过百度统计进行查询!


排序:

排序就是根据用户的需求,从索引库中找出符合用户需求的文章。

百度搜索结果都是有排名的,百度会为每个页面进行打分,按照得分高低,进行排名。排序是和网站的整体优化相关的,最重要的就是解决用户需求,讲究用户体验。

搜索引擎工作原理图解:


关于搜索引擎工作原理,百度蜘蛛抓取顺序以及原理详细介绍,就为大家介绍到这里。

本文由紫书SEO整理编辑发布:搜索引擎工作原理,百度蜘蛛抓取顺序以及原理详细介绍

文章地址:https://www.taiyuanseo.top/84.html,转载请注明出处!