最新消息:建议添加本博客到收藏夹,方便您下次查看哦

3分钟通俗彻底地理解蜘蛛

seo教程 admin 333浏览 0评论

刚学习seo小伙伴,最开始接触的就是蜘蛛了,那么什么是蜘蛛呢?蜘蛛又有那些呢?蜘蛛是什么工作的呢?下面我们花2分钟彻底理解下蜘蛛。

2分钟通俗彻底地理解蜘蛛

什么是蜘蛛?

蜘蛛就是一段抓取程序,顺着超链接来抓取网页,从一个网页到另外一个网页,最终形成一张像蜘蛛一样的网。你可以想象蜘蛛就是一个普通用户,从一个超链接点击进入另外一个超链接,一直不断地点击下去,访问到哪儿就抓取到哪儿。在seo中看到Spider就是指蜘蛛的意思。

蜘蛛有哪些?

百度蜘蛛:Baiduspider

谷歌机器人:GoogleBot

360蜘蛛:360Spider

搜狗蜘蛛:Sogou News Spider

雅虎蜘蛛:“Yahoo! Slurp China” 或者 Yahoo!

有道蜘蛛:Youdaobot 或者 Yodaobot

Soso蜘蛛:Sosospider

目前国内最常用的是Baiduspider,谷歌回归中国遥遥无期,所以国内谷歌用的不多。除了互联网人士,大多数网民都是不会去翻墙的。360浏览器用的人也挺多的,所以360搜索也占有一定的比例。360Spider的蜘蛛也就跟着重要了起来。

蜘蛛是什么工作的呢?

通俗简单理解就是,每天都有很多的百度蜘蛛在抓取网站的内容,各种网站,然后存储在一个容器里面。当用户输入关键词搜索时,百度就从这个容器中筛选出相应的网页,让我们网站的网页更容易被蜘蛛抓取,更容易被展示就是seo的工作。

蜘蛛是什么工作的呢?

蜘蛛抓取形式?

蜘蛛抓取网页有两种形式,一是深度优先策略,二是广度优先策略,百度不会单独用一种,是两种同时用的。

蜘蛛抓取图示

蜘蛛抓取图示

深度优先策略就是从上到下抓取,想象上面是一个导航栏,A是首页,A1,B1,C1是一级导航,那么就是抓了A1后,接着抓A2,其他类推。

广度优先策略就是从左到右抓取,那么就是抓了A1后,接着抓B1,其他类推。

蜘蛛抓取的内容

1.链接,蜘蛛通过链接来爬行的,当然会抓取链接了。

2.文字,蜘蛛对文字的识别度最高。

3.图片,注意要写上alt,当图片不显示时,alt的内容就会显示出来,有利于蜘蛛抓取,也有利于用户体验。

4.视频,flash,js,iframe框架,这四种是不识别的,所以网站中不建议用。

5.如果网站的某个模块需要登录才能进入,这个时候蜘蛛就不能抓取了,蜘蛛不能自动的注册登录的。

 

原创文章,作者:乐呵seo,如若转载,请注明出处:http://www.leheseo.com/seojiaocheng/252.html

 

发表我的评论
取消评论

表情