对于每一个优化人员来说都需要具备必然的剖析能力,剖析用户的搜索行为、剖析站点的数据流量等等。只有合理的剖析好这一些数据才可以更好的拟定我们的优化策略。其中在我们的站内剖析中不成缺傲幽一项就是剖析搜索引擎蜘蛛的抓取爬行行为。搜索引擎蜘蛛是我们肉眼所不能看到的,我们要若何剖析它的爬行行为呢?我们可以经由过水平析我们站点的IIS日志。
一:那么年夜剖析IIS日志我们可以年夜我们的站点上获得什么信息
1:在外链的培植中我们知道网站上的每一个外链都是搜索引擎蜘蛛进入我们网站的进口,对此我们可以不雅察看日志上的蜘蛛的拜访情形,就可以年夜另一角度查看我们的外链是否能够更好的吸引到蜘蛛,以此拟定一个加倍合理的外链培植策略。
2:站点的空间问题是良多站长棘手的问题之一,站点打不开很可能使我们的站点一夜回到解放前。那么对于我们的站点来说若何最快最早的体味发现问题呢。对此同样可以经由过水平析该日志上的搜索蜘蛛爬行情形,因为站点空间除了侍趵硎题的第一纺暌钩就是搜索引擎蜘蛛。
3:经由过程该日志我们也可以剖析蜘蛛对于页面内容的爬行情形。体味搜索引擎加倍喜欢我们站点上的什么内容。我们可以按照这些数据在内容上的结构或者微调,是搜索引擎加倍的爱上我们的内容。
二:若何获得我们站点的IIS日志及IIS日志的设置
首先,我们的站点空间需冲要持站点的日志下载。对于这点我们在采办站点空间的时辰可以先与空间商进行咨询,是否撑持该功能,如不美观撑持的话,一般日志文件置于weblog文件中,我们可以直接FTP到当地。对于IIS日志的记实设置,笔者认为一般如不美观站点的内容较多,结构较复杂的可以设置成一小时生成一次,而内容较少的话可以设置成一天更新一次,这样可以避免我们的IIS日志呈现信文件过年夜的问题。
三:若何剖析我们站点的IIS日志
1:对IIS日志文件的拆分剖析
我们使用FTP把日志下载当地后,可以经由过程记事本打开文件,同时搜索首要的搜索引擎蜘蛛名称,其中的百度的蜘蛛名为BaiduSpider、谷歌的蜘蛛名为Googlebot 。如下图所示
百度蜘蛛
谷歌蜘蛛
我们可以分段进行剖析
2012-04-13 06:47:10 是指蜘蛛爬行该页面的具体日期和时刻
116.205.156.37 这个地址是指我们站点地址的IP地址
GET 代表事务,跟在这个参数后面的是指蜘蛛所爬行的页面,而“/”代表的是站点的主页。
220.125.51.130 这一IP是指搜索引擎蜘蛛的处事器的IP地址。当然这个IP地址并不必然就是真正的搜索引擎蜘蛛处事器的地址,因为有可能是有的酬报了采集你的站点上的内容,而假充搜索引擎蜘蛛来爬行你的站点,抓取你的内容。这种情形虽然没有什么年夜的影响,可是如不美观频率高的话将会耗损站点的资本。那么我们若何分辩呢?笔者分先给自己的一小体例。我们可以打开我们电脑的节制呼吁窗口。然后打入nslookup+IP地址的呼吁。如不美观是真的蜘蛛会有自己的蜘蛛处事器。我们就可以对假蜘蛛的IP进行屏障措置。如下图所示

真蜘蛛

假蜘蛛
2:上文我们提到GET参数后跟的是搜索引擎蜘蛛爬行的页面,我们可以按照这一信息剖析搜索引蜘蛛对我们站点上什么内容更青睐,然后对我们的站点内容做响应的微调。
3:我们经由过程日志可以发现蜘蛛对于我们站点页面的爬行抓取是按照页面的权重的递减分品级的,一般挨次为主页、目录页和内容页。
剖析是我们优化工作一一项必不成少的工作,而我们身边可操作的数据也良多。合理的操作好这一些数据相信会为我们的优化助力不少的。本文由淘宝皇冠店http://www.jgdq.org 独家供稿,转载请留链接,感谢!

网友点评
精彩导读
科技快报
品牌展示