比来担任一个年夜中型英文网站的第三方seo参谋,因为某些原因,网站某部门的URL需要更改,呈现几十万页面级此外301和404。若何才能统计到新页面被Google索引了没?其实可以操作Google打点员工具,就可以统计到这些新页面被Google索引了若干好多,而且还可以斗劲切确地获得网站整体在Google里的索引量。
以我的博客为例,直接site我的博客找到486条结不美观,而我的博客今朝只有72篇文章,加上分类页面也相差好几百。原因是早段时刻改换主机,自己 年夜头哈健忘上传robots.txt,导致一些一再内容页面也收录了,后来才上传了robots.txt。此刻Google “site:yihuiblog.com”就会呈现如下的收录,只有网址没有内容(过一段时刻才会删除)。

网站会呈现良多的问题,造成搜索引擎索引一些站长不想索引的页面,搜罗常见的一再内容页面、无限轮回页面(日常平常我们还要尽量找出这些链接屏障失踪和到Google打点员工具里删除),年夜中型网站就加倍普遍。但这些索引数据对seo剖析生发火用年夜么?不年夜,甚至等于0。
其实可以在Google打点员工具Sitemap模块里获得“真实”的收录数据,这个“真实”取决于你想让哪些页面被Google索引。此刻我想知 道我博客分袂有若干好多文章和分类页面被索引,首先我建造两个网站地图文件,一个包含所有文章地址(URL),一个包含所有分类地址,然后在打点员工具提交 sitemap地址。
Google打点员工具后台直接提交比robots.txt写入地图地址要好,一方面加倍矫捷,一方面可以防止竞争对手获取站点数据进行研究。
因为演示,追求简单,这里我只建造了文当地图文件,主流搜索引擎撑持RSS、Atom、XML和文本等多种名目的地图文件,Google撑持一个站点地图文件最多包含 5 万个网址,压缩前体积不得跨越 50MB。

上图显示Google索引了一灰博客的72个文章页面和22个分类页面。按照需求拆分网站地图文件,可以便利获得你想要的索引数据,而且可以提交重叠的网址,例如同时提交网站最新更新产物的网页地址和某分类下产物的网页地址(存在重叠网址)。获得收录数据,就可以有针对性地进行优化。例如优化持久不索引的页面,等Google蜘蛛下次爬行后进行索引,也可以与同期其他seo数据进行融合,获得更多对seo有辅佐的数据。其实Google在site的时辰已经明晰Google打点员工具这一功能,只是良多人没有进一步操作。

操作好Google打点员工具,可以抽离出更多对seo有用的数据,往后再慢慢切磋。Bing打点员工具也有良多适用的数据,同样不要错过哦。
原文地址:http://yihuiblog.com/a/299.html

网友点评
精彩导读
科技快报
品牌展示