好久没上Google Sitemaps看看了。今天过去看了一下,Google Sitemaps的界面又变了。摘要那儿显示的信息更全了,各项信息一目了然,包括上次Googlebot访问的时间;Sitemap的个数,有无错误;每类访问错误的名称,错误个数。
在“网络抓取”里,可以看到分门别类的出错信息。
- “HTTP错误”有33个,日期全部是8月3日,错误信息是找不到域名,这是因为当时给域名换了DNS服务器,参见我8月3日的文章《解决了DNS解析的问题》。
- “无法访问的网址”则是因为网络连接不正常而导致。
- “未找到”里都是找不到页面,返回404的。如果你删除了文章或者给文章换了缩略名,都会导致原来的页面404。我还看到了两个奇怪的链接:"http://yskin.net/%E6%A1%91%E6%A4%B9","http://yskin.net/K2%20Navigation%20System",这是因为我加链接的时候不小心犯了错误。我写Blog时习惯使用可视化编辑器,然后点击html按钮直接编辑html代码。加链接的时候我用Firefox里的BBCode扩展,先把链接的名称复制上去,再将链接的地址copy到剪贴板,选中链接名称,右键,Make Selection URL from clipboard,这样链接的代码就会被加上了。这两个错误显然是因为复制链接地址时没复制上,剪贴板里还是原来的链接名称。直接进数据库,把两处错误搜出来,改正。
- “没有附带网址”不太清楚,我这里显示为0,或许是指<a>标签里href部分错误?
- “网址受 robots.txt 限制”就是Google知道这个网址存在,不过由于网站的robots.txt文件限制不能把他们加入索引数据库。这里可以检查robots.txt工作是否正常,该限制的地址是否被限制住了,不该限制的地址是否有被错误限制的。
- “网址超时”好理解,就是time out嘛,访问超时了,我这里是0。如果有超时的情况发生,可能是你的服务器的网页执行速度或者网络访问速度太慢咯。
以前的Google Sitemaps可以让错误按照时间顺序排序,在上一次改版中这个功能取消了,而这一次改版则增加了显示某段时间的错误信息的功能。这样也不错,选择一次就对所有的分类生效,不用再象以前那样换一个分类又要选按时间排序。如果隔上几天就进Google Sitemaps里看一下的话,可以让他只显示这几天的错误信息,很方便。
“robots.txt 分析”页面可以显示出Google当前cache的你的网站的robots.txt文件。你可以在里面进行测试,修改上面的robots.txt文件,再在下面添上你要测试的网址,点“拼写检查”(汗一个,这是怎么翻的啊),就会显示出每个网址被允许还是被禁止,被禁止的理由又是什么。
“管理网站验证”和“首选域”都是新加上去的,最初通过了网站验证的话现在就不用管第一项了,“首选域”则是指如果你有"yskin.net"和"www.yskin.net"两个域名,访问他们是等价的,那么指示Google索引以哪个域名为主。
“统计信息”中:
- “查询统计信息”可以显示通过Google搜索进入你的Blog的热门关键词。
- “抓取统计信息”可以显示网站中PageRank的分布。我以前只有“低”和“未分配”两项,现在终于有了“中”了。刚刚发现《Wordpress中文包导致数据库备份插件出错》有5点PR值,也许是因为太多人遇到过这个问题吧。下面是“您 PageRank 最高的网页”,6,7,8月份都显示的是《Wordpress中文包》,好奇怪,查这个页面的PR值只有3啊。
- “网页分析”页面可以显示网页的类型(比如text/html)、编码(比如UTF-8)、以及“在您网站内容中”和“在指向您网站的外部链接中”的常用字词。
- “索引统计信息”则是指向Google对你的网站的各类查询的链接,有网站的索引网页、链接网页、相似网页以及缓存。
我觉得Google Sitemaps对于Google的收录没多大作用,反而是Dagon Design Sitemap Generator插件更有用点。不过这里可以显示出Google收录的状况,经常过来看一下还是不错的。
怎么才能看到googlesitemaps里面的内容啊?