'网络服务' 分类的存档

Google Sitemaps可以用meta标签验证了

alonefly那里得知,Google Sitemaps现在已经可以用meta标签进行网站验证了。因为我的网站已经验证过了,所以一直不知道。也不知道Google Sitemaps什么时候添加的这个功能,在网上也没搜着。刚才用女朋友的Google帐号测试了一下,果然是这样。现在,使用blogger.com并发布到sitesled.com的blogger们,还有使用blogger.com并发布到blogspot.com的blogger们,你们还有什么疑问吗?赶紧的吧,到Google Sitemaps网站,拿到那串meta字符串,粘贴到模版的head标签里吧。

最近Google Sitemaps又增加了一些新功能,比如可以自行设定Googlebot的抓取速度,我把速度设为最快,反正Google的spider访问的再多也没百度的勤快。还有一个“增强型图片搜索”功能,允许Google用增强型搜索功能搜索网站中的图片。

Google Sitemaps现在功能越来越强了,不过我不经常上,只是用Google Sitemap Generator自动生成sitemap.xml文件并通知Google,再由Google自动读取sitemap.xml文件并处理。一般一个月上一次,看一下网站的死链接。还有修改robots.txt文件时用他的robots.txt分析工具。这好几个月,我的网站上最高PR值的页面都是http://yskin.net/wordpress-chinese/,555~~

Update:这几天花了点功夫,把我的feed加到了Google Sitemaps里。以前使用blogger.com时,可以把"http://yskin.sitesled.com/blog/atom.xml"这样的feed地址加入Google Sitemaps里,以便Google读取其中的地址。现在用了WordPress,"http://yskin.net/feed/"这样的地址却不能添加,因为Google认为这是一个子目录的地址,而sitemap文件要求放在根目录。研究了半天,发现可以用"http://yskin.net/feed"这样的地址,少加一个斜线就可以了。还有"http://yskin.net/?feed=rss2"也可以。另外,我用了FeedBurner转向插件,feed会被自动转向到FeedBurner烧录过的地址,而烧录过的feed里所有文章的链接会被修改成FeedBurner的地址,以便FeedBurner跟踪点击,这就导致了Google读不到文章的原始地址,从而无法从feed里收录页面。好在我的FeedBurner转向插件经过修改,不转向feed的preview地址,所以在Google Sitemaps里添加了"http://yskin.net/feed?preview=true"这个地址。过了一天再来看,Google已经读取了这个地址,并确认没有问题,在地址后面标上类型为“RSS 馈送”。

达尔文全部著作将上网

据BBC在2006年10月19日报道

剑桥大学正在将生物学家达尔文的全部著作上网,预计所有工作将在2009年达尔文诞辰两百周年时完成。

这项计划至今已经将大约5万页的文字和4万张原始出版的图片数码化,所有这些都已经可以在网上搜寻。如果用户使用MP3播放器,他们还能进入可供下载的录音档案。

这些资料主要是为研究人员提供方便,但是任何对达尔文和他的进化论理论感兴趣的人都可以上网流览。

另据新华社2006年10月21日报道,“预计这项工作将在2009年达尔文诞辰两百周年时完成。”剑桥大学做的这个项目确实是很有价值。到这个Charles Darwin Online网站Charles Darwin Online网站看了一下,资料挺丰富的,有文章有图片。老外都很重视信息上网,让这些优秀的文章和图片进入网络,使得世界各地的互联网用户都可以方便访问这些资源。反观我们国内,好像没什么人做这样的事情,大家都忙着赚钱呢,国内的大学有把什么资源放到网络上了吗?国内大学的网站有变成资源丰富型网站吗?都TMD放一堆校园图片在上面。

达尔文(Charles Darwin),1859年11月24日出版《物种起源》,提出了进化论的观点,为生物学作出很大的贡献。不过有一点要记住,看看网站上的那些图片,达尔文跟着远洋航行的船走了多少小岛,研究了多少生物,画了多少幅图片,有了这些证据,他才最终提出了进化论的观点。做学问是扎扎实实的做,要得出一个结论需要做很多的分析,而不是靠脑子一激灵冒出来的。向大众推行自己的观点,也是要有证据,有理由,而不是天天喊着“反权威”,喊着“平民”就行了的,MD和文革时的红卫兵有什么区别?

下面的图片是BBC网站上的,看看能不能访问?hoho
加拉帕戈斯群岛上的鸟 from Darwin, C. R. ed. 1839 (Cam Uni)

my.donews.com

昨天看到shura说my.donews.com的翻译有点问题。去看了一下,插件页面下面的说明确实错写成模版的说明了。哈哈,据我了解,早先Jeffrey做的那个WP中文包就有这个错误。这说明,donews的人偷懒,直接拿了Jeffrey的中文包过来用了,哈哈哈。

my.donews.com最早好像是WordPress 1.5改的,还说什么1.5版本稳定。现在WordPress都更新到2.0.4了,多用户版WPMU也出来了,donews这边好像还没有什么动作。不过现在用它倒也可以,总比blogger.com强点,以后转用自己架设的WordPress也方便。没有技术和经济能力的人,在my.donews.com建Blog也不错,不过不知道当你需要转出Blog时,donews的人会不会把数据库打包给你。WordPress好像没提供从其他WordPress的Blog导入的功能,只能从blogger.com导入,到时只能通过RSS导入咯,而且评论都丢了,唉!

4月份在my.donews.com上面建了个Blog做测试,现在又去看了看,插件页面里多了好几个插件可以选择使用。一个一个看了一遍,没什么好东西,还有很多是2004年或2005年上半年写的插件,属于古董级插件了。转了一圈,一个可以拿来用到我的Blog上的插件也没有。

本来想着donews那么强悍,翻译的应该不错,可以照着他的翻译文本把我的WordPress中文包修改下,现在看到翻译是直接拿Jeffrey的,唉,算了。页面上也没什么可以参考的,sidebar里都没翻译,日期格式也不好看,评论那里每条评论后面都显示着“编辑此文”,不管你是否以管理员身份登陆,看来模版没有遵循WP标准啊。下面发表评论的部分也没翻译,汗死。逛了一圈,一无所获,唉,闪人了。

Update:好像my.donews.com是用WordPress MU架设的。最近WordPress MU 1.0发布,my.donews.com也小小的升级了一下,不过好像还没有到1.0版本。my.donews.com还是用的Jeffrey的古老的中文包,很多地方都还是英文,真是懒啊。

WPMU有一个导出Blog功能,但是my.donews.com把这个功能隐藏了,其实还是可以进入导出的,导出来的是一个XML格式的WXR文件,可以用于在其他WordPress架设的Blog中导入。哈哈,这下搬家方便啦。

把my.donews.com的插件看了一遍,居然还有Limit PostsLimit Posts这样的插件,用于把首页的文章截断。唉,国内各大BSP的Blog都喜欢这个功能,哈哈。不过,这种古老的插件是不会在意多字节文字的截断问题的,hoho

Google Sitemaps又更新了

好久没上Google Sitemaps看看了。今天过去看了一下,Google Sitemaps的界面又变了。摘要那儿显示的信息更全了,各项信息一目了然,包括上次Googlebot访问的时间;Sitemap的个数,有无错误;每类访问错误的名称,错误个数。

在“网络抓取”里,可以看到分门别类的出错信息。

  • “HTTP错误”有33个,日期全部是8月3日,错误信息是找不到域名,这是因为当时给域名换了DNS服务器,参见我8月3日的文章《解决了DNS解析的问题》
  • “无法访问的网址”则是因为网络连接不正常而导致。
  • “未找到”里都是找不到页面,返回404的。如果你删除了文章或者给文章换了缩略名,都会导致原来的页面404。我还看到了两个奇怪的链接:"http://yskin.net/%E6%A1%91%E6%A4%B9","http://yskin.net/K2%20Navigation%20System",这是因为我加链接的时候不小心犯了错误。我写Blog时习惯使用可视化编辑器,然后点击html按钮直接编辑html代码。加链接的时候我用Firefox里的BBCode扩展,先把链接的名称复制上去,再将链接的地址copy到剪贴板,选中链接名称,右键,Make Selection URL from clipboard,这样链接的代码就会被加上了。这两个错误显然是因为复制链接地址时没复制上,剪贴板里还是原来的链接名称。直接进数据库,把两处错误搜出来,改正。
  • “没有附带网址”不太清楚,我这里显示为0,或许是指<a>标签里href部分错误?
  • “网址受 robots.txt 限制”就是Google知道这个网址存在,不过由于网站的robots.txt文件限制不能把他们加入索引数据库。这里可以检查robots.txt工作是否正常,该限制的地址是否被限制住了,不该限制的地址是否有被错误限制的。
  • “网址超时”好理解,就是time out嘛,访问超时了,我这里是0。如果有超时的情况发生,可能是你的服务器的网页执行速度或者网络访问速度太慢咯。

以前的Google Sitemaps可以让错误按照时间顺序排序,在上一次改版中这个功能取消了,而这一次改版则增加了显示某段时间的错误信息的功能。这样也不错,选择一次就对所有的分类生效,不用再象以前那样换一个分类又要选按时间排序。如果隔上几天就进Google Sitemaps里看一下的话,可以让他只显示这几天的错误信息,很方便。

“robots.txt 分析”页面可以显示出Google当前cache的你的网站的robots.txt文件。你可以在里面进行测试,修改上面的robots.txt文件,再在下面添上你要测试的网址,点“拼写检查”(汗一个,这是怎么翻的啊),就会显示出每个网址被允许还是被禁止,被禁止的理由又是什么。

“管理网站验证”和“首选域”都是新加上去的,最初通过了网站验证的话现在就不用管第一项了,“首选域”则是指如果你有"yskin.net"和"www.yskin.net"两个域名,访问他们是等价的,那么指示Google索引以哪个域名为主。

“统计信息”中:

  • “查询统计信息”可以显示通过Google搜索进入你的Blog的热门关键词。
  • “抓取统计信息”可以显示网站中PageRank的分布。我以前只有“低”和“未分配”两项,现在终于有了“中”了。刚刚发现《Wordpress中文包导致数据库备份插件出错》有5点PR值,也许是因为太多人遇到过这个问题吧。下面是“您 PageRank 最高的网页”,6,7,8月份都显示的是《Wordpress中文包》,好奇怪,查这个页面的PR值只有3啊。
  • “网页分析”页面可以显示网页的类型(比如text/html)、编码(比如UTF-8)、以及“在您网站内容中”和“在指向您网站的外部链接中”的常用字词。
  • “索引统计信息”则是指向Google对你的网站的各类查询的链接,有网站的索引网页、链接网页、相似网页以及缓存。

我觉得Google Sitemaps对于Google的收录没多大作用,反而是Dagon Design Sitemap Generator插件更有用点。不过这里可以显示出Google收录的状况,经常过来看一下还是不错的。

FeedBurner订阅数统计的问题

刚才去Bloglines看了下。很久没有进Bloglines了,当时换用了GreatNews,后来又开始用抓虾。我还是比较懒的,虽然订的feed也就10多个,但是还是懒的看。GreatNews可以绿色化,装到U盘里就可以带着到处跑,不过他是使用SQLite数据库的,一更新就要重写数据文件,U盘狂闪,有点怕把我的U盘给搞坏咯。抓虾呢,还算不错,虽然他默认的CSS把分段<p>的上下距离都设为0了,看起来很不舒服,不过我们用的是Firefox嘛,很容易搞定。少了Bloglines的快捷键,多了只显示标题的功能,看一些新闻feed时,按下只显示标题,有感兴趣的按下标题右边的空白就可以单独展开这一项,非常的方便。只显示标题时,一页10个标题正好一屏幕,从上到下浏览一遍,点一下下一页就可以了,如果一直没有感兴趣的,鼠标可以一直停在下一页的按钮上。

继续阅读《FeedBurner订阅数统计的问题》

blogger.com到底封了没?

我上网的线路应该是深圳电信,123cha查到的结果是“您的ip:[219.134.63.61] 来自: 广东省 深圳市 电信”。我从2005年10月就开始在blogger.com上写Blog,当时基本上每天都要上blogger.com网站,一直到2006年4月1日,我完成了所有文章和评论向WordPress的迁移,在blogger.com上发表了最后一篇文章告知大家访问新Blog。从最开始我就不能直接访问blogger.com,而且利用普通国外代理服务器也没法访问,感觉是典型的关键词屏蔽。每天通过Tor访问blogger.com的同时,我也会隔上两个小时就直接访问blogger.com看一下,期待着能在解封的时候及时的得到消息。我还记得当时虽然文章发布到了sitesled.com,访问者可以直接访问了,但是发布评论仍然是要连接到blogger.com网站上发,导致不会用Tor的访问者无法发布评论,所以有人写了一段发布评论的代码,只要粘贴到模版里,替换原来的代码,访问者就可以直接在页面上写评论,而不用连接到blogger.com网站了。网络上可以看到很多文章都谈到“blogger.com被封”的事情,所以“blogger.com被GFW关键词屏蔽,必须使用Tor才能登陆;blogspot.com也被屏蔽了,不过可以通过普通国外代理访问”在我的眼里就是一条网络基本常识。一直到现在,我都对此深信不疑。

继续阅读《blogger.com到底封了没?》

FeedBurner被封?

今天早上开始,FeedBurner就一直不能访问,GreatNews里红了一片。看keso的文章《FeedBurner被封?》,说是电信用户都不能访问了。再看williamlong的文章《FeedBurner挂了》,唉!

今天这么不爽,FeedBurner被封,365key暂停服务24小时,空间断了20分钟,好了以后执行时间很短,但是网络速度很慢,还有域名的第二个ns服务器解析不到IP。真是郁闷的一天。

熬啊熬,晚上11点半了,准备要走了,随手刷新了一下FeedBurner,居然可以访问了,速度还很快哩。williamlong说希望不要象上次Technorati一样垂死挣扎一下。唉,如果最终封掉了,没办法,我就开始骂吧。

Update:今天,FeedBurner一直可以访问。很好,很好,希望能一直维持下去。

365key收藏文章时出错

刚才用365key收藏一篇文章时,点保存网摘时出现一条错误信息:

Save Error(DataBase):数据库 'bookmark' 的日志已满。请备份该数据库的事务日志以释放一些日志空间。

哈哈,365key的工作人员在干嘛呢?维护工作要做好啊,要干活啊。

Update:从今天早上0点多开始,《365key停止服务24小时 整理内容》。这下爽了,今天FeedBurner被封,365key又出问题,真是×××

说是要整理内容,还说要加大编辑力度,不会开始清理收录的链接了吧?阿门,我大概收了200多个页面,要是有丢失的话我就×××

Update2:恢复了,收藏的222条,一条没丢,感谢真主。

访问wikipedia维基百科的方法

目前访问wikipedia维基百科的方法有很多种,现在逐一介绍一下:

  1. 通过普通的国外代理。这是一种通用方法,不限于wikipedia。因为wikipedia不是使用关键词屏蔽的,所以可用的普通国外HTTP或SOCKS代理就可以了,比如我现在用的这个韩国代理:125.245.19.253:8080,正好在亚洲访问维基百科时是访问维基设在韩国的服务器,在123cha差一下就知道了,查zh.wikipedia.org可以看到,地址是韩国首尔。给浏览器设置代理服务器的方法是:
    • IE:工具->Internet选项->连接->局域网设置->代理服务器,填上IP地址和端口就可以。
    • Firefox:工具->选项->连接->连接设置->手动配置代理,在HTTP代理一项填上IP地址和端口就可以。
  2. 也是一种通用方法,在网址的域名部分后面加上"nyud.net:8090"就可以了。比如访问中文维基可以用http://zh.wikipedia.org.nyud.net:8090/
  3. 维基网站提供的安全链接:
    比如要访问中文维基的主页:http://zh.wikipedia.org/wiki/Main_Page,只要访问https://secure.wikimedia.org/wikipedia/zh/wiki/Main_Page就可以了。而英文就直接访问https://secure.wikimedia.org/wikipedia/en/wiki/Main_Page就可以了。
  4. Gollum浏览器,直接选择界面语言和要浏览的wiki的语言就可以浏览了,只是图片会打不开,速度还可以。

访问blogspot.com上的网站也可以用第一个和第二个方法。不过blogger.com就不行了,必须用TOR。

Update:Cisca.cn教我的访问blogspot.com的方法:在pkblogs网站,输入你要访问的blogspot.com网站的前缀就可以访问了。你也可以直接输入"http://www.pkblogs.com/blogname"来访问,比如我以前的Blog:http://www.pkblogs.com/yskin

这个网站上面有一句:"Is your blog blocked by the Pakistani Government?"Pakistani巴基斯坦。看来不止中国封锁了blogspot.com啊,思科应邀研究出来了这个专门的路由器,也把他卖到其他地方来赚钱呢,呵呵。

开始使用Flickr

久闻flickr的大名,一直想用但是记不得自己的Yahoo帐号的密码了。没办法,谁让Yahoo没什么好的服务呢,一直不用,这密码也就忘了。 /028

今天到flickr网站上进行了注册,先按照提示注册了个Yahoo帐号,然后激活flickr帐号。注册好后得到的图片地址是随机分配的,我的是http://www.flickr.com/photos/81971176@N00/,这个时候要到Your account页面点击Set up your URL给自己设置一个别名(alias),我设置成yskin,于是我的图片主页地址就变成http://www.flickr.com/photos/yskin/。(这个别名设置了以后就不能更改了,选的时候一定要小心啊。)

看了下flickr的帮助,又在网上搜索了一下相关的说明文章,得到如下一些信息:

flickr支持jpeg,静态gif,png格式,每张图片的大小不能超过5M。上传图片后flickr会生成一些缩略图,点击All Sizes即可看到,页面下方有图片的地址和自动生成的HTML代码,可以很方便的复制到Blog中。

flickr免费帐户每个月可以上传20M的图片,这20M是带宽限制(bandwidth limit),而不是图片的大小总和,所以删除一些图片也不会再退回占用掉的带宽。这个限制也不会累加,使用量会在用户所在时区的每个月第一天的零点整自动清零。哇哈哈哈,正好今天27号,这3天赶紧把20M用完,等下个月1号又有20M用啦 :)

免费帐户只能设置3个分类,少了点。而且超过200张图片后,之前的图片就看不见了。不过图片并没有被删除,如果发布到Blog上仍然会看到。在网上搜到一个解决办法:使用这个在线工具:http://webdev.yuan.cc/lfvr/就可以方便的查看图片了,只要在左侧的User Information处输入要查看的用户名,即可在右侧方便地查看所有的图片,不受200张限制。

还有一些功能,比如通过email来上传图片,自动发布到Blog等等功能,都可以在页面上方的菜单里找到。作为一项国外的相册服务,flickr的网站速度也不是很慢,而且对于png格式图片和图片中的exif信息支持的很不错,比起国内的一些网站要好的多。

有两篇文章可以参考一下:《flickr使用超详细图解》《Flickr之中文进阶手册》

Update:找到一篇《Flickr工具大集合》,这个是翻译成中文的,英文原版是《The Great Flickr Tools Collection》。文章介绍了很多有用的工具,值得一看。