2006年08月 的存档

回忆1998年的互联网

刚刚在WordPress群里看一群70年代出生的互联网前辈们讨论从前的互联网。摘录几句留念一下:

继续阅读《回忆1998年的互联网》

WordPress 2.0.4中WordPress Database Backup插件的定时备份功能失效

8月6号下午4点,super37告诉我,自从更新到WordPress 2.0.4以后一直没有收到定时备份的邮件了。我到邮箱里看了一下,确实是升级之后就没有再收到了。

比较了一下,WordPress 2.0.4中,WP自带的WordPress Database Backup插件修改了3处。WP-cron插件没有动,仍然是1.4版本(插件里写成1.3版了,所以在插件页面会显示成1.3版)。看了一下,第三处最可疑,wpdbBackup_init()函数里添加了一条if ( !current_user_can('import') ) return;这个函数写着init,自然是初始化用的咯。只要检测到当前用户不能执行import操作,就立即return,不执行下面的建立wpdbBackup类的对象的操作,等于是把整个插件屏蔽了。而WP-cron的原理是每次有人访问Blog的时候检测一下有没有到了时间又还没执行的任务,有则立刻执行。wp-db-backup插件修改以后,只要每天夜里12点以后,第一个访问的不是管理员,那么自动备份就不能进行。

不知道WordPress开发组加这一句干嘛,难道是被WordPress 2.0.3的import bug吓怕了,所以到处加是否可以import的检测?数据库备份插件检查import导入权限干嘛呢,奇怪。没办法,先把这行注释掉,等着看今晚12点能否正常备份。在WordPress Trac报了个bug:Scheduled Backup in wp-db-backup plugin doesn't work,看能否有回应。

Update:在Gmail里收到备份了,时间2006-8-8 12:00am,还蛮准的 :)

修改K2的Menu部分

K2的menu直接使用了WordPress的page,导致所有的page都会被当作menu放在页面上方。老早就想改掉一下,一部分page作为menu放在页面上方,一部分放在sidebar。

首先要替换掉header.php里显示menu的部分:

<?php wp_list_pages('sort_column=menu_order&depth=1&title_li='); ?>

替换为:

<?php
define("MENU_IDS","109,105,2"); //需要显示的文章的ID
$menu_ids = explode(',', MENU_IDS);
foreach ($menu_ids as $menu_id) {
	$menu_post = get_post($menu_id);
	echo '<li class="page_item"><a hre f="' . get_permalink($menu_post->ID) . '" title="' . $menu_post->post_title . '">' . $menu_post->post_title . '</a></li>' . "\n";
}
?>

之所以要用define定义常量,是因为这个东西在sidebar里还要用到,直接定义变量是不可以的,又懒得用全局变量了。sidebar里加上的代码是:

<?php /* Pages */ if (is_home()) { ?>
<div class="sb-pages">
<h2><?php _e('Pages','k2_domain'); ?></h2>
<ul>
<?php
$page_ids = array(222, 122, 205); //后面需要断行的文章的ID
$result = wp_list_pages('sort_column=menu_order&depth=1&exclude=' . MENU_IDS . '&echo=0&title_li=');
$result_a = explode("\n", $result);
foreach ($page_ids as $page_id) {
	$url = get_permalink($page_id);
	foreach ($result_a as $a => $b) {
		if (!(strpos($b, $url)===FALSE))
		$result_a[$a] = str_replace('</li>', '<div style="height:8px; margin:0;" /></li>', $result_a[$a]);
	}
}
echo implode("\n", $result_a);
?>
</ul>
</div>
<?php } ?>

Update:修正archive日期错误,应该使用其他变量比如$menu_post而不是$post。

Update2:今天开始用K2的SBM,新写了一个module来做这个事情。

Wikipedia之狂想

《南方都市报》2006.8.6 B08-B09版

Wikipedia之狂想

人人都可以成为百科全书的编者

维基百科(Wikipedia)是互联网上的开放式百科全书,它的口号是免费的百科全书,普通人都可以参与每个条目的编辑。今年3月,它的词条数目突破了100万,比《大英百科全书》还要丰富,据《自然》杂志统计,它的科学类条目的错误率与《大英百科全书》不相上下。在网络时代,一个开放的、互动的、大众编辑的百科全书,够权威吗?能够战胜专业的词典吗?

3月1日,网络互动百科全书维基百科(Wikipedia)迎来了第一百万个条目,它是“约旦山”,英国格拉斯哥市郊的一个火车站。它的作者Ewan MacDonald,深夜11时张贴了一行注解,随后的24个小时内,它被几十个人编辑了400多次(“约旦山”是英国第1029个最忙碌的车站,它的卖票柜台不再人满为患)。《大英百科全书》,两个世纪来被公认是参考书的黄金标准,在它最完整的版本中,也只收录了12万个条目。显然,传统的百科全书没有考虑到,人们想知道Sudoku、Capgras幻觉、波士顿糖灾、加拿大犀牛党、比尔·盖茨的房子、45分钟的盎格鲁-桑吉巴战争,或者冰岛的伊斯兰。维基百科介绍卡夫卡和西班牙战争有相当好的条目,同时它也提供美国海军的完整指南、费城起司排骨的定义、历史名猫的名单(名人宠物猫、百万富猫、第一只环航澳洲的母猫)、小说生造骂人词的统计、治疗打嗝的方法以及附有示意图介绍如何利用苏打罐制造火炉的文章。“如何做某事”的条目,百科全书18世纪以后不再收录。在1768-1771年的原版《大英百科全书》中,你可以找到治疗牙痛或制作雪鞋的方法(你同样也会吸收许多偏见和迷信。例如,“女人”的条目,只有区区6个字的注解:The female of man. See HOMO)。如果在维基百科上查找“做咖啡”,你会通过“卡布其诺(Espresso)”这个条目,找到一篇介绍各种Espresso咖啡机的文章,供你购买之前参考。网站还有一页是介绍“维基百科纠正的大英百科全书的错误”,包括斯大林的生日、安全剃刀的真正发明者等。

由于大小没有物理上的限制,维基百科可以立志做到无所不包。它也完全与潮流同步,例如,“美国偶像”决赛12名选手都有极其详尽的介绍;7月12日,真主党绑架两名以军士兵导致冲突爆发的6小时之后,“2006以黎冲突”这个条目初次上网,后来被编辑了4000多次。2001年创办的维基百科,目前已成为互联网上位列第17名的最受欢迎的网站,每天访问量超过了MSNBC.com、《泰晤士报》、《华尔街日报》网络版的总和。每四个月,访问者的数量就翻一番,每秒点击率高达1.4万人次。维基百科充当网络巨量信息的过滤器,可以这么说,Google应该感激它收拾整理网络社区。但是,这个搜索引擎也得还情:维基百科网页上包含了太多指向自己网站条目的链接,并且不时更新,它们的网页排名高得令人妒忌。

维基百科取得如此显赫的地位,但让人吃惊的是,它基本上没有领薪水的雇员,也没有什么收入。除了39岁的创办者吉米·威尔斯(Jimmy Wales)之外,网站仅有5名雇员,并且不在页面上做任何广告。2003年,维基百科成为一个非营利组织,它75万美元的预算大部分靠20美元左右的零星捐款解决。威尔斯说,他的任务是,“把免费的百科全书分发给地球上讲每一种语言的每一个人”,他成功得令人震惊。任何一个能上网的人,都可以创造维基百科新条目或是编辑已有的条目。维基百科拥有200种不同语言的网站和全球几十万名作者。威尔斯正身处知识收集革命的前线:他领导着志愿者大军,他们坚信,齐心协力可以创作出一部百科全书,质量上可以媲美专家编纂,规模上堪称史无前例。

维基百科这一在线社区,关注的不是昨晚的派对或者最新款的iPod,它致力于更高的善行。然而,像所有乌托邦项目一样,它对人类天性也不能免疫。琐碎、白痴和粗俗是网站常见的特征。脑力合作不能保证准确性,开放式编辑更招致滥用。美国参议员和众议员被逮到篡改自己的条目,维基百科几度禁止把所有众议员列入网站(把参议员罗伯特·贝尔德的年龄从88岁改为108岁不算狡猾,狡猾的是漂白投票记录以和不受欢迎的总统划清界限,或是删除未兑现的竞选承诺)。让人好奇的是,群众规则并没有导致大混乱。维基百科,最初是一个不受任何束缚的民主的实验,现在却制定了政策和程序。同时,网站也不可避免存在着种种错误。对于网站上出现的错误或偏见,维基百科人最喜欢用的借口是:瞧瞧那些主流媒体和传统百科全书,它们也经常犯错!维基百科现在只有五岁,某天,它可能会长大。

编纂百科全书的冲动,可以上溯到2000年前,它极少受国界限制。18世纪,把人类知识编成目录的冲动加剧了。18世纪70年代,德国人开始编纂242卷的经典之作《布罗克豪斯大百科全书》。此前几十年,莱比锡书商策德勒编纂《世界百科大全》,他的竞争对手害怕这部巨著令他们无生意可做,破坏著书未遂。

法国启蒙思想的先驱皮埃尔·培尔(Pierre Bayle),突发奇想要编写专门记录错误的百科全书。潜在的读者对此并不热心,于是他编写了《历史批判词典》(1696),几乎完全由脚注组成,对先前的学术见解多有批评。培尔教读者学会怀疑,《法国大百科全书》(1751-1780)的作者Diderot和Alembert深受其影响。他们35卷的巨著,轻视教堂和国家,推崇理性主义。相对迟钝的《大英百科全书》,是在英法竞争的情况下,基于盎格鲁-撒克森人的实用主义而产生的。

威尔斯拥有的第一套百科全书是《世界图书百科全书》是他的父母1969年从推销员手上买的,威尔斯回忆当年把“勘误”条裱糊到年度附页上的兴奋心情。威尔斯的母亲和祖母,在美国阿拉巴马州经营私立学校,他三岁就入读该校。他在Auburn大学拿到金融学学士学位,后来相继在阿拉巴马州大学和印第安那大学攻读同一专业的博士。1994年,他决定放弃写毕业论文,选择到芝加哥做期货交易。四年之后,他搬到圣地亚哥,利用积蓄创办了一个门户网站。它的受众大多是男性,色情内容(录像和博客)占了网站赢利的十分之一。与此同时,威尔斯也在思考,在他看来,误传、宣传和无知是世界问题的原因。威尔斯对我说:“我真是一个‘启蒙’型的人。”当年他的想法是,“互联网的许诺是所有人都拥有免费的知识,我们如何实现这一点?”

还在念大学的时候,他就阅读过弗·冯·哈耶克1945年的自由市场宣言——《知识在社会中的作用》,这本著作认为,一个人的知识是有偏见的,只有依靠群众的智慧才能发现真理。20世纪90年代,威尔斯再度想起这篇文章,同时他对开放源代码运动也有耳闻,一些程序员认为软件应该是免费的,任何人可以修改代码。给他留下最深刻印象的是运动发起人埃里克·雷蒙德的随笔《大教堂和百货店》,“它让我对群众合作的可能性大开眼界。”

第一步却走错了方向。2000年,威尔斯聘请了哲学系毕业生拉里·桑格尔(Larry Sanger),帮他创办名为Nupedia的在线百科全书。他的想法是,向学者约稿,再让稿件通过七个步骤的审核过程,随后免费在网上张贴。威尔斯亲自就Robert Merton和期货价格理论写稿,刚写了头两篇,他就想起自己从研究生院辍学的原因。“他们会拿走我的论文,交给两位金融教授审阅,我退出学术界已经几年了,这真是让人胆寒,简直像是家庭作业。”

一年之后,Nupedia仅有21个条目,还是“无调性”(指乐曲的构成没有一定的调性基础)和“希罗多德”这样的主题。2001年1月,拉里·桑格尔与一个朋友吃晚餐,得知了wiki的存在,它是一个可以让人们共同写作及编辑的简单软件。桑格尔认为,使用wiki可以为Nupedia吸引更多的作者(威尔斯说,使用wiki是自己的主意)。在他们采用的wiki模型下,每个条目都有历史页,保留所有的编辑记录。他们还增加了谈话页,以便讨论编辑过程。桑格尔取了维基百科的名字,2001年1月15日网站正式激活。两天之后,他向Nupedia网站通讯录上的2000人发去电子邮件,宣称:“维基百科来了!看我的薄面,花上5或10分钟,去那里添加一个条目。”

威尔斯准备迎接“彻底的垃圾”,他盘算,假如两人走运的话,wiki会为Nupedia带来一些粗糙的文稿。一个月后,维基百科有了600个条目,一年之后,有了两万个。

威尔斯喜欢引用查尔斯·范多伦(Charles Van Doren,《大英百科全书》编者之一)1962年的宣言。范多伦认为,传统的百科全书是死的,它是因为增长而增长,而不是因为构思。它牺牲了艺术性的综合,屈从于乏味的惯例。它看起来十分落伍。“因为世界激进地革新了,理想的百科全书也应该是激进的”,范多伦写道,“在政治上、哲学上、科学上,应当停止‘不求有功但求无过’。”

在西方的早期历史上,百科全书是危险的书。《法国大百科全书》对抗宗教机构和正统说法,让人的理性成为宇宙的中心,结果出版商被投入巴士底监狱。不过,与其说威尔斯是响应范多伦的号召,不如说是受更早的一个平民思想家的影响。19世纪30年代,科幻大师H.G.威尔斯哀叹道,世界正在加速变得更小,信息传播却落伍低效。他提出了“世界头脑”(World Brain)的概念,一个合作、分散、不断修订的知识库,他说:“我们今天需要亨利·福特式的人,以使知识传播现代化,让好的知识,在无知、未受良好教育、未享良好待遇的英语世界中,变得更为物美价廉。”威尔斯的最激进贡献未必是让信息免费,而是发明了一个系统,不认为博士一定比博览群书的15岁少年高明。威尔斯这样看待维基百科的作者:“对我来说,最重要的是把事实搞清楚,我才不在乎他是高中生还是哈佛教授。”在初期,网站没有正式的规则。后来桑格尔才贴出一套指导方针,头一条就是“甭理睬所有规则”,后面两条变成核心原则:条目必须立场中立,内容必须可以证实,并曾经出版过。禁止原创研究,砍掉了大批有关私人宠物的材料,当然还有其他许多内容。

假如说维基百科有具体的存在,那就是在佛罗里达圣彼得堡,那里有Wikimedia基金会的总部,维基百科是其下属机构,它相对不出名的姐妹项目包括Wikisource(免费的文本图书馆),Wikinews(时事网站)和Wikiquote。威尔斯已婚,有一个5岁的女儿。他说圣彼得堡的房价低,吸引他从洛杉矶搬来。3月份记者拜访他的办公室时,发现墙壁是光秃秃的,家具是破烂的,植物是死的,这间办公室像是研究生休闲室。

维基百科的真正工作,不是在佛罗里达进行,而是在全球成千上万的电脑屏幕上进行。也许维基百科的最伟大成就是,创造了一个社区,这出乎威尔斯的意料。维基百科人是匿名的,用网名编纂条目。他们中男性居多,威尔斯说可能占80%;热衷于社交,喜欢在网上交流。20岁的Arocoun,在网页上标明“爱好哲学”,收到其他用户的留言,有批评(“你说人必须在生活的所有方面独立自主,我有不同意见,考虑到社会的纠缠关系,独立只不过是理想化的观点。”),也有古怪的示好(“我是来自俄亥俄州的神经质画家,我想你认为自己的观点很激进,我也是激进分子,那么,我们应当成为朋友”)。

维基百科人拥有自己的语言,“revert”(恢复)一词是最常用的,比如“我恢复了原来的文字,但用户再度恢复。”还有WikiGnome(保持低调的用户,负责校订文字、错误语法和失效链接)、WikiTroll(固执地违反网站指导方针或者进行其他破坏活动)等词。此外有两极维基百科人,素食维基百科人,反素食维基百科人,存在主义维基百科人,亲卢森堡维基百科人和不喜欢被分类的维基百科人。据一个网页说,对维基百科的狂热折磨着“计算机程序员,大学生,研究生,比赛游戏参赛者,新闻瘾君子,失业者,即将失业者,总之是兴趣广泛、记性好的人。”

维基百科可能是世界上最有野心的虚荣媒体。在其英文网站上,有20万名注册用户,其中3300人,也就是不到2%的人做了70%的工作。网站允许你比较不同的作者,他们编辑条目的多寡、被社区投票评为“出色”的文章、每小时的活跃程度,都用图表标示出来。一个17岁的少年是沃德豪斯(1881-1975年,英国小说家和喜剧作家)的“粉丝”,专攻英国贵族,是这一领域的佼佼者,共编纂了58个条目。一名24岁的多伦多大学毕业生,是网站的第一大作者。2001年,他首次编纂了词条“巴拿马运河”之后,迄今一共写作及编辑了7.2万个条目。“维基百科全书狂”、“编辑狂”这两个词也在这个网站上出现,它们均链接到“强迫症”这个词条上。

Essjay是网站的固定用户之一,他拥有神学和教会法博士学位,参与了1.6万个条目的撰写或修改。Essjay是一所私立大学的宗教学教授,2005年2月第一次在网站上进行编辑。最初,他编写自己领域内的词条,后来他发展到每天在网站上浏览14个小时,他对自己的网络生活保密,不敢告诉同事和朋友。

逐渐地,Essjay发现自己在编写词条上花的时间越来越少,在改正差错、剔除淫秽内容上花的时间越来越多。5月份,他删掉了“贾斯汀·汀布莱克”条目中的一句话,这句话声称他2002年未付联邦税因而失去了他的房子。Essjay知道这是错误的。还有一些条目包含意识形态的分歧,会引起激烈的编辑之争。在英文维基百科上,许多争吵与以色列-巴勒斯坦的对立以及宗教问题有关。当然,在马其顿、但泽(波兰北部港口城市)、亚美尼亚大屠杀和亨利·福特这些词条上的争论同样激烈。种族争执很难平息:哥白尼是波兰人、德国人,还是普鲁士人?还有一些辩论可能永远没有定论:1812年的波罗地诺会战是俄国人的胜利,还是法国人的胜利?苹果派是地道的美国食品吗?(答案目前是否定的,“不是欧洲人传种的话,美国根本没有苹果树。”另外一个人附和说,“苹果派在荷兰也很流行,可不是从美国传入的。美国剽窃我们的圣尼古拉斯制造了圣诞老人,赶紧住手吧!”)谁能想到,“干酪”会是网站上争议最大的词条之一呢?争论的内容是,亚洲文化是否禁止食用它。在过去9个月,巴尔的摩的气候也是激烈辩论的主题,它1月份的平均温度有多高呢?

起先,威尔斯亲自出面处理群殴,但他不愿意封杀任何人。随着用户的猛增,编辑纠纷和故意破坏也多了起来。2001年10月,威尔斯任命了一小群管理员,负责管理网站避免滥用。管理员可以删除文章,或者保护文章不被改写,阻止用户编写,比普通用户更快速地恢复文本。目前管理员已多达1000人。2004年,威尔斯把3R原则正式定为站规(此前它只是指导方针),其中之一规定:24小时内三次恢复相同文本的用户将被禁止编写条目一天。一系列尖酸刻薄的口水战,最终导致了站规的诞生。

威尔斯也任命了一个仲裁委员会来解决纠纷。案子送抵仲裁委员会之前,通常先经过调停委员会。Essjay第二次出任调停委员会的主席,他还兼任管理员、官员和用户监督员,是有权追踪可疑I.P地址的14名网站成员之一。他经常带手提电脑上课,以便在学生考虑时为维基百科人服务,他还要关注20个聊天频道的内容,因为用户经常在那里闲聊看到的过激词句。

5个网络“机器人”检查网站上明显的破坏行为,搜索淫秽内容和集体删除的证据,并恢复消失的文本。更恶劣的犯规行为会由人来处理。Essjay最近逮到一个用户,用一个网名删除整个条目或者乱改句子,用另外一个网名再予以改正,这是为了提高他的编辑数量。他被网站永久性拒绝进入。还有一些用户威胁要报复管理员。Essjay说,他时常受到死亡威胁。“有些人把维基百科看得太重了”,他对我说。

维基百科已经成为一个管制的丛林,充斥着精心分级的用户和关于政策的政策。I.B.M公司的研究员Martin Wattenberg和Fernanda Viegas,使用“历史流量”的虚拟模型,发现与合作和管理有关的“谈话页”和“元页”增长速度最快,曾占80%网站内容的词条去年10月下降至70%。Wattenberg说:“人们谈论的是管理,而不是为网站内容努力。”威尔斯对规则和程序的看法十分矛盾,但认为它们是必不可少的。

尽管维基百科有着种种规则,这并不表示网站官僚就一定支持真相。2005年3月,剑桥大学气候学者威廉·康纳利沦为编辑之争的受害者,他编写的“全球变暖”条目引发了纠纷。一个批评者不停地对温室效应大泼冷水,在经过肮脏的口水战之后,本案被送到仲裁委员会。批评者在书面投诉中称:“用户威廉·康纳利系统性地删除所有与其理论相左的观点,强行推销自己的观点。他的气候学观点单一狭隘。”仲裁委员会3个月后公布了裁决,康纳利被丢脸地判以“一天仅限修改一次”。处罚后来被撤销,康纳利现在成了管理员,观察名单上足有2000个页面。他说,维基百科的“全球变暖”主题,可能是互联网上最棒的。威尔斯承认,在这件事上,网站的体系失败了。似乎是,在网站上花时间最多、叫嚣最凶的用户,是最后的赢家。

康纳利相信维基百科“没有给饱学之士特殊待遇”,许多学者和作者都赞同此说。拉里·桑格尔说,太多的维基百科人从根本上对专家抱怀疑态度,对自己又过分自负。2002年3月,在互联网泡沫破裂时期,威尔斯没有钱维持网站,桑格尔离开了。桑格尔说,在一个反权威的社区,他已经成为权威的象征,“维基百科从几近完美的无政府状态发展到由匪帮统治(gang rule)的无政府状态。”(他现在担任“数码宇宙在线基金”的负责人,正创办一个网络百科全书,它是维基百科与传统百科全书的混血儿,他承诺做到“错误率史上最低”。)“开放源代码运动”的领袖埃里克·雷蒙德也说:“用灾难一词形容维基百科并不为过。”在他看来,网站充斥着小肚鸡肠的人。他对科幻小说条目的修改,又被用户删除,仿佛他践踏了私人领地。“某些维基百科作者的行径,你看到的越多,越会感念《大英百科全书》的好处。”他认为,开放源代码模型不适用于百科全书,软件有一个客观的标准,要么能用要么不能用,但真相的标准没有这么简单。

管理员对网站加强监督,也未能阻止破坏者,其中多数人像是学生,在该做家庭作业的时间抽空在维基百科上添加淫秽或荒唐内容。许多人在教室里搞恶作剧,网站的滥用一般在星期五午后退潮,星期一一早恢复。结果是,有时整个学校和大学的I.P地址被阻止。“乔治·布什”的词条频繁遭到破坏,有时一分钟超过两次,它经常数天禁止编辑。在任何时候,都有几百个条目处于“半保护”状态,这意味着用户要登记I.P地址,再等上好几天,才能改写内容。它们中不但有“上帝”,“伽利略”和“戈尔”,更包括“狮子狗”、“橙子”和“肖邦”。

威尔斯对自己的条目也进行了清理,一年18次。他对网站上对色情交易的提法特别的敏感,他喜欢用的字眼是“成人内容”和“魅力摄影”,但一个用户指出,用这些词形容女同性恋3P并不确切,今年1月,他最终妥协使用“色情摄影”一词。威尔斯说:“人们不应该制作它,包括我在内,这是品位低劣。”

威尔斯最近开发了“勘漏”功能,部分管理员可以清除系统的文本,甚至历史页上也无迹可寻。威尔斯说,极少会用到这一举措,除非是清除诽谤或电话号码之类的私人内容。网站的长期作者杰森·史考特说,“在其他情形下,这是可以理解的权力,但对这个项目而言,它是完全冲突的。”

维基百科是准确的吗?去年,《自然》杂志刊登文章,比较维基百科和《大英百科全书》中的42个科学主题,维基百科每犯4个错误,《大英百科全书》就有3个错误。奇怪的是,这被视为“暴发户”的胜利。如此吹毛求疵毫无意义,因为没有绝对不出错的参考书。《大英百科全书》公开批驳《自然》的调查结果,并在《泰晤士报》上刊登半版广告,“《大英百科全书》从未自称完全没有错误,我们之所以享有盛望,不是因为难以做到的完美,而是因为扎实的学识,明智的判断,以及严格的编辑审查。”后来,《大英百科全书》总裁Jorge Cauz在写给我的电子邮件中说:“假如维基百科不增加编辑勘漏,它会成为不公正、不可靠、多数情况下不可读的条目的笨重平庸的集合体。”威尔斯表示,他会把《大英百科全书》当做竞争对手看待,“不过,我认为他们在5年内就会被迫消失。”

拉里·桑格尔指出,有用的知识与可靠的知识有所不同,毫无疑问,在规模、效率和易接近性上,维基百科击败了所有的对手。这是优点,也是缺点。Jorge Cauz对“足够好的知识”不屑一顾,他指出没有办法辨别哪些事实或哪些条目可以相信。《大英百科全书》的退休编者罗伯特·麦克亨利说:“我们得到错误答案的速度,比父母找到一只铅笔还要快。”

问题部分要归咎于信息出处。维基百科的绝大多数内容不是来自书本,而是来自网络,从突发新闻、谣言到未曾登陆月球的证据无奇不有。威尔斯在公开演讲中,提到了以Google为检测标准:“假如Google上找不到的话,它就不存在。”在维基百科上,奥古斯汀的条目比小甜甜布兰妮的短得多,而关于尼采的文章则被不断修改,产生了5页谈话页。但讨论主要围绕尼采的政治观点展开,总体来看,这一条目比《大英百科全书》中的同类条目逊色很多。

维基百科是一个仍在创造中的粗笨作品。有的条目像是小学生所写:既不简洁也不明了,事实可能是确凿的,然而连接事实的部分不是缺乏就是缺席,引语经常是乱蒙一通。I.B.M的研究员指出,维基百科的编辑绝大多数是删除或增添,极少会调整段落或者从整体上重组条目,他们认为,维基百科只能容纳25行文字的编辑窗口难辞其咎。阅读文章的零星段落,是很难对它进行修改的,此外,维基百科人热衷于积累编辑次数,简单的修改当然比复杂的编辑更受推崇。此外,“领头羊效应”也出现在网站上,一个条目的第一作者,虽然通常不是饱学之士,却为文章定下基调。

一套百科全书,有时正确,有时错误,有时文盲,我们何言以对?我向哈佛哲学家Hilary Putnam展示维基百科关于他的条目,他吃惊地发现它可以媲美《斯坦福哲学百科全书》中的内容。当了解到维基百科的运作方式之后,他更是目瞪口呆。他说:“显然,这出自专家之手。”19世纪60年代,小威廉·巴克利曾说,“我宁愿生活在被波士顿电话簿上前两千人统治的社会,也不愿意生活在被哈佛2000名教员统治的社会”。有了维基百科,他可能最终实现梦想。不过,巴克利可能会说,他宁愿让2000个匿名作者进行统治,百科全书还是留给专家编写吧。

5月初,在共进早餐时,我问《大英百科全书》总裁Jorge Cauz,《大英百科全书》和维基百科可以做何类比。第二天,他发电邮告诉我:“维基百科与《大英百科全书》的区别,犹如‘美国偶像’对朱丽亚音乐学院。”几天之后,威尔斯用了音乐的隐喻:“维基百科之于《大英百科全书》,犹如摇滚乐对轻音乐。尽管它没有那么圆滑,令家长震惊,但它最终会学聪明的。”

维基百科是辞条和参考书目的组合。现在的人不但对权威不耐烦,更想开口反驳。维基百科为自我表现提供了无止境的机会。它是读书团体和聊天室的私生子,是亚马孙网站书评者的第二家园。历史上并非没有先例,百科全书的作者从精英阶层那里夺取控制,对一些看似可靠的事实提出质疑。吉米·威尔斯或许是,或许不是新的亨利·福特,然而,他却引导我们前行。我们走在开放的道路上,既没有领袖也没有时间表。我们可以随心所欲走自己的路,同样也会光荣地迷失。这是你的真相,还是我的真相?

译:玲珑
yskin于2006年10月5日录入


这篇文章的英文原文的地址是《Can Wikipedia conquer expertise?》,来自纽约客网站。文章写的很不错,翻译上也还行,只不过可能是译者并不太懂计算机方面的知识,也没去过中文维基百科,还有些语句翻译的很不通顺,具体的就是“亚马逊”翻译成“亚马孙”,维基百科的“讨论页”翻译成“谈话页”等等。还有很多标点符号的问题,经常有一长段语句全是逗号。这些错误我都没给他改过来,只是把原文原样录入了。您可以把这篇文章作为一篇小品文,在闲暇的时候看一看,如果要做深入的研究的话,还是看英文原文比较好。

文章中提到了Wikipedia的破坏问题以及人的天性,喜好荣誉,还有现在很多人的轻视权威,盲目认为权威人士说的话必然是错的的问题。我觉得Wikipedia里还有交流的问题。英文维基百科我不了解,中文维基里,经常有人把某一个条目的内容全部删除,然后把英文维基百科中该条目的内容翻译过来,填入其中。我承认这些人也满热心的,翻译那么一大段内容也着实不易。问题是,中国不缺懂英文的人。哪个人不是从小学,初中就开始接触英语?再配上一个金山词霸,谁都能做翻译。可是这些人,以为就他们懂英语,根本不了解这个条目本身的知识,翻译过来的文字乱七八糟。我也承认英文Wikipedia里条目写的内容都比较全,但是把英文条目copy过来,清除由中国人所写的全部内容就正确了吗?以前条目里的内容就完全没有价值吗?我记忆最深的是中文Wikipedia里"MD5"这个条目,那是翻译的前言不搭后语,乱七八糟,编者根本不了解MD5的具体含义,就知道清空了这个条目的全部内容,把英文Wiki里的"MD5"条目全部copy过来,再每天利用业余时间一点一点翻译。我看他连最基本的“MD5是信息摘要算法而非加密算法”都没弄清楚。再有,foobar2000这个条目,我和其他一些人已经写了很多内容在里面,又是被人直接清空,替换上从英文条目翻译过来的文本。维基百科是个群众协作编写百科全书的项目,在大家的协作中,起码要做到尊重他人的劳动成果,如果别人写错了,你可以删除某一句话,如果没有错误,还是尊重一点人家的劳动,不要去动他好不好。

解决图片撑破页面的问题

我的Blog的文章正文部分宽度只有500px,如果文章里加了一幅宽度超过500px的图片,无论是IE还是Firefox下都会出现撑破页面的情况。

2006年6月5日,我在调整Blog的CSS。因为K2模版是老外做的,很多地方显示的并不好看,于是找了个CSS中文手册,边学边调。K2默认的CSS里,文章内容内的图片的CSS中有一项"max-width: 100%;",查了一下,说是限制对象的最大宽度。于是就在自己的CSS里把max-width这一项设置为500px,在Firefox里测试成功。

今天上网看到shura留言,赶紧到IE里测试了一下,果然页面被撑破了。再上网一查,原来Firefox和Opera都支持max-width,但是IE不支持。google max-width IE,发现有一篇很好的介绍如何在不支持max-width的IE里实现相同效果的文章《max-width in Internet Explorer》,详细说明了用IE提供的expression命令执行Javascript代码来实现max-width效果的方法。还有2003年11月的一篇讨论组文章max-width in I.E.,里面有用expression的两段代码,都可以实现max-width效果。

看看我的代码吧:

#primary .itemtext img {
    max-width: 500px;
    width: expression(this.width > 500 ? "500px" : this.width);
}

Update:好像在IE里,第一次进的时候显示会不正常,F5刷新一次就好了。Windows 2000+IE 6.0 SP1。

Update2:前几天换了True Blue style,文章部分的宽度由500px变成了545px,再加上K2更新换了class名,所以又仔细看了下代码,做了一点修改,如下:

#primary .entry-content img {
    max-width: 545px;
    width: expression( this.width > 545 ? "545px" : (this.width+"px") );
}

换用True Blue style以后,在IE下第一次打开页面时图片会显示不正常的问题已经不再出现了。重新换回原来的style测试了一下,具体的现象是一些大的图片会变小,而一些小的图片比如,本来是10px*10px的,现在会显示的很大,用IE看属性,大小是28px*28px。具体的原因我也不知道,10个多少单位等于28px呢?10pt吗?我这次在后面加上"px"两个字符,应该能解决问题吧。

另外就是IE和Firefox都有的放大缩小图片的算法不好的问题。比如我使用的flickr,如果直接在页面上放上1024*768原始大小的图片,经过缩小后显示成宽度为545px的图片,非常不清晰,字都看不清,而使用flickr提供的500px的图片则效果不错。用过PS的人都知道,图片缩放时可以选择多个缩放算法,flickr专门做在线图象存储,算法应该不错,而浏览器的算法可能是怕影响显示速度而使用了比较差的算法。所以,能使用小图片的还是尽量用小图片,max-width只是个权宜之计。

还有Firefox下如果直接copy了flickr提供的显示图片的html代码,img标签里已经设置好了width和height属性,经过max-width后,width缩小成545px了,但是height不会自动缩放,这个问题也要引起注意。

解决了DNS解析的问题

前几天域名的NS服务器更换IP,换完后我用nslookup查看了一下,ns1可以解析到IP,ns2解析不到。

在深圳电信和四川电信的DNS服务器上不断地查我的域名,大概有1/3的时候解析不到IP。set q=ns后再查,发现每次返回的ns服务器顺序并不一样,有时ns1在前,有时ns2在前。

一般网上的说法是,ns1是主DNS服务器,ns2是副DNS服务器,刚才咨询了域名提供商的客服也是得到这个答案。但是现在我觉得,DNS服务器并非安装顺序查询的。DNS服务器在接到解析请求的时候,缓存里找不到时,就去查这个域名的ns服务器,然后在这些ns服务器里,随便挑一个出来连接过去查询。象www.google.com,www.yahoo.com这些域名,一般都有五六个ns记录,如果每次都去第一个ns记录查学,那ns1也太可怜了!

上网查了下DNS服务器的工作原理。在微软网站找到一篇《DNS 查询的工作原理》,详细讲述了DNS查询的过程。浏览器拿URL去本机DNS缓存和hosts文件里查,查不到送第一个DNS服务器。DNS服务器先查自身区域(也就是说如果当前DNS服务器是该域名的ns服务器的话直接返回),然后是缓存,再查不到进入递归过程。具体过程如下图所示:(盗链自微软网站)
完整的 DNS 查询进程概况

接下来是递归查询的过程,如图所示(同样盗链自微软网站)。所谓递归查询,并不是说一级一级网上查询,比如深圳的DNS向上问广东的,广东的问全国的。图片里查询的是example.microsoft.com,DNS服务器进行递归查询,首先是先问那个点".",就是".com"的点,点"."说我不知道,不过我知道"com"的名称服务器,给你。拿到"com"的名称服务器,连接过去问,你有没有"example.microsoft.com"的IP?"com"说我没,不过我有"microsoft.com"的名称服务器,给你。再连接"microsoft.com"的名称服务器,询问"example.microsoft.com"的IP,得到"example.microsoft.com"的名称服务器。再连接"example.microsoft.com"的名称服务器,得到"example.microsoft.com"的IP。然后该DNS服务器赶紧给这边的客户——浏览器返回"example.microsoft.com"的IP地址,顺便问一句:“你等急了吧?”这就叫递归查询。
DNS 递归查询过程

英文wiki中的DNS条目有一幅图片,也满直观的,附在下面,如果你看不到,那么你一定不知道什么是自动配置脚本,什么是foxproxy插件吧,嘻嘻。
A DNS recurser consults three nameservers to resolve the address www.wikipedia.org.

另外可以参考一下《Solaris - dns名称解析过程》《知道如何区分DNS查询类型》

综上所述,一个域名的NS记录就是存放在上级域名中用来记录该域名的DNS服务器的。然后每个NS记录都要保证能解析到IP。现在很多公司的ns1和ns2分别连电信和网通的线,为了确保能解析到IP,我觉得这没什么用处,电信和网通的DNS服务器之间的连接还算通畅。如果一个ns服务器连接不上倒没关系,如果连接的上却解析不到IP就麻烦了,DNS服务器不会去重试另外一个ns服务器,而是直接返回没有IP。我的域名已经搞好了,管理员帮我把域名解析到新网的DNS服务器ns.xinnet.cn上,这下速度嗖嗖的。前几天在FeedBurner上修改设置,改完一项点save的时候,FB都会说“貌似你的domain不存在”,而且每天都会收到FeedBurner的报告,说找不到yskin.net。以后应该不会再有这种问题了。

FeedBurner被封?

今天早上开始,FeedBurner就一直不能访问,GreatNews里红了一片。看keso的文章《FeedBurner被封?》,说是电信用户都不能访问了。再看williamlong的文章《FeedBurner挂了》,唉!

今天这么不爽,FeedBurner被封,365key暂停服务24小时,空间断了20分钟,好了以后执行时间很短,但是网络速度很慢,还有域名的第二个ns服务器解析不到IP。真是郁闷的一天。

熬啊熬,晚上11点半了,准备要走了,随手刷新了一下FeedBurner,居然可以访问了,速度还很快哩。williamlong说希望不要象上次Technorati一样垂死挣扎一下。唉,如果最终封掉了,没办法,我就开始骂吧。

Update:今天,FeedBurner一直可以访问。很好,很好,希望能一直维持下去。

Wordpress 2.0.4

刚把Blog升级到WordPress 2.0.4。

7月29日,WordPress 2.0.4 发布。光顾着升级WordPress 中文包,再加上这两天FTP速度不行,ping值上1000ms,所以拖到现在才升级。

网上流传着很多五步升级WordPress的文章,基本都是翻译自WordPress 官方文档:WordPress Codex:Upgrading WordPress。而现在,这篇文档更新了从2.0.3升级到2.0.4的说明部分:Upgrade 2.0.3 to 2.0.4,总共9步。其实也不用那么麻烦,WordPress安装包里不包含wp-config.php,.htaccess等文件,不用担心被覆盖掉。我又没有用WordPress自带的模版,也没有修改WordPress自带的那三个插件,所以直接上传WordPress 2.0.4安装包里的所有文件,再把wp-db.php修改一下,上传覆盖。这次更新没有变更数据库的结构,所以进后台没有弹出要求确认升级数据库的页面,自然也无需自行去wp-admin/upgrade.php页面升级了。

前段时间WordPress被曝出有很严重的bug,参见我的文章:《好像Wordpress又有一个bug被发现了》。在这个时候发布2.0.4,恐怕也是想尽快修正这个bug,以避免更大范围的损失。我查看了一遍在2.0.4中被修正的bug的列表,并没有提到这个bug。比较了一下WordPress 2.0.3和2.0.4的文件,wp-admin/admin.php中增加了一条:if ( ! current_user_can('import') ) wp_die(__('You are not allowed to import.'));;wp-admin/admin-db.php中修正了默认分类不是ID为1的分类的问题,加入了current_user_can('edit_users'))的判断,还将plugin的相关信息全都trim了一下。

这次更新没加新功能,只是修正几个bug而已,所以升级后没什么感觉。明天我再来找一下Spam Karma 2的作者所说的bug具体是什么。Matt在WordPress 2.0.4的发布通知里说:"This release contains several important security fixes, so it’s highly recommended for all users."哼哼,也不说清楚具体是什么bug。Matt还说:"WordPress 2.0.4, the latest stable release in our Duke series."Duke是2.0系列的代号。这说明我们不会再有WordPress 2.0.5版了,已经搞了半年的WordPress 2.1终于要出正式版了。

Update:可怜的WordPress 2.0.3的bug,唉!

今天晚上想测试一下,就在我的服务器上新装了个WordPress 2.0.3的测试Blog。安装完后,为了避免cookies的影响,切出FF,换用IE进到测试Blog的主页。注册->到邮箱收密码->登陆。然后导入,刷新首页,成功。我汗...

拿朋友的Blog做了下测试,没有其他Blog的数据库,就想找个RSS 2.0。直接down了我在FeedBurner烧录的feed,用UE修改了下,只保留第一篇文章。点导入,于是就成了这样:
WordPress 2.0.3 bug

一点问题都没有,FeedBurner烧录时加上的评论数的图片也在,汗。没升级到WordPress 2.0.4的赶紧升级,开着允许用户注册的赶紧关了,已经有人注册了的赶紧删除,事态严重啊!

Wordpress的控制板载入慢的问题

Wordpress后台的第一项——控制板的载入速度一向很慢,一般都需要10s到20s才能显示出来。我不经常进这个页面,每次都是直接进http://yskin.net/wp-admin/edit.php,由于以前登陆时选过记住登陆信息,所以不用输密码直接就进后台了。控制板这个页面中显示最新文章,最新评论以及Blog统计,这些代码执行时间恐怕只有零点几秒,关键是用fetch_rss()函数读取了3个RSS,分别是Technorati网站记录的连入本站的链接,Wordpress开发日志和其他Wordpress新闻。又由于前段时间,Technorati在中国被封锁了,导致读取Technorati网站的那个RSS会超时读不出,这样页面执行时间就更长了。

相关代码保存在wp-admin/index.php文件中,只要找出3个调用fetch_rss()函数的地方,注释掉相关代码就可以了。Wordpress开发日志的RSS必须留着,以便及时知道Wordpress新版本的情况。其他Wordpress新闻就没什么用了,反正都是英文的,直接注释掉相关的代码段,或者直接把$rss = @fetch_rss('http://planet.wordpress.org/feed/');改成$rss = 0;

而Technorati连入链接嘛,当然也可以直接注释掉,要看的时候自己开TOR去Technorati网站看嘛。不过我想通过CGI代理服务器来尝试解决一下。刚才上网找了一个CGI Proxy List,在里面找到一个:hidemyinfo.info。进入这个网站,把完整的地址(我的是http://feeds.technorati.com/cosmos/rss/?url=http://yskin.net)填入Website URL一栏,下面的选项只有Base64选中,点"Hide My Info",得到新的地址。把$rss = @fetch_rss('http://feeds.technorati.com...那一句替换成$rss = @fetch_rss('××');,其中××为得到的新地址。上传index.php后,刷新控制板。好像要刷新几次,我大概等了5分钟就看到了新的连入链接了。由于这个新地址里用base64编码过原始URL,所以应该不会被封住。

唉,什么时候Technorati能够解封呢。

Update:把这个feed扔进抓虾了。反正我又不经常进控制板,反而抓虾倒是经常看。放到抓虾里还可以知道哪些是新的,哪些是看过的,比起放在控制板方便多了。因为抓虾的服务器是在国内的,所以要用CGI代理服务器生成的地址。当然,如果用GreatNews的话,也一样要受GFW的影响。不过Bloglines用户就不用担心了,直接放上Technorati本身的地址就可以了。这下看feed的时候就可以随时知道自己的Blog有没有外部链接了。WordPress开发日志的RSS也可以放进抓虾,还有看最新留言也不用装显示最新留言的插件了,直接把Blog的comment feed订一下,在RSS阅读器里就可以及时的看到最新留言,而且也不怕错过某条留言。