今天试用了一下2006年6月18日新出的紫光华宇拼音输入法V5和拼音加加4.0b正式版,以研究一下哪种输入法更好一些,以便换掉我现在正在用的紫光华宇拼音输入法4.0m3。
以前一直用着紫光拼音输入法,从最早的2001年11月的2.3版到2003年4月的3.0版。而后是2005年7月发布的所谓的紫光华宇拼音4.0m3 增强版 Build 2,这个版本的主页在这里,本身也是很好用的,只是并非紫光华宇公司开发的,作者也在页面上写明了“我在网上下载到了内部测试的泄漏版并制作成了增强版。”2006年6月18日,紫光华宇公司推出新版,增加了一些新功能,并被命名为V5版,以免和所谓的4.0版混淆。紫光主页的成长历程页面详细的介绍了紫光的更新历程。
这次新出的紫光V5版,感觉上没增加太多功能。官方的说明里提到的有:
- 新的字、词调整算法和智能组词算法。这个暂时没法感觉到,要试用一段时间后才能有一些认识。
- 新的设置工具和词库管理工具。词库管理工具做成了单独的程序,程序运行后可以看到词库路径,词库大小,估计的词的个数。功能还是原先的几个,从文本中导入自造词的功能有了较大改动,现在可以自行设定汉字串的拼音和词频,并在导入的时候先进行检查,错误的地方会以###3个井号指出,不像以前那样只是告知最后的结果,成功几个失败几个。这里要提一下的是合并词库的功能,既支持导出的备份文件格式UWL,也支持DAT格式。只要将以前词库文件usrwl.dat备份下来就可以到这里合并,对于我的4.0版的词库支持的也很好。刚安装好的时候,
- 可以通过复制和粘贴快速添加自造词。这句说的是状态条里增加的添加自造词功能,可以直接输入2-9个汉字,如果需要的话再修改一下下面自动生成的拼音,按下确定就可以导入词库,并可以立即使用这个词。这个功能是很实用的,我们很多时候想不起一个词的写法,比如我现在想输入“张韶涵”,这些港台明星的名字老是会用一些很偏的词,让人想不起来具体是哪个字。这个时候可以到Google或者百度去,输入词语的全拼"zhangshaohan",搜索引擎会给出推荐词语,看着顺眼的那个就是了,复制下来,用添加自造词功能添加到紫光中,立刻就可以在输入中使用了。如果还是分不清,那么就开始搜索引擎选举吧,把每个结果点开,看看哪个搜索到的结果多。这个方法我以前也有用,不过那时必须把得到的词放进一个文本文件中,然后导入,再切换一遍输入法才可以使用,现在则方便多了。我想,紫光的开发者增加这一项功能就是为了方便导入。以后上网的时候遇到新词,可以直接加到词库里,以后输入就不用费事组词了。
- 偏旁部首检字功能。这个功能不错,弥补了拼音输入法的不足——不认识的字就打不出。以前有不认识的字,或者记不得具体写法的字,首先的办法是想一个包含这个字的词,打出这个词来就可以得到这个字了,如果是两字词三字词,还可以用以词定字的功能直接上字。这个办法要是行不通,那只有去一个一个的试拼音,或者去找会五笔的人帮忙打出来,再或者去翻翻新华字典。现在有这个偏旁部首检字功能,等于是一部随身携带的字典,需要的时候,只要在状态条上点出,按照偏旁部首检索一下,就可以得到这个字的所有读音,内码值和所属的字符集(GB2312或GBK)。当然,他不能检出字的具体意思,所以也算不上字典,不过我们现在已经把这个字输入了电脑,那么拿这个字到金山词霸在线搜索查一下,就可以得到这个字的更多信息了。另外,这个功能没有集成查询功能,如果想知道某一个汉字是在GB2312字符集中还是在GBK字符集中,可以到金山词霸在线查一下,可以得到这个字的GBK编码,比如“後”字GBK:E1E1。再根据GBK:B0A1-F7FE编码范围对应GB2312的6763个汉字,可以知道“後”字在GB2312字符集中。
- 新的简繁体输入机制,提高繁体字词输入的准确性。这个简繁体以前就有,我一直都没有用过。因为切换到繁体状态就可以直接用拼音打繁体字,所以有N多无聊的人拿这个功能来打繁体字。我记得以前一些台湾人声称简体字破坏了汉字结构,号召重新用回“正体字”时说过,当年在简化汉字的时候把一些不同的汉字给简化成了同一个汉字,从而造成语义不清。在这个问题上一些人觉得,反正现在汉字中的多义字也不少,增加几个也无所谓 /lh怎么感觉我在写wiki,要阐述各方观点,不偏袒任何一方。话头转回来,由于这种情况的存在——繁体中A和B是两个字,都对应简体中的一个字B,而紫光的繁体功能可没那么智能,一个输入法而已怎么会识别语义,他只能将所有的B转化为A,从而造成繁化的错误。另外,简体字和繁体字还有词汇上的不同,比如大陆叫“软件”,台湾叫“軟體”,这些也是繁化的时候要注意的。当然,这帮家伙不过是吃饱了撑的没事干,他们打这些所谓的繁体字出来不过是为了显摆,显得他多么有本事一样,最终的结果就是这些“繁体字”,台湾人看不懂,大陆人也看不懂。最终用来交流的文字变成了显摆的工具,发帖子是为了让别人看的变成发帖子是为了让人看不懂的。这种情况在QQ的签名里尤甚,稍微比较一下就知道,MSN上大家的签名都是反应自己当前的状态或是所关心的事,QQ上大家的签名几乎都是显摆用的颜文字,还有用来存放小说或者听歌网站的地址。(找到方舟子写的《汉字简化杂谈》,大概写于10多年前,里面讲了很多简化字的知识。)
转回来,这个繁简体功能除了词以外,还有区分繁简体字的功能。好像这个功能是由软件开发团队自行区分的,将一些字归于简体字中,一些字归于繁体字中,还有一些没归类的,两种方式都可以打出。这个做法是为了降低重码率,打简体的时候就显示简体字,打繁体的时候就显示繁体字,重码率基本上是降了一半。但是如何区分一个字是简体字还是繁体字呢?开发团队自行进行了区分,却导致了一些人的不方便。比如这里,人家的人名用了芃字[peng],打字时必须切换到繁体状态下才能打出,这还好解决,把你的人名做成词组就是了。麻烦的是这里,一些广东人在简体状态下打不出他们的粤语所需要的冇字[mao]和孖字[ma]。每个地方都有方言,和老乡聊天自然会用方言。普通话是以北京语音为标准音,以北方方言为基础方言的。北方各地,乃至包括四川,重庆等地,即使有打不出的方言文字,也可以用拼音拼出来。而粤语自成一体,句末又经常有语气助词,很多字普通话的拼音根本拼不出。粤语的文字没有一个普遍的规定,文字基本是学香港的。香港还好,反正用的繁体字,广东就不行了,平常用的简体字,打粤语的时候又是用的从香港传来的繁体粤语文字,这矛盾就来了。象“冇”,“咩”这样的字,对于普通话来说是非常用字,对于粤语就是很常用的字了。这个事比较特殊,好在开发团队在这里提出了解决方案:“要为广大的粤语用户,单独开发一个语言包。” - 通过对DirectX中文输入接口的支持,可以使中文游戏软件在全屏模式下支持中文输入。这项改进使得紫光可以工作在一些全屏游戏中,解决了以前一些游戏中只能使用智能ABC输入法的问题。在紫光论坛的《关于V5的常见问题解答》里提到,“在玩游戏时状态条闪的问题。答复:微软公布的接口不明确。输入法是按照DirectX9的中文输入法接口要求实现的,对游戏可能无法全部兼容。”还是微软接口的原因,可能无法和所有游戏兼容。
- 全新的界面,可定制的状态条按钮。新界面确实不错,还支持透明,在win2000下透明也正常。可定制的状态条按钮,可以把简繁切换等按钮置于状态条上,满方便的。
- 再次重新改写的输入法接口和加载机制,增强和Windows系统的兼容性。增加对中文软件、英文软件等多方面的接口响应机制,提高对不同软件的兼容性。我比较关心古老的紫光和Firefox不兼容的问题,这个问题在我以前的一篇文章里有提到。看到这篇文章和这篇文章里提到,紫光在Firefox下实现了鼠标光标跟随(示例),数字重复的问题解决了,不过输入英文冒号还是有问题。Firefox方面已经解决了,等Firefox 1.5.0.5版发布吧。Update:2006年7月27日中午12点,也就是半个小时前,Firefox弹出了升级提示:Firefox 1.5.0.5发布了。赶紧升了级,一检查User-Agent:Mozilla/5.0 (Windows; U; Windows NT 5.0; zh-CN; rv:1.8.0.5) Gecko/20060719 Firefox/1.5.0.5,Gecko的版本已经升到1.8.0.5了。到现在,紫光和Firefox的兼容问题由于双方都及时做出了修正而宣告圆满解决了。
- 用户词库信息与以前版本完全保持兼容。这一项,怎么说呢,保持兼容所以可以直接导入旧词库,不过完全兼容,是否又没有新东西呢。词库导入的部分现在支持拼音和词频了,词库还兼容,好奇怪,说明以前词库就支持拼音?
sogou的词库少而精,是个好典范。
为了你最后一句话,支持一下,写了这么多,都可以进教科书了。
支持支持~~辛苦拉~~可是还是不明白呀~~我有点笨~你得说的简单易懂点才好~~吼吼~~不管怎么说也辛苦你了哈!!!
怎么打繁体字,我不会,谁能教教我
各位好啊,我是平安保險公司的丁訪華,很高興認識各位,如果各位要了解保險的給我電話,13559443002