使用字母文字的人真是幸福,他们无缝地进入了计算机时代,而汉字文化圈(包括中日韩在内)的人就没那么好运气,中文输入的研发一直没有中断,但自从拼音输入法被刚刚发明出来之后,一直也没有取得更重大的突破。【全文字阅读】即使是拼音输入法,现在的词语排序也相当的不科学,唐宁自己打字的时候都感觉很不爽,他决定做点什么。
为了取得科学的数据,就应该对中文词语在各种出版物中出现的频率进行统计,最好是根据出版物的种类划分出不同的领域,当用户在输入时,输入某个特定的词就会触发某学科的词库优先级提高,比如提到“蛋白质”时,触发生物学的词库,提到“动量”时触发物理学词库,提到“约翰”时触发外国人名词库,等等。
而为了开发出自动计算词语频率的程序,就必须先开发出中文分词的程序,为此,唐宁让开发小组先开发了一个“分词竞赛程序”,向参赛者提供从大清新闻报里某篇文章中随机提取出来的一个句子,让参赛者把句子分拆成一个个的词语。所有的参赛者都必须是在中文方面拥有比较高的造诣的人,最后统计他们所拆句子谁最接近最多人的选择,那种拆分方法很可能就是最佳拆法,此人胜出,有奖。
这个方法很有趣,被选定为中文高手的参赛者玩得很开心,一不小心还能得到小奖品。为了将这个游戏扩展到更大的人群中,唐宁向中国的大学捐赠一千台,要求校方制定每个师生都有机会接触到这个时代最先进的产品,而每个用户注册时都来玩十分钟拆词游戏,所以的“游戏”数据都会被统计,所有的师生都有机会得到奖品,最高奖项是赠送机十年使用权,次奖依次降低,9、8、7……最后还有11个月、10个月……反正奖品全部是使用权,既是奖励机制,又是普及的好方法。
岩琦弥太郎知道唐宁的这个计划之后,知道自己该干点什么了,他向日本的大学捐赠了500台,同样想用这种方案来为日本人开发出优秀的输入法。唐宁不懂日语,又不好意思驳贝加尔俱乐部成员弥太的面子,只好请自己的高徒法拉第小姐出山主持日语输入法的开发,后来,林菲尔连韩文输入法的大旗也接过来了,并且她觉得所有成年人的语言能力都不弱,可以在她的网吧帝国里开展这个有趣又有建设性的竞赛活动。
朝鲜的局势仍然是半岛被大清与大日本分割,时有暴力事件发生,不过,林菲尔可以先在与朝鲜接壤的朝鲜语流行地区实验她的想法,因此增加了在盛京和吉林的计算机公馆份额。
林菲尔甚至脑洞大开,终于想到自己应该做一个什么样的网站博彩网。她把分词游戏变成了一个博彩项目,成为一个充满文人气息的商业模式,深受学生们、年轻人们的欢迎。
即可以帮助自己的母语发展输入法,又有机会中奖,跟“既收嫖资又立牌坊”有一拼,哪能不火呢?而且林菲尔深收师傅的影响,慈善只有跟商业模式结合才能持久,所以她发展了这个史无前例的博彩项目,并声称项目所有的运营费用由她来捐赠,而彩友们真金白银拿钱出来的参赛费收入除了缴纳税收之外100%将用于奖励。
而此时,李鸿章大人终于做了一件好事,他请林老板将这个项目的公司在北京注册,大清国政府将对这个项目免税。经此一事,总理府跟温莎共济会的关系终于转暖。
这个项目所有人都欢迎,从慈禧太后到曾国藩、郭嵩涛、恭亲王、胡雪岩,几乎没有任何一个不和谐的声音,简直是又一个史无前例,大清国一片普天同庆的格局。上面提到的这些人甚至都亲自去买彩票“参赛”了。第一个赛季结束,曾国藩居然还获得了不错的奖,一年的使用权,这比花钱去买还让人高兴。而慈禧太后那错别字连篇的水平肯定只有名落孙山的份儿。
根据每个国家的不同,首页的网站推荐会有不同,这个时候,博彩网光荣地被列在推荐之列,这是屈指可数的光荣。而club中的分词社团也成为官方的大社团,每天有很多彩民在上面讨论拿不准的句子。用博彩来持续“招新”的策略真是取得了巨大的成功。
唐宁对小师妹的工作简直太满意了,光是用这个神主意来统计词频显然大材小用,可以继续扩展,下一个竞赛项目是近义词和反义词大赛。他向网民们解释,这种大赛的数据将会帮助计算机程序慢慢地理解语言的含义,将来可用于智能查找,普通的程序不可能理解近义词而只能理解完全一模一样的词,降低了百科全书和论文等资料的可用性。因此,词义理解工程是提高资料查找效率的利器。
显然,这项大赛可以扩展至全球的语言,博彩网可以在全球范围内大出风头了,而林老板聪明地秉持着纯公益性的出发点,将博彩网建成了全球访问量最大的网站之一。
在大清,博彩网的应用更是绝让人想不到,它还发布了房产博彩项目,起因是为山西清华大学建立校园,因为这将是大清最著名的私立大学,由神级科学家唐老板发起的当然不可能低调。清华大学最后选址在平遥城不远的黄土高原上,原来是一块人口比较少的贫瘠之地,可是从天空上看上去它的黄土路美得令人窒息,这打动了唐老板,决定在这九曲十八弯的黄土的腹地建造浪漫主义大学校园。
山西省政府把大片的无人耕种的黄土出让给清华大学,象征性地占大学1%的股份,反正这土地也无用,万一以后清华大学大火了他们算是大赚了。法拉第电力公司为清华大学建造全球第一个“三一资源中心”。所谓的三一并不是宗教意义上的圣父、圣子、圣神三位一体,而是三种发电技术合而为一。