http://www.51yam.com.cn/redirect.php?tid=27478&goto=lastpost
中文在构词,文字上有较大优势。作为表意文字的汉语,由于可以自由组合新名词新概念以至新思想,可以容纳信息和知识爆炸的冲击。中国的物理学专家可以凭借他在中学时代的化学基础知识通读化学专家的论文,反之依然,而英美的不同行业的专家要交流他们的学术成果,则是对牛弹琴。
人的一生中到底能够记住多少单词或符号? 国家汉字的扫盲标准是1500个字,理工科的大学生一般掌握2000个汉字。就凭这2000个字,大家可以读书、看报、搞科研。可在英文世界里,没有20000个字别想读报,没有30000个字别想把周刊读顺,大学毕业10年后的职业人士一般都懂80000 字。
中国人所使用的汉字通常在三到四千,而莎士比亚时代的英语仅有三万个单词,他本人能够全部掌握。但是,到了丘吉尔时代,他的单词量是三万个,可是,那个时候的英语已经拥有近百万个单词了。语言学家们对于英语单词的要求是:一个受过教育的英语使用者应该掌握五到二十五万单词,不但差距范围很大,而且,用这个标准来衡量,莎士比亚和丘吉尔都应该是文盲,至少是没受过教育的人。
下面简单的例子显示英文的笨:曾问系里的几个教授“长方体”如何用英文讲,可这几位母语是英文的工科教授竟说不知道,接下来连问几个本地的研究生,结果他们也不知道。着实大吃一惊!现在您知道么?反正不是Cube,Rectangular……。后来倒是真的在字典里找到了该词。感叹,英文真是笨人的语言,试图给天下每一事物起一个名字。宇宙无穷,英文词汇无穷!词汇如“光幻觉”、“四环素”、“变阻器”、“碳酸钙”、“高血压”、“肾结石”、“七边形”、“五面体”都只有专业人士才会。根本不可能象汉语那样触类旁通,不信?去亲自问问母语是英文的人好了。搞得连中国平民都非常容易词的如“长方体”,他们也只有专家才会讲!
怪不得英文世界里专家那么多!!!而且都那么自信;是啊,一般人连他们的基本术语如“酒精绵球”“血压计”都不会讲。生活在英文世界真是对无知无奈!
可见我们专家在语言上就已经是多面手。
又比如pork这个词,在英语中代表猪肉,它和猪pig、肉meat没有任何关系而仅仅代表它们的一个联合体而已,如果把猪肉pork、羊肉 mutton、牛肉beef、猪油lard、羊油suet和牛油talon放在一起进行比较的话就发现,英语中所有的联体词都是一个与其中任何一个分解词毫无关联的新符号,而它们构成了英语词汇的主体,英语中几百万的单词就是这样来的!!这样做的原因是如果将pork改成pig和meat连在一起的形式,那么就要发音四次而pork发音两次;所以联体的词节省发音却要增加记忆,而分体的词,无需记忆可是却增加了发音次数。
屠夫,每天要用到“猪肉”这个词上千次,使用两次发音的单词要比使用四次发音的词节省两千次发音,何乐不为?
现代英语为应付不断涌现的新思想、新科技、新概念,不断地造词。无非是借助拉丁词根、或重新组合已有单词,例如火箭(ROCKET),计算机(COMPUTER)等,可汉语则无须,不就是用“火”驱动的“箭”么,会“计算”的“机”么!可英文就不能这么干,不能靠组词,原因是“太长”了。如火箭将成为“FIRE-RIVEN-ARROW”,计算机将成为“COMPUTAIONAL-MACHINE”等。人的视角有限,太长的字会降低文章的可读性与读者的理解能力。结果越是专业科技的词汇,就越长、越难记。或者是大量使用缩写:如WTO、FBI、IBM、UFO等等,缩写一多就容易混淆、难以理解。在这方面,现代汉语造词的优势就十分突出了。
而汉语则相对稳定,现在中学生还可以琅琅上口地读屈原的楚词。英文就难了,太不稳定。现在的人们读沙士比亚的原著已困难重重,更不用说读400年前英国诗人乔叟的诗了。学GRE的时候,注意到很多韦氏字典收录的词汇竟是本世纪初的新词,如“Gargantuan”取自拉伯雷的小说。这也不奇怪,毕竟英文400年前才统一了拼写。
所以在这点上汉语人口对于西方人讲就是神仙啊!!!把这话当补药了.
这个现象最先是德国的莱布尼兹体会到的,他认为汉语是西方梦寐以求的组义语言. 如果他看到今天知识爆炸的世界,他一定会要求世界上所有的国家废除拼音文字而采用汉字。
注意以下事实:(1)联合国5种文字的官方文件中最薄一本一定是汉语。西方语言要比汉语浪费2倍的纸张,全世界使用西方语言的人要比使用汉语的人多5 倍,按照简单的因素级连倍乘法,就要浪费10-20倍以上的木材增加20倍以上的工业废水。;(2)汉语的精确性已为蓬勃发展的中国科技事业所证实; (3)计算机语音输入最具有希望的是汉语;(4)汉语是稳定的是收敛的,英文是不稳定的是发散的;(5)汉语是二维信息是生动的高效的,英文是一维信息是密码型的是枯燥低效的。(6)在英文世界里能读文学名著是一件了不起的事,不是所有受过大学教育的人都能干的。如阅读用英文描述的非州的一些植物真是艰涩无比,一般英美人也只能囫囵吞枣而已;可在中文世界里,又有谁会对仅有中学学历的人读完四大名著而感到惊奇?(7)当今虽是英语文明的蓬勃期。但在历史的长河中,So far,英文世界的文明史远比汉语世界的文明史短。
在西方近代强势文化下,我们国内还有些学者还要把汉语拼音化,这不是邯郸学步东施效颦吗?已经有国家把中文改成拼音文字了,那就是越南!但今天越南又在讨论把拼音文字改回中文,当时多么愚蠢!
好好研究一下汉语和英语在思维上面的差异。只有这样才能够弄清楚,为什么中国三、四十次的核试所取得的进展与美国一千多次核试的进展相差无几。
曾经中国说发现勾股定理早于欧洲一千年。西方不认同,理由:你们如何用你们的方法证明勾股定理呢?我们没有人能不用西方的方法证明之。因为我们都学西方几何学长大,思维被他们的方法框死了。于是被怀疑地看待。
一年前看了中央台的“东方学子”节目,我国的一位数学家花了10年,用古法证明勾股定理。也证明了我们首先发现勾股定理。同时证明了其他数学定理。这是独立于西方的另一种思维方式。由于历史上战乱,外族入侵,许多文献灭失。加上西方人以貌取人,轻视经济落后的中国各个方面,才造成今天局面。
事实是2000年来中国一直是最富的国家,而近200年才开始落后。古代中国像今天的美国,吸引了各地人汇聚,谋生,包括黑人。(有据可考)200年对国家历史来说很短,对一个人来讲太漫长了。而西方国家的发展不可否认有科技,还有对我们的财富掠夺
-----------------------------------------------
(电脑)汉字一级和二级字库的范围
http://zhidao.baidu.com/question/17569488.html
首先说明 gb2312 的编码规则
汉字采用区位码表示 每个区有 94 个汉字容量。 1~94
区的编码从 1开始倒94
所以gb2312的最大编码容量是 94*94 (实际上只包含了6737个汉字)
区码: 1~8 是符号区,全角英文字母,希腊、日文、俄文等等,
9 区是造表符号
10~15 空,未定义,
16~55 一级字库 汉字3755个,采用拼音排序;
56-87 二级字库,汉字3008个,采用部首排序;
87~94空
由于此编码方案顶得比较早,有很多不完善的地方,所以后来有了 gb12345,和gb 13000 等其他编码方案。
个人记忆,可能有些出入,仅供参考。
---------------------------------------------------------------
内码也简单,就是gb2312的编码都加上 0xa0 (160) 就行了
比如
区位码:1601 “啊”字
他在计算机里面的内码就是
10进制 16 +160, 01+160
16进制 10 + A0,01+A0
得出来的就是B0A1更多精彩文章及讨论,请光临枫下论坛 rolia.net