其实普通美国人日常生活涉及的词汇量,基本不会超过5000?_风闻
四时江雨-2022-01-07 20:10
【本文来自《一种新型的计算机输入输出架构设想》评论区,标题为小编添加】
- 长风
- 你的外语水平一定很牛逼。
英语,目前所有的词汇量是200万以上,一个能够基本通读一般读物的成年人,需要掌握的词汇量是5万至7万,掌握2万单词,你连一份面向大众的杂志都读不下来。更不用说各专业领域的专业词汇。
人家英语国家,专业考试是可以带专业词典的,否则,考生自己都读不明白考题。
你说目前的计算机架构做不到,非常正确。
计算机不会辨认汉字,也不会辨认ASCII字符。你键盘输入的,是在计算机内部是个什么东西,你还是自己先研究研究吧。
我没兴趣跟你证明什么,不过你如果明白了什么,那就恭喜你了。
我的外语水平确实不错。首先目前英语的词汇量并没有200万以上,虽然没人做过专业的统计,但是普遍估算一般在15万-20万之间,向上不超过100万,当然这个估算其实有点水。我不清楚你是不是真的接触过英语国家的人,但是我想说,其实普通美国人日常生活涉及的词汇量,基本不会超过5000。能掌握3万词汇量,基本是藤校本科生的水平。通读一般读物的成年人,是没有能力也没有必要掌握5到7万这种量级的单词的。
以我本人为例,本科英语专业基础,两个博士学位所需要的单词,算上外来的拉丁语名词,顶天了也不会超过7万。不过争论这个其实没什么意义,好像和你设想的东西关联不大。
至于键盘输入的内容在计算机内部是什么,这个基本属于常识性的东西,没什么可研究的啊。不止键盘,实际上计算机所有的输入和输出内容,在最底层都是二进制代码,原理上说白了就是控制半导体是否通电来表达0和1的状态。
你认为这种需要对二进制代码进行翻译的方式不够高级,但是我想和你说的是,其实你所认为的不需要翻译的高级的汉字码,应该是不太可能实现的。因为你本人在识别文字的时候,在你的大脑最底层,也是以二进制方式进行输入和输出的,原理是脑神经中的神经元是否放电来进行0和1的表达。而计算机的设计,其实就是参考人类大脑的这种运作方式。所以我可能是过于外行或者才疏学浅眼界不够,但是我的确想象不出来能够存在不需要被编译就可以直接被识别的汉字码表,因为人类一切的发明本质上都是模仿,是对自然界存在事物的学习和扩展,人是发明不出自己没见过的东西的。
你坚持选择单个汉字作为你设想中的编码基础元素而不是汉字笔画,好像是为了表现你这种编码的高级感,但是从覆盖范围和稳定性来说,以完整汉字作为基础是比不上以笔画这种更基础的元素作为基础的。
最后,我想说的是,我明白你急迫想维护自己设想的心情,但是实在没必要这么重的戾气。我前面就说了我在计算机工程这个领域是外行,我只是对你设想的这些很感兴趣,所以在本身知识的范围内提出一些疑问而已。