为何俄语网页占比这么高?_风闻
code2Real-有人就有江湖,有code就有bug2021-12-27 11:01
我们来看看统计数据——
题目中的数据来自W3Techs,2021年12月24日,最新一期的排名如上图所示。可以看到,在最近的排名中,中文网页的占比甚至被越南文超越了,而俄文则维持了第2的位置。
W3Techs的统计是根据Alexa前1000万或Tranco前100万的站点得出的,去掉了仅有默认页面的站点、重定向的域以及大网站下面的子域名。从2011年至今,每年统计数据如图所示——
可以看到,在2011年时,德文网站的占比排名第2、日文第3、中文第4、俄文第5。从2011年开始,俄文网站的占比逐年提升,并在今年1月达到顶峰,中文和德文网站的数量则逐年递减。至于土耳其文、波斯文和越南文的网站占比,主要是在2015年之后迅速提升的。观察中文网站的占比,可以发现,其占比是在2013到2016年间迅速下降的.
全世界最大的在线百科维基,在许多国家都是浏览量前10的网站。维基百科上有关于各种语言百科词条的统计,按总页面数量统计,排名最多的是英文(没有任何疑问),接下来分别是越南文、法文、宿务文、阿拉伯文、西班牙文、德文、意大利文、中文、俄文(总页面数量包括词条、讨论、分类、重定向等各种页面)。
按照词条数量统计,排名前10分别为:英文、宿务文、瑞典文、德文、法文、荷兰文、俄文、西班牙文、意大利文、波兰文。
注:维基上的宿务文、瑞典文、Winaray词条大多是由瑞典人Sverker Johansson创建的Lsjbot自动编制的,所以数量有些虚高,去掉后,前10可以加上埃及阿拉伯文和日文。所以按浏览量统计,排名前10分别为:英文、日文、西班牙文、德文、俄文、法文、意大利文、中文、葡萄牙文、波兰文。
按照编辑次数统计,排名前10分别为:英文、德文、法文、西班牙文、意大利文、俄文、日文、中文、越南文、波兰文。
按照编辑者数量统计,排名前10分别为:英文、西班牙文、法文、德文、中文、俄文、葡萄牙文、意大利文、阿拉伯文、日文。
按照活跃编辑者数量统计,排名前10分别为:英文、法文、德文、西班牙文、日文、俄文、葡萄牙文、中文、意大利文、阿拉伯文。
按照上传图片数量统计,排名前10分别为:英文、俄文、意大利文、德文、罗马尼亚文、乌克兰文、波斯文、希伯来文、芬兰文、法文。
按照国家统计,在前苏联国家和朝鲜,人们最喜欢阅读俄文版的维基,而中文维基的影响力大多仅限于中国。
按照维基百科的统计数据,俄文的维基社区,活跃度至少排在前6,而且俄国用户可能更专注于条目的完整和丰富,因此上传图片的数量高居第2。维基上波斯文、土耳其文、越南文社区也比较活跃,这些语种的网站,在前100万网站中占比也不低。
除了维基以外,俄文互联网上还有许多别的百科网站——
俄罗斯大百科全书的网络版。
https://www.krugosvet.ru/www.krugosvet.ru/
一个基于纸质百科,根据学科分类整理词条的线上百科。
https://megabook.ru/megabook.ru/
网站基于Cyril and Methodius的各种百科全书创建,用户也可以自建词条。
https://dic.academic.ru/dic.academic.ru/
http://www.rubricon.com/www.rubricon.com/
这两个都是整合了数十上百本传统纸质百科的聚合型网络百科。
http://www.encyclopedia.ru/www.encyclopedia.ru/
关于百科全书的“百科全书”。
在互联网出现之前,纸质书是人们主要的知识载体。根据维基上面的统计,目前,俄罗斯每年出版的图书数量约为11.5万种,排名世界第5。虽然每年出版的中文书数量高居世界第2,但根据国家新闻出版总署的数据,2016年后,我国每年新出版图书呈现出逐年下降的趋势,这两年限制书号,情况也不乐观。
综合上面的数据,可以看到,在当今世界的知识生产方面,俄文还是非常有影响力的。虽然比不过英文,但基本和法文、德文、西班牙文、中文、日文在一个档次。考虑到日文、德文使用区域有限,法文和西班牙文占据优势的西非和拉美地区,教育基础、计算机技术、互联网发展水平可能不如俄罗斯和前苏联地区,那么俄语网站能有这么高的占比,还是可以理解的。
另外,如果有搜索国外论文、电子书和各种版权资源的体验,应该也能感受到俄文区大佬的互联网共享精神。
比如说,著名的免费学术论文下载网站Sci-Hub,它的创始人来自前苏联加盟共和国哈萨克斯坦。
再比如,下载国外电子书用的创世纪图书馆(Libgen),也是俄国人做的,其历史可以追溯至苏联时期的самиздат文化。
所以俄文区的人们,是真的乐于输出,且乐于分享啊。我们现在之所以能有那么多免费共享的高质量资源,ta们功不可没。
但问题是,为什么中文网站的占比,在整个世界上显得如此之低?
要知道,这可是一个有14亿人口,十多亿网民的国家,经济总量可以匹敌世界任何一个大洲,基础教育和高等教育水平不低,历史悠久,文化多元,互联网产业蓬勃发展……从任何一个角度看,中文互联网的比重都不该如此之低。
很多答案都提到了移动互联网的因素。的确,各大厂商跑马圈地,筑建护城河,发展出一系列大而全,却禁止搜索引擎抓取内容的内部生态。将人们的注意力吸引到自家手机APP而不是网页,确实大大挤占了传统网站的空间。
但这并不是全部原因。
记得在学生时对古生物感兴趣,当年有更新及时,分类清晰的恐龙网,对天文感兴趣,有牧夫天文论坛等各种天文网站。
作为对比,一个俄国天文网站:http://www.astronet.ru/ 虽然界面比较过时,但分类清楚,检索方便,各方面的内容都不缺。
想要讨论全面战争,找mod教程,有黄龙骑士团;要找文明系列资源,有塞爱维论坛;关注世界局势和军备动向,有超级大本营等等军事论坛。
那时百度的贴吧还很热闹,刷贴吧不用登录手机,没有那么多广告贴,是真的有内容且活跃的讨论空间。
那时中国的互联网虽然没有现在那么普及,但各种小众话题都有自己的讨论空间。
到后来,就是各种回帖可见、用网站积分购买……
之后,是网站自带下载器,扫码关注公众号,回复提供解压码……
接着,是您所打开的资源已被删除,网站论坛无人问津……
最后,是各大平台争相抢占流量,首页无数美女教穿搭分享生活,熟悉的网站接二连三因备案、规则改变或难以运营而陆续关闭或限制讨论……
互联网是最能打破阶层、地域、时间界限的工具之一。闭塞之地的人们能借助网络看到外面的世界;身无分文的人们能通过网络找到赚钱的机会,一无所知的人们能通过网络找到各个领域的学习资源。
但是如今,我们的互联网发展了,流量增加了,但真正可供学习、分享、讨论,能够沉淀下来的内容,也许还不如以前。不同的群体有不同的需求,大而全的平台并不能替代小而美的社区。
未来,随着互联网元宇宙布局完成,人们都被限制在元宇宙的信息茧房中,仿佛孙悟空跳不出如来的手掌心。