著名金融家、学者、全球最大资产规模金融基金桥水基金创始人瑞·达利欧(Ray Dalio)近日在“All-In”播客的访谈中分享了他对全球经济形势的深刻见解。这场访谈的背景正值他的新书《国家如何破产》即将出版。
达利欧预测精准在欧美如雷贯耳,他也正是因为准确预测了2008金融海啸,于欧债危机、英国脱欧等一系列金融大事件中提前卡位逆流而上起家的。会谈中达利欧说,“我认为AI确实能极大地推动生产力增长,但关键在于你指的AI具体是什么?超级科技巨头确实存在风险,AI的真正影响力在于谁在应用它,以及如何颠覆行业。在未来,会有颠覆者,也会有被颠覆者。重要的不是谁在制 造这些技术,而是谁能最有效地应用这些技术,并由此带来变革。
AI竞争比企业盈利更重要。这不仅仅是商业竞争,而是一场“国家级战争”,中国和美国都输不起,因为AI影响的不只是经济,而是全球竞争格局。”
DeepSeek中文人工智能的开源带来全球高科技网络广泛使用其DS R1模块,一时间金猴奋起千钧棒,玉宇澄清万里埃,大量之前被迫购买OpenAI收费人工智能的海外公司直接宣布采纳开源免费的DeepSeek。
最突出的是,人们发现机器人竟然引领起语言风来,大量国外AI公司的运算突然跟风采用起中文运算模式。英文用户使用目前OpenAI新鲜推出的ChatGPT o3-mini 模式时开始发现其AI时常采用成段的中文或者明显是由中文翻译成英文的分析过程和问题回答。
这与之前分析的法国推出法语版人工智能露西却连最基本的算术运算都错误连连形成对比。就像海外华人子女在幼儿园都会用中文流利算出七八五十六,九九八十一,而美国沃尔玛超市成年人的收银员连四八三十二都往往要花很多时间又是掰手指又是摆钞票地折腾不明白一样,中文在AI算力的先天语言语境优势成了AI界的“从现有实力地位出发”的象征。
[世界语言分类上,汉字、彝文、东巴文、格巴文、水书等文字被归为表意文字,其他大部分文字为表音文字。这个世界呈现表意文字和表音文字长期共存的局面。汉语和英语则是这两类语言系统的代表。目前最长的英语单词是由45个字母组成的一个医学上的疾病名称pneumonoultramicroscopicsilicovolcanoconiosis,它的中文内容是“尘肺病”。英语对待新事物的名称(词汇)的办法是造新词。萨士比亚时代英语总的词汇量是14万左右。现在的英语如果将各学科的术语和俚语方言也包括在内,那么总词汇量已远远超出200万个。这个词汇库不要说普通英国人的4万左右词汇量(只达到英语总体词汇量的百分之二左右),就是人工智能的也会头痛,因为数据库太占空间时间,记忆力应付不过来。动物学家A向物理学家B谈起一种有趣的动物:
Parastratiosphecomyia stratiosphecomyioides
然后B的反应会是一脸茫然。而对于文明带来的新事物词汇大爆炸,汉语体系不需要造新字,只需要拿原来的字进行排列组合成一些新的词就搞定了,如上面举例的“尘肺病”,和那个昆虫学名“亚拟蜂水虻”,你就是跟一个中国的初中生说这两个中文名称他也能知道是在说什么。中文单字信息熵9.5比特,西文则不到4比特,在扩展性的对比上,汉语对英语的优势是压倒性的。人工智能不往种花家跑肯定智能有问题。
汉语的第二大优势是思维速度快。普通话有21个声母、35个韵母和四声,总共可以组成2900个声音。英语与普通话相比则不同,国际音标中,英语有20个元音和20个辅音,所以英语的声音种类不会超过20×20=400个。因此季羡林先生早就说过:一句话用英语表达经常需要一分钟,而汉字则只需要5秒。
汉语的第三大优势是传承稳定。汉字作为一种表意文字,其意义从古到今一脉相承,使得普通中国人稍加学习就可以理解古文,博古通今。于是文明不容易出现断层,文明的成果可以得到更好的积累。
而今天的普通英国人,面对古英语只能一筹莫展。正是这些压倒性的优势,使得汉语具备了强大的韧性,在其背后文明几乎坍塌的黑暗时代依然能够坚持下来。
一个汉字里面就可以承载三类信息:
一维的声音;
二维的形态;
以及从形态推测出来的意义;
而一个字母单词只能承载一类信息:声音。这个声音所代表的意义,是靠死记硬背强行联 系起来的。西文最大问题是缺乏关联,汉语轻松表示葡萄,葡萄干,葡萄酒,葡萄藤等等与葡萄相关的词在西文里面各自没有关联,只能死记硬背一大堆各式各样的词汇。告诉呀呀学语的儿童小牛、公牛、母牛、牛肉、牛奶、牛油,小家伙转身就能比划着找出对应图片
换成英文则四六不靠 calf, bull, cow, beef, milk, butter。更残忍的是小学生都不难上口拿捏的青霉素红霉素绿霉素土霉素链霉素庆大霉素两性霉素这些药名和作用欧美非医学专业人士个个拼写不全念不出听不懂,这还只是相当常用的医药词汇,如今每年上万的更长更繁琐的英文新词汇99.9%的人只好直接忽略不理了事。其结果就是信息茧房效应,美国人只生活在周围熟悉事物和词汇的舒适小茧之内,主流媒体大报经常标注错伊拉克、阿富汗的地理位置,弄不清其他国家的首都名称,以至于炒作了几十年新疆问题的CNN电视新闻直接把新疆标注在中国广东省的位置上。
汉语是三维语言,每个汉字反应出来的信息是立体的,以英语为代表的拼音语言只是一维语言,每个单词只能反应单调的线性信息。而汉字词组、典故和成语都是植入文句中的一个个信息库。一个词汇“空城计”就是丰富的意境画面历史人物和策略集群。这样的历史典故成语谚语词汇在五千年文明长河中不断积累,不用说典故之外还有海量如“大江东去”、“人约黄昏”、“今夕何年”、....“不明觉厉”、“细思恐极”、“普大喜奔” 这样来自诗词、中文经典文化作品、特定历史时期和每年不断发展出来的社会热词等非典故词汇和它们的各自变体组合,它们对于中文使用者可以畅通无阻地理解和追捧,要想让英语AI翻译它们则不是胡乱应付就是卡壳死机。所以汉语是这个世界上唯一的形音语文,领先其他拼音语言两个维度,无疑是高维文明古老汉字对一维线性文字的降维打击。斯坦福大学研究指出现有英文A I每年需要以12%的算力增幅应对新词汇带来的问题,不说芯片算力堆积需求,仅仅能源消耗方面到2050年就能达到整个地球所需能源的170%,横亘在川普刚刚提出的星际之门AI计划面前的不是AI,首先是庞大的能源供应问题,至少新建五所下一代核电站才能产出。这就是中文AI相对英文AI的现实。
(以上资料主要引自[涨姿势!汉语还是英语?人类文明的终极选择]发布者大眼联盟,推荐者观雨)。]
这些优势的综合体现就是美国的人工智能推理思考过程和思索宽度也深度跟不上中国的人工智能。分析同一个题目,DeepSeek R1 想得多, o3-mini 想得少,说人话就是有点缺脑子。这不是山姆奥特曼说的OpenAI 站错了队,没有搞开源那么简单也不是比尔盖茨评论二者所说的“中国领先,美国可以迎头赶上”那么容易。一切都还只是厚积薄发的开始,就足以从侧面说明为什么OpenAI 每年投入30亿美元堆算力,却算不过总投资仅仅560万美元的DeepSeek。
人工智能是人类智能的投射,人工智能思维行不行的根源在于人的思维能力上。国际研究显示汉语家庭新生婴儿只需要平均29个月就能建立自主语言交流能力,英语和其他语言则平均超过40个月,相当于迟钝了一年。有研究文章甚至把英语称为“笨语言”。归根结底,科技发展依赖效率和精确,以及掌握它们的高端思维创造能力,这些都离不开人的因素,欧美媒体发掘中国人工智能DeepSeek时都提到的一句话就是纯中国人才的团队组成,而美国人工智能开发团队核心人才的35%一样是讲中文的中国人,马斯克号称要推出世界最强人工智能XAI,站在他身边的核心开发者恰恰就是一位与中国人工智能DeepSeek团队师出同门的浙大计算机毕业生。
因此,西方解决方案当然有:学中文,用中国人才。不仅美国AI 研发者要学要用,他国的人工智能AI 要学要用,全球广大使用AI的人最好也要学一些基本的中文。
当然前提是把中文看作是一种优秀语言,把中国人看作是科技生力军,而不是美国国家利益的威胁。欧美最缺瑞·达利欧(Ray Dalio)这样提前洞察世界局势的人,他本人上世纪八十年代就早早来到中国,把儿子送进北京史家胡同小学学习正宗中文。他的桥水基金成为全球最大不是没有原因的。
学习还是禁止中文汉语,尊重还是诬陷中国人才,美国鹰派政客需要想清楚。
下面转载的文章对AI运用各种语言的前景进行了一些对比分析。
不提中国威胁就无法开口说话的拜登川普,恐怕也得一边两个头六个大,一边跟唱扁担偏要绑在板凳上。
诗之。
AI、开源、中国话
文 湯安
其 一
白头垂泪话西天,欲诉不能涕泗涟
朕与斯民原妄念,孑遗末世万烦渲
汉家文韵通蛮貊,盎萨舆图颓幅员
A I 书功无后辈,算中文字老前贤
其 二
制裁稀见枕寒流,道智开源任广求
蒿野发纾经国策,庙堂礼待富民侯
文含金玉当吟咏,话富珠玑宜唱酬
云上算来多少力,人机处处闻家丘
蛮貊,古代称边远南方为蛮和大漠北方为貊,意为落后部族。后泛指四方落后国家和地区。同“蛮貉”。出处《书·武成》:“华夏蛮貊,罔不率俾(顺从)。” 《论语·卫灵公》:“子张问行。子曰:言忠信,行笃敬,虽蛮貊之邦行矣。言不忠信,行不笃敬,虽州里行乎哉。” 舆图,领土,地域。盎萨,英美,盎格鲁-撒克逊(Anglo-Saxon,简称盎撒人)人传统上是指公元五世纪初到1066年诺曼征服之间生活在大不列颠岛东部和南部地区的的一些民族,属于日耳曼人的一支。哥伦布发现新大陆和殖民统治兴起之后泛指西方殖民 主义者。发抒,申纾,抒发,畅谈。云上,借指人工智能采用云处理,云存储和云计算。家丘,亦作“家邱”,“东家丘”的省称,即孔丘。这里指儒家思想,大哲,圣贤君子。
转载 AI大模型里中文优于英文
送交者: 2025年02月08日23:53:38 于 [世界军事论坛]
陈经亚洲视觉科技研发总监
昨天 15:03
大模型里中文优于英文。Deepseek用128重“视角”审视,深入发掘了中文体系的神奇
现在很明显了,在AI看来,全球文字就只有两种值得分析,英语与汉语。别的语言没有办法竞争,都有严重缺陷,
很多语言,和英语出于同门,都是字母文字,英文到处借了不少词。同体系语言,不可能比英文语料更强。美国大模型显然英语中心论,技术牛逼,照顾你们别的语言也给训练输出。
其它语言,基本都不行。如韩文自己发明的,没有汉字造成麻烦。日文体系有大量汉字,还混杂了英语发音当名词,体系非常乱。南亚梵文,语法词汇复杂,文字还变形,流传到东南亚影响了泰文、老挝文。还有埃塞俄比亚的阿姆哈拉文,过于简单,表达不了复杂意思。梵文等不少语言问题是科学技术文章少,大模型就看不上了。
中文是唯一对手。汉语有极佳开放性,描述现代社会、科学技术没问题,还焕发出了强大的生命力。中文素材种类丰富,科技文章也多,还能融合英文名词。中文是唯一可以与英文对标的素材库。
有人说,汉字二维,字母文字一维。这不重要,大模型里汉字都转成了token。词汇表里,都是token1、token2...,用整数代表。Deepseek词汇表有12.9万个token,AI只看token,所有文字都一样。
但token之间的联 系,有明显的团块,分语种扎堆。大模型预训练,就是在建立token之间的复杂联 系。一个token就有好几千维的浮点数,用这么多维度去和别的token建立联 系。Deepseek用61层,每层约10个大矩阵,实现“注意力”,也就是文字之间的关联。然后最关键的是,一套矩阵是一种审视的“视角”(如语法关联),Deepseek建立了128种视角去看同一段话(如逻辑关联)。也就是61层,每层128套矩阵,每套10个矩阵。每个矩阵都是7000*7000这么大。
英文世界,它不和中文发生关联。英文素材里没中文,读者不懂。但中文素材有不少英文,自然融入。也就是说,英文没法融合中文!如果以英文主打,大模型会拒绝中文。但中文却可以自然融合英文!将英文名词放中文里,毫无问题。中英夹杂输出,一定是中文主导。
大模型发现,中文的权重关联团块中,自然“导入”了英文那边的知识,一个名词就导过来了。而英文那边没法导入中文知识。外国人不知道中国的情况,中国却对外国比较了解,AI世界情况类似。
AI是哪个语言好用,就在哪努力。除非强迫它用英文思考,不许中文,那能力又不行了,和中国相关的问题拒绝回答。AI决定,中文主导、融合英文!AI就是模仿人,人类就是这个自然倾向。要么英文主导,中文白 痴;要么中文主导,中英俱佳。素材往那一放,自然就是如此,OpenAI也没办法。
而且就象许多人分析的,中文内在联想丰富,表达高效,思考深入效率高。又高效,又能自然融合英文,AI自然喜欢用中文。
所以,OpenAI的o3-mini,即使问题是英文,问题本身也和中国、中文无关,它还是忍不住(蒸馏)中文思考(运算),再用英文输出最终结果。
而DeepSeek的高水平,是在中文素材上下了大功夫,动用了128重视角,把中文玩得很熟练。它在中文上的水平,真正让人服气了。以此为基础,思考水平非常高。
再次重温歌曲《中国话》,好歌如同好酒好诗,它们的韵味都是能够与时俱进。
作曲:郑楠;作词:郑楠,施人诚
演唱:S.H.E
《中国话》歌词
扁担宽,板凳长,扁担想绑在板凳上
扁担宽,板凳长,扁担想绑在板凳上
伦敦玛丽莲,买了件旗袍送妈妈
莫斯科的夫斯基爱上牛肉面疙瘩
各种颜色的皮肤,各种颜色的头发
嘴里念的说的开始流行中国话
多少年我们苦练英文发音和文法
这几年换他们卷着舌头学平上去入的变化
平平仄仄平平仄
好聪明的中国人,好优美的中国话
扁担宽,板凳长
扁担想绑在板凳上
板凳不让扁担绑在板凳上
扁担偏要绑在板凳上
板凳偏偏不让扁担绑在那板凳上
到底扁担宽还是板凳长
哥哥弟弟坡前坐,坡上卧着一只鹅
坡下流着一条河,哥哥说,宽宽的河
弟弟说,白白的鹅,鹅要过河,河要渡鹅
不知是那鹅过河,还是河渡鹅
全世界都在学中国话
孔夫子的话,越来越国际化
全世界都在讲中国话
我们说的话,让世界都认真听话
纽约苏珊娜,开了间禅风lounge bar
柏林来的沃夫冈,拿胡琴配着电吉他
各种颜色的皮肤,各种颜色的头发
嘴里念的说的开始流行中国话
多少年我们苦练英文发音和文法
这几年换他们卷着舌头学平上去入的变化
仄仄平平仄仄平
好聪明的中国人,好优美的中国话
有个小孩叫小杜,上街打醋又买布
买了布,打了醋,回头看见鹰抓兔
放下布,搁下醋,上前去追鹰和兔
飞了鹰,跑了兔,洒了醋,湿了布
嘴说腿,腿说嘴,嘴说腿,爱跑腿
腿说嘴,爱卖嘴,光动嘴,不动腿
光动腿,不动嘴,不如不长腿和嘴
到底是那嘴说腿,还是腿说嘴
全世界都在学中国话
孔夫子的话,越来越国际化
全世界都在讲中国话
我们说的话,让世界都认真听话
全世界都在学中国话
孔夫子的话,越来越国际化
全世界都在讲中国话
我们说的话,让世界都认真听话
全世界都在学中国话
孔夫子的话,越来越国际化
全世界都在讲中国话
我们说的话,让世界都认真听话
(请问,南翔小笼在哪里?
呃……哦,那儿!)
背景资料:
《中国话》是华语女子团体S.H.E演唱的一首嘻哈风格的快歌,由郑楠、施人诚填词,郑楠谱曲,收录于S.H.E2007年05月11日发行的专辑《PLAY》中,亦是专辑的第一主打歌。
2007年开始,这首歌获得了包括中国原创音乐流行排行榜港台全国至尊金曲大奖、全球华语歌曲排行榜20大金曲、MusicRadio中国TOP排行榜年度金曲在内的多个奖项。

冯期武

依然

飞文染翰

彭程
敬茶问好冯诗兄,不敢,不敢,大家同门弟子,共同交流提高。说到中文地位,拜登时期的上一次联合国俄乌战争特别会议欧美只允许与会者使用英语汉语和乌克兰语,故意禁止作为联合国五大官方语言的俄语。今年这一次俄乌专题国际会议则禁止了乌克兰语,只允许英语和中文,连法语都上不了台。而在目前在沙特阿拉伯首都利雅得召开的美俄沙特三方会晤,对特意跑去显示参与资格的泽连斯基羞辱性地规定只允许他说俄语住利雅得莫斯科酒店还不得旁听美俄沙会晤。泽连斯基泪洒沙特悲愤离去。汉语的世界地位会越来越高已经在好莱坞的星际宇航大片一再体现,华人与有荣焉,大有可期。
问好嘉韵兄,人工智能争霸很快就会体现在中美两国经济政治甚至军事行动中。但愿东方文明圣贤的龙性战胜西方虚伪残暴兽性,让世界少受奴役迫害和剥削压迫。
***《龙性文明共运牵》(小辘轳体)