你的位置：意昂体育 > 新闻动态 > 惊爆！上海砸重金，力推类脑大模型挑战 Transformer 霸权

惊爆！上海砸重金，力推类脑大模型挑战 Transformer 霸权

发布日期：2025-08-22 13:38 点击次数：60

上海市科委设立"颠覆性技术研究"专题，重点支持非Transformer架构的类脑大模型研发。

赵海团队的"脑启发大语言模型"入选上海交大"2030计划"B类项目，获500万元经费，经费可自由用于算力采购。

挑战Transformer架构的动因

主流架构瓶颈：Transformer存在高算力消耗（如GPT-4训练耗电2.4亿度）、决策"黑箱化"、上下文长度受限三大缺陷。

权威质疑：图灵奖得主杨立昆指出Transformer无法实现通用人工智能（AGI）；诺奖得主哈萨比斯称需"1-2个类似Transformer的新突破"。

核心技术突破：脑启发模型BriLLM

创新机制：

用"信号全连接流动"替代自注意力机制，模拟人脑语义编码（词元映射为节点）和信号传播（沿最小阻力路径激活节点）。

全球首个宏观尺度模拟人脑全局机制的大模型。

性能成果：

发布150亿参数中文模型（BriLLM）及中英文压缩版（20亿/10亿参数），性能对标GPT-1，开源代码与权重。

通过"低频词元边共享"技术，压缩版实际算力占用仅13%，能耗降90%。

四大颠覆性优势

能耗骤降：模拟人脑低功耗特性，计算成本仅为同级Transformer模型的1/10。

100%决策透明：节点对应明确语义，可实时追踪信号路径（例：解释为何推荐糖尿病人吃柚子而非西瓜）。

无限上下文：信号自由传播支持百万字《辞海》处理，无需模型扩容。

多模态天然适配：视觉/听觉信号可直接转化为新节点，学习方式接近人类（例：添加闪电图像节点后动态识别功耗仅0.7毫瓦）。

上海类脑智能生态布局

产业基建：杨浦区建设类脑产业集聚区，整合复旦类脑芯片团队（邹卓）、时识科技等企业，研发功耗0.7毫瓦的"感算一体"动态视觉芯片。

资本支持：10家机构联合成立类脑智能未来产业基金矩阵，提供百万级算力补贴。

应用生态：徐汇"模速空间"汇聚商汤、阶跃星辰等400家企业，形成算力调度-终端产品全链条。

双技术路线竞速

赵海路线（宏观）：两年内开发300亿参数中英文模型，聚焦预训练、指令微调、高效推理。

李国齐路线（微观）：中科院团队研发"树突脉冲神经网络"，模拟神经元多房室结构，将脉冲神经网络从10层拓展至500层，目标千亿参数模型。

告别“黑箱”！上海交大打造会“思考”的类脑大模型

上海科学家造出会“思考”的AI！赵海教授团队研发的全球首个宏观模拟人脑机制的大语言模型BriLLM，彻底抛弃了Transformer架构，让AI的决策过程像人脑一样透明可解释。这一突破获500万元专项经费支持，并被列入上海类脑智能颠覆性技术攻关项目。

一、为什么放弃Transformer？

当前主流AI大模型依赖的Transformer架构正遭遇三重天花板：算力黑洞般的高能耗、决策逻辑不透明的“黑箱”，以及无法处理无限长上下文的技术枷锁。例如，训练GPT-4需消耗2.4亿度电，相当于3万户家庭全年用电量，而人脑完成同等认知任务仅需20瓦功率。图灵奖得主杨立昆直言：“Transformer永远无法实现真正的通用智能！ ”

二、人脑如何被“复制”进AI？

赵海团队从脑科学两项关键发现获得灵感：

静态语义映射：大脑不同区域分工明确，例如“房子”概念会激活特定皮层区域。 BriLLM直接将每个词元（如“苹果”“量子”）映射到有向全连接图的专属节点，让每个节点承载明确语义。

动态信号传导：模拟脑电波传播机制，让信号沿“最小阻力路径”在节点间流动。当输入“夏天吃什么水果”，信号自动流向“西瓜”“芒果”等关联节点，像神经电流激活目标神经元般生成答案。整个过程如同人脑思考般自然可追溯。

三、四大颠覆性突破

能耗骤降90%：通过“低频词元边共享”技术，20亿参数中文模型实际仅占用13%算力资源，训练成本仅为同级Transformer模型的十分之一。

100%透明决策：用户可实时追踪信号从“输入节点”到“输出节点”的完整路径，看清AI为何推荐“糖尿病人吃柚子”而非“西瓜”，彻底终结黑箱隐患。

无限记忆容量：信号自由传播机制突破上下文长度限制。测试中处理百万字《辞海》无需任何架构调整，而Transformer模型需为长文本专门扩容。

多模态天然适配：视觉、听觉等感官信号可直接转化为新节点接入现有网络。添加“闪电图像节点”后，模型能像人眼一样瞬间识别动态画面，传统芯片完成同等任务功耗高出数万倍。

四、上海打造类脑创新生态

2017年至今，上海已在类脑智能领域完成系统布局：

杨浦类脑产业集聚区：整合复旦大学类脑芯片团队、时识科技等企业，研制出功耗仅0.7毫瓦的“感算一体”动态视觉芯片，抓拍闪电如同人眼般轻松。

千亿基金矩阵护航：10家投资机构联合成立类脑智能未来产业基金，为初创企业提供百万级算力补贴，推动技术快速产业化。

模速空间加速落地：徐汇区建成6万平方米载体，汇聚商汤科技、阶跃星辰等400家大模型企业，形成从算力调度到终端产品的全链条生态。

五、中国团队的“双路线竞速”

除赵海团队的宏观人脑模拟路线外，中科院李国齐研究员正从微观尺度突破：

树突神经元模型：模仿人脑树突的多房室结构，让AI拥有多尺度记忆能力。其研发的脉冲神经网络深度已从10层突破至500层，解决长序列建模难题。

百亿参数攻关：两大团队均瞄准百亿级类脑大模型研发，赵海计划两年内推出300亿参数中英文模型，李国齐团队则探索千亿规模通用架构。

下一篇：2025年全球黑人亿万富翁榜单: 乔丹第7, 詹姆斯第18 上一篇：潮州短视频代运营的优势剖析

惊爆！上海砸重金，力推类脑大模型挑战 Transformer 霸权

热点资讯

推荐资讯

推荐资讯

热点资讯