意昂体育
意昂体育
你的位置:意昂体育 > 新闻动态 > 惊爆!上海砸重金,力推类脑大模型挑战 Transformer 霸权

惊爆!上海砸重金,力推类脑大模型挑战 Transformer 霸权

发布日期:2025-08-22 13:38    点击次数:58

上海市科委设立"颠覆性技术研究"专题,重点支持非Transformer架构的类脑大模型研发。

赵海团队的"脑启发大语言模型"入选上海交大"2030计划"B类项目,获500万元经费,经费可自由用于算力采购。

挑战Transformer架构的动因

主流架构瓶颈:Transformer存在高算力消耗(如GPT-4训练耗电2.4亿度)、决策"黑箱化"、上下文长度受限三大缺陷。

权威质疑:图灵奖得主杨立昆指出Transformer无法实现通用人工智能(AGI);诺奖得主哈萨比斯称需"1-2个类似Transformer的新突破"。

核心技术突破:脑启发模型BriLLM

创新机制:

用"信号全连接流动"替代自注意力机制,模拟人脑语义编码(词元映射为节点)和信号传播(沿最小阻力路径激活节点)。

全球首个宏观尺度模拟人脑全局机制的大模型。

性能成果:

发布150亿参数中文模型(BriLLM)及中英文压缩版(20亿/10亿参数),性能对标GPT-1,开源代码与权重。

通过"低频词元边共享"技术,压缩版实际算力占用仅13%,能耗降90%。

四大颠覆性优势

能耗骤降:模拟人脑低功耗特性,计算成本仅为同级Transformer模型的1/10。

100%决策透明:节点对应明确语义,可实时追踪信号路径(例:解释为何推荐糖尿病人吃柚子而非西瓜)。

无限上下文:信号自由传播支持百万字《辞海》处理,无需模型扩容。

多模态天然适配:视觉/听觉信号可直接转化为新节点,学习方式接近人类(例:添加闪电图像节点后动态识别功耗仅0.7毫瓦)。

上海类脑智能生态布局

产业基建:杨浦区建设类脑产业集聚区,整合复旦类脑芯片团队(邹卓)、时识科技等企业,研发功耗0.7毫瓦的"感算一体"动态视觉芯片。

资本支持:10家机构联合成立类脑智能未来产业基金矩阵,提供百万级算力补贴。

应用生态:徐汇"模速空间"汇聚商汤、阶跃星辰等400家企业,形成算力调度-终端产品全链条。

双技术路线竞速

赵海路线(宏观):两年内开发300亿参数中英文模型,聚焦预训练、指令微调、高效推理。

李国齐路线(微观):中科院团队研发"树突脉冲神经网络",模拟神经元多房室结构,将脉冲神经网络从10层拓展至500层,目标千亿参数模型。

告别“黑箱”! 上海交大打造会“思考”的类脑大模型

上海科学家造出会“思考”的AI! 赵海教授团队研发的全球首个宏观模拟人脑机制的大语言模型BriLLM,彻底抛弃了Transformer架构,让AI的决策过程像人脑一样透明可解释。 这一突破获500万元专项经费支持,并被列入上海类脑智能颠覆性技术攻关项目。

一、为什么放弃Transformer?

当前主流AI大模型依赖的Transformer架构正遭遇三重天花板:算力黑洞般的高能耗、决策逻辑不透明的“黑箱”,以及无法处理无限长上下文的技术枷锁。 例如,训练GPT-4需消耗2.4亿度电,相当于3万户家庭全年用电量,而人脑完成同等认知任务仅需20瓦功率。 图灵奖得主杨立昆直言:“Transformer永远无法实现真正的通用智能! ”

二、人脑如何被“复制”进AI?

赵海团队从脑科学两项关键发现获得灵感:

静态语义映射:大脑不同区域分工明确,例如“房子”概念会激活特定皮层区域。 BriLLM直接将每个词元(如“苹果”“量子”)映射到有向全连接图的专属节点,让每个节点承载明确语义。

动态信号传导:模拟脑电波传播机制,让信号沿“最小阻力路径”在节点间流动。 当输入“夏天吃什么水果”,信号自动流向“西瓜”“芒果”等关联节点,像神经电流激活目标神经元般生成答案。 整个过程如同人脑思考般自然可追溯。

三、四大颠覆性突破

能耗骤降90%:通过“低频词元边共享”技术,20亿参数中文模型实际仅占用13%算力资源,训练成本仅为同级Transformer模型的十分之一。

100%透明决策:用户可实时追踪信号从“输入节点”到“输出节点”的完整路径,看清AI为何推荐“糖尿病人吃柚子”而非“西瓜”,彻底终结黑箱隐患。

无限记忆容量:信号自由传播机制突破上下文长度限制。 测试中处理百万字《辞海》无需任何架构调整,而Transformer模型需为长文本专门扩容。

多模态天然适配:视觉、听觉等感官信号可直接转化为新节点接入现有网络。 添加“闪电图像节点”后,模型能像人眼一样瞬间识别动态画面,传统芯片完成同等任务功耗高出数万倍。

四、上海打造类脑创新生态

2017年至今,上海已在类脑智能领域完成系统布局:

杨浦类脑产业集聚区:整合复旦大学类脑芯片团队、时识科技等企业,研制出功耗仅0.7毫瓦的“感算一体”动态视觉芯片,抓拍闪电如同人眼般轻松。

千亿基金矩阵护航:10家投资机构联合成立类脑智能未来产业基金,为初创企业提供百万级算力补贴,推动技术快速产业化。

模速空间加速落地:徐汇区建成6万平方米载体,汇聚商汤科技、阶跃星辰等400家大模型企业,形成从算力调度到终端产品的全链条生态。

五、中国团队的“双路线竞速”

除赵海团队的宏观人脑模拟路线外,中科院李国齐研究员正从微观尺度突破:

树突神经元模型:模仿人脑树突的多房室结构,让AI拥有多尺度记忆能力。 其研发的脉冲神经网络深度已从10层突破至500层,解决长序列建模难题。

百亿参数攻关:两大团队均瞄准百亿级类脑大模型研发,赵海计划两年内推出300亿参数中英文模型,李国齐团队则探索千亿规模通用架构。