惊爆!上海砸重金,力推类脑大模型挑战 Transformer 霸权
上海市科委设立"颠覆性技术研究"专题,重点支持非Transformer架构的类脑大模型研发。
赵海团队的"脑启发大语言模型"入选上海交大"2030计划"B类项目,获500万元经费,经费可自由用于算力采购。
挑战Transformer架构的动因
主流架构瓶颈:Transformer存在高算力消耗(如GPT-4训练耗电2.4亿度)、决策"黑箱化"、上下文长度受限三大缺陷。
权威质疑:图灵奖得主杨立昆指出Transformer无法实现通用人工智能(AGI);诺奖得主哈萨比斯称需"1-2个类似Transformer的新突破"。
核心技术突破:脑启发模型BriLLM
创新机制:
用"信号全连接流动"替代自注意力机制,模拟人脑语义编码(词元映射为节点)和信号传播(沿最小阻力路径激活节点)。
全球首个宏观尺度模拟人脑全局机制的大模型。
性能成果:
发布150亿参数中文模型(BriLLM)及中英文压缩版(20亿/10亿参数),性能对标GPT-1,开源代码与权重。
通过"低频词元边共享"技术,压缩版实际算力占用仅13%,能耗降90%。
四大颠覆性优势
能耗骤降:模拟人脑低功耗特性,计算成本仅为同级Transformer模型的1/10。
100%决策透明:节点对应明确语义,可实时追踪信号路径(例:解释为何推荐糖尿病人吃柚子而非西瓜)。
无限上下文:信号自由传播支持百万字《辞海》处理,无需模型扩容。
多模态天然适配:视觉/听觉信号可直接转化为新节点,学习方式接近人类(例:添加闪电图像节点后动态识别功耗仅0.7毫瓦)。
上海类脑智能生态布局
产业基建:杨浦区建设类脑产业集聚区,整合复旦类脑芯片团队(邹卓)、时识科技等企业,研发功耗0.7毫瓦的"感算一体"动态视觉芯片。
资本支持:10家机构联合成立类脑智能未来产业基金矩阵,提供百万级算力补贴。
应用生态:徐汇"模速空间"汇聚商汤、阶跃星辰等400家企业,形成算力调度-终端产品全链条。
双技术路线竞速
赵海路线(宏观):两年内开发300亿参数中英文模型,聚焦预训练、指令微调、高效推理。
李国齐路线(微观):中科院团队研发"树突脉冲神经网络",模拟神经元多房室结构,将脉冲神经网络从10层拓展至500层,目标千亿参数模型。
告别“黑箱”! 上海交大打造会“思考”的类脑大模型
上海科学家造出会“思考”的AI! 赵海教授团队研发的全球首个宏观模拟人脑机制的大语言模型BriLLM,彻底抛弃了Transformer架构,让AI的决策过程像人脑一样透明可解释。 这一突破获500万元专项经费支持,并被列入上海类脑智能颠覆性技术攻关项目。
一、为什么放弃Transformer?
当前主流AI大模型依赖的Transformer架构正遭遇三重天花板:算力黑洞般的高能耗、决策逻辑不透明的“黑箱”,以及无法处理无限长上下文的技术枷锁。 例如,训练GPT-4需消耗2.4亿度电,相当于3万户家庭全年用电量,而人脑完成同等认知任务仅需20瓦功率。 图灵奖得主杨立昆直言:“Transformer永远无法实现真正的通用智能! ”
二、人脑如何被“复制”进AI?
赵海团队从脑科学两项关键发现获得灵感:
静态语义映射:大脑不同区域分工明确,例如“房子”概念会激活特定皮层区域。 BriLLM直接将每个词元(如“苹果”“量子”)映射到有向全连接图的专属节点,让每个节点承载明确语义。
动态信号传导:模拟脑电波传播机制,让信号沿“最小阻力路径”在节点间流动。 当输入“夏天吃什么水果”,信号自动流向“西瓜”“芒果”等关联节点,像神经电流激活目标神经元般生成答案。 整个过程如同人脑思考般自然可追溯。
三、四大颠覆性突破
能耗骤降90%:通过“低频词元边共享”技术,20亿参数中文模型实际仅占用13%算力资源,训练成本仅为同级Transformer模型的十分之一。
100%透明决策:用户可实时追踪信号从“输入节点”到“输出节点”的完整路径,看清AI为何推荐“糖尿病人吃柚子”而非“西瓜”,彻底终结黑箱隐患。
无限记忆容量:信号自由传播机制突破上下文长度限制。 测试中处理百万字《辞海》无需任何架构调整,而Transformer模型需为长文本专门扩容。
多模态天然适配:视觉、听觉等感官信号可直接转化为新节点接入现有网络。 添加“闪电图像节点”后,模型能像人眼一样瞬间识别动态画面,传统芯片完成同等任务功耗高出数万倍。
四、上海打造类脑创新生态
2017年至今,上海已在类脑智能领域完成系统布局:
杨浦类脑产业集聚区:整合复旦大学类脑芯片团队、时识科技等企业,研制出功耗仅0.7毫瓦的“感算一体”动态视觉芯片,抓拍闪电如同人眼般轻松。
千亿基金矩阵护航:10家投资机构联合成立类脑智能未来产业基金,为初创企业提供百万级算力补贴,推动技术快速产业化。
模速空间加速落地:徐汇区建成6万平方米载体,汇聚商汤科技、阶跃星辰等400家大模型企业,形成从算力调度到终端产品的全链条生态。
五、中国团队的“双路线竞速”
除赵海团队的宏观人脑模拟路线外,中科院李国齐研究员正从微观尺度突破:
树突神经元模型:模仿人脑树突的多房室结构,让AI拥有多尺度记忆能力。 其研发的脉冲神经网络深度已从10层突破至500层,解决长序列建模难题。
百亿参数攻关:两大团队均瞄准百亿级类脑大模型研发,赵海计划两年内推出300亿参数中英文模型,李国齐团队则探索千亿规模通用架构。
热点资讯
- 2025-07-11黑暗光年传奇手游官网,黑暗光年免费仙位版本
- 2025-08-04周静波一张打码图曝光,瞬间击穿宋祖儿的体面假象
- 2025-07-31G视觉|2025全国皮划艇激流回旋锦标赛:激流勇进 逐浪凯里
- 2025-08-16殷桃在树下穿着红衣拍照, 让人联想到樱桃, 太有趣了
- 2025-07-21剧情绝佳的三本穿越重生必读小说,看完好想谈恋爱!
- 2025-08-31苏联解体后边界遗留隐秘冲突,莫斯科冬夜见证五大领土争端,克里米亚并非终点
推荐资讯
- 明确苏州救护车跨省转院接送病人怎么收费
- 对决法国! 中国女排备战淘汰赛曝光: 赵勇指点庄宇珊, 李盈莹微笑
- 全省优秀舞台艺术作品明起展演 观众可免费领票观看
- 温州iptv电视直播
- 传统车企哭晕在厕所:我们兢兢业业造车,为何干不过一个讲故事的


