DeepSeek 发布新论文:提出全新 mHC 架构

AI 资讯快报  • 2026-01-04 00:001次浏览
DeepSeek发布新论文提出全新(流形约束超连接)架构,解决传统超连接在大规模模型训练中的不稳定性问题,同时保持其性能增益。框架通过将残差连接空间投影到特定流形来恢复恒等映射属性,并结合基础设施优化提升效率。 更多详情...