DeepSeek 新年发论文,简单说下它到底厉害在哪👇 论文名:《mHC:Manifold-Constrained Hyper-Connections》 DeepSeek 创始人兼 CEO 梁文锋也在作者名单中 这是偏底层架构的技术论文,用大白话总结三点: 1️⃣ 大模型更稳了 之前的 HC(升级版残差连接)很猛,但训练容易炸, mHC

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)