如果deepseek r1推理激活参数只有37B,是不是意味着37B的大模型就可以在垂直领域有效?

知乎话题榜  • 2026-05-26 22:571次浏览
如果deepseek r1推理激活参数只有37B,是不是意味着37B的大模型就可以在垂直领域有效?
训练一个垂直领域的大模型,大概需要多少参数的大模型。训练一个37B的大模型能在垂直领域达到和deepseek r1一样的效果吗

查看详情...