最新资讯
纯蒸馏模型 SOTA 呈现!直接 SFT 本钱直降 50 倍,数据已悉数开源
a-m-team 又发新论文了。这个团队上星期刚刚在 Hugging Face 低沉开源了32B稠密模型,但在多项要害推理评测中打败了 DeepSeek-R1,并与超大规模的 MoE 模型Qwen3- ...
a-m-team 又发新论文了。这个团队上星期刚刚在 Hugging Face 低沉开源了32B稠密模型,但在多项要害推理评测中打败了 DeepSeek-R1,并与超大规模的 MoE 模型Qwen3- ...