网站截图
发布时期
2025-01-20
属地:
北京市
模型名称:
求索对话DeepSeek Chat
备案单位:
北京深度求索人工智能基础技术研究有限公司
备案号:
Beijing-DeepseekChat-202404280016
备案时间:
2024/5/13

DeepSeek-R1-Distill-Qwen-7B 是基于 Qwen2.5-Math-7B 通过知识蒸馏得到的模型。该模型使用 DeepSeek-R1 生成的 80 万个精选样本进行微调,展现出优秀的推理能力。在多个基准测试中表现出色,其中在 MATH-500 上达到了 92.8% 的准确率,在 AIME 2024 上达到了 55.5% 的通过率,在 CodeForces 上获得了 1189 的评分,作为 7B 规模的模型展示了较强的数学和编程能力