网站截图
发布时期:2025-01-20
属地:北京市
模型名称:求索对话DeepSeek Chat
备案单位:北京深度求索人工智能基础技术研究有限公司
备案号:Beijing-DeepseekChat-202404280016
备案时间:2024/5/13

DeepSeek-R1-Distill-Qwen-1.5B 是基于 Qwen2.5-Math-1.5B 通过知识蒸馏得到的模型。该模型使用 DeepSeek-R1 生成的 80 万个精选样本进行微调,在多个基准测试中展现出不错的性能。作为一个轻量级模型,在 MATH-500 上达到了 83.9% 的准确率,在 AIME 2024 上达到了 28.9% 的通过率,在 CodeForces 上获得了 954 的评分,显示出超出其参数规模的推理能力