发布时期:2025-01-20
属地:北京市
模型名称:求索对话DeepSeek Chat
备案单位:北京深度求索人工智能基础技术研究有限公司
备案号:Beijing-DeepseekChat-202404280016
备案时间:2024/5/13
DeepSeek-R1 是一款强化学习(RL)驱动的推理模型,解决了模型中的重复性和可读性问题。在 RL 之前,DeepSeek-R1 引入了冷启动数据,进一步优化了推理性能。它在数学、代码和推理任务中与 OpenAI-o1 表现相当,并且通过精心设计的训练方法,提升了整体效果。