AI大模型导航-大模型排行榜

发布时期:2024-12-03 属地:广东省模型名称:腾讯混元助手大模型备案单位:深圳市腾讯计算机系统有限公司备案号:Guangdong-TencentHunyuan-20230901 备案时间:2023/9/14 HunyuanVideo 是腾讯推出的开源视频生成基础模型，拥有超过 130 亿参数，是目前最大的开源视频生成模型。该模型采用统一的图像和视频生成架构，集成了数据整理、图像-视频联合模型训练和高效基础设施等关键技术。模型使用多模态大语言模型作为文本编码器，通过 3D VAE 进行空间-时间压缩，并提供提示词重写功能。根据专业人工评估结果，HunyuanVideo 在文本对齐、运动质量和视觉质量等方面的表现优于现有最先进的模型

QVQ-72B-Preview

发布时期:2024-12-25 属地:浙江省模型名称:通义千问大模型备案单位:阿里巴巴达摩院（杭州）科技有限公司备案号:ZheJiang-TongYiQianWen-20230901 备案时间:2023/9/12 QVQ-72B-Preview 是由 Qwen 团队开发的专注于视觉推理能力的研究型模型。该模型在多项基准测试中表现突出，在 MMMU 测试中达到了 70.3% 的卓越成绩，在 MathVista 达到 71.4% 的优异表现，展现了其在多学科理解和数学视觉推理方面的卓越能力。作为专门针对视觉推理优化的模型，QVQ-72B-Preview 在复杂场景理解和解决视觉相关的数学问题方面具有独特优势

DeepSeek-V3

发布时期:2024-12-26 属地:北京市模型名称:求索对话DeepSeek Chat 备案单位:北京深度求索人工智能基础技术研究有限公司备案号:Beijing-DeepseekChat-202404280016 备案时间:2024/5/13 DeepSeek-V3 是一款拥有 6710 亿参数的混合专家（MoE）语言模型，采用多头潜在注意力（MLA）和 DeepSeekMoE 架构，结合无辅助损失的负载平衡策略，优化推理和训练效率。通过在 14.8 万亿高质量tokens上预训练，并进行监督微调和强化学习，DeepSeek-V3 在性能上超越其他开源模型，接近领先闭源模型。

DeepSeek-R1:671B

发布时期:2025-01-20 属地:北京市模型名称:求索对话DeepSeek Chat 备案单位:北京深度求索人工智能基础技术研究有限公司备案号:Beijing-DeepseekChat-202404280016 备案时间:2024/5/13 DeepSeek-R1 是一款强化学习（RL）驱动的推理模型，解决了模型中的重复性和可读性问题。在 RL 之前，DeepSeek-R1 引入了冷启动数据，进一步优化了推理性能。它在数学、代码和推理任务中与 OpenAI-o1 表现相当，并且通过精心设计的训练方法，提升了整体效果。