大模型排行榜 推荐

发布时期:2024-12-03 属地:广东省 模型名称:腾讯混元助手大模型 备案单位:深圳市腾讯计算机系统有限公司 备案号:Guangdong-TencentHunyuan-20230901 备案时间:2023/9/14 HunyuanVideo 是腾讯推出的开源视频生成基础模型,拥有超过 130 亿参数,是目前最大的开源视频生成模型。该模型采用统一的图像和视频生成架构,集成了数据整理、图像-视频联合模型训练和高效基础设施等关键技术。模型使用多模态大语言模型作为文本编码器,通过 3D VAE 进行空间-时间压缩,并提供提示词重写功能。根据专业人工评估结果,HunyuanVideo 在文本对齐、运动质量和视觉质量等方面的表现优于现有最先进的模型

发布时期:2024-12-25 属地:浙江省 模型名称:通义千问大模型 备案单位:阿里巴巴达摩院(杭州)科技有限公司 备案号:ZheJiang-TongYiQianWen-20230901 备案时间:2023/9/12 QVQ-72B-Preview 是由 Qwen 团队开发的专注于视觉推理能力的研究型模型。该模型在多项基准测试中表现突出,在 MMMU 测试中达到了 70.3% 的卓越成绩,在 MathVista 达到 71.4% 的优异表现,展现了其在多学科理解和数学视觉推理方面的卓越能力。作为专门针对视觉推理优化的模型,QVQ-72B-Preview 在复杂场景理解和解决视觉相关的数学问题方面具有独特优势

发布时期:2024-12-26 属地:北京市 模型名称:求索对话DeepSeek Chat 备案单位:北京深度求索人工智能基础技术研究有限公司 备案号:Beijing-DeepseekChat-202404280016 备案时间:2024/5/13 DeepSeek-V3 是一款拥有 6710 亿参数的混合专家(MoE)语言模型,采用多头潜在注意力(MLA)和 DeepSeekMoE 架构,结合无辅助损失的负载平衡策略,优化推理和训练效率。通过在 14.8 万亿高质量tokens上预训练,并进行监督微调和强化学习,DeepSeek-V3 在性能上超越其他开源模型,接近领先闭源模型。

发布时期:2025-01-20 属地:北京市 模型名称:求索对话DeepSeek Chat 备案单位:北京深度求索人工智能基础技术研究有限公司 备案号:Beijing-DeepseekChat-202404280016 备案时间:2024/5/13 DeepSeek-R1 是一款强化学习(RL)驱动的推理模型,解决了模型中的重复性和可读性问题。在 RL 之前,DeepSeek-R1 引入了冷启动数据,进一步优化了推理性能。它在数学、代码和推理任务中与 OpenAI-o1 表现相当,并且通过精心设计的训练方法,提升了整体效果。

发布时期:2025-03-06 属地:浙江省 模型名称:通义千问大模型 备案单位:阿里巴巴达摩院(杭州)科技有限公司 备案号:ZheJiang-TongYiQianWen-20230901 备案时间:2023/9/12