Qwen2.5-VL-72B-Instruct

￥4.13/ M Tokens

属地:浙江省
模型名称:通义千问大模型
备案单位:阿里巴巴达摩院（杭州）科技有限公司
备案号:ZheJiang-TongYiQianWen-20230901
备案时间:2023/9/12

Qwen2.5-VL 是 Qwen2.5 系列中的视觉语言模型。该模型在多方面有显著提升：具备更强的视觉理解能力，能够识别常见物体、分析文本、图表和布局；作为视觉代理能够推理并动态指导工具使用；支持理解超过 1 小时的长视频并捕捉关键事件；能够通过生成边界框或点准确定位图像中的物体；支持生成结构化输出，尤其适用于发票、表格等扫描数据。模型在多项基准测试中表现出色，包括图像、视频和代理任务评测

Qwen2.5-VL-72B-Instruct

相关大模型

QwQ-32B

Wan2.1-I2V-14B-720P-Turbo

Wan2.1-T2V-14B-Turbo

CosyVoice2-0.5B

Qwen/Qwen2.5-VL-7B-Instruct

DeepSeek-R1-Distill-Qwen-1.5B

Qwen2.5-VL-72B-Instruct教程

Qwen2.5-VL-72B-Instruct：智能时代的多模态革命

探索Qwen2.5-VL-72B-Instruct：引领AI多模态的未来

探索Qwen2.5-VL-72B-Instruct：跨模态理解的强大工具

Qwen2.5-VL-72B-Instruct：重新定义多模态AI的未来

探索Qwen2.5-VL-72B-Instruct：重新定义多模态交互体验