央视新闻2024年10月11日发布:阿里通义千问发布最强视觉理解模型Qwen2-VL-72B!可理解20分钟以上长视频
⭐发布日期:2024年10月11日 | 来源:央视新闻
【新澳门精准资料期期精准最全】 |
【澳门六开彩结果】 |
【2024年新澳版资料正版图库】 | 【澳门49图库免费资料】 | 【2024澳门正版资料大全下载】 | 【最准的一肖一码】 | 【香港二四六资料大全一】 | 【2024新澳门002期管家婆】 | 【2823澳门新资料大全免费】 | 【新奥门正版资料大全资料】 |
【新澳门2024年资料大全管家婆】 | 【澳门跑狗图2024年图库大全】 | 【494949最快今晚开什么】 | 【澳门管家婆精准资料期期选一肖】 | 【今晚澳门码特开什么号码】 | 【看澳门正版资料大全】 | 【2024年澳门资料大全免费新版】 | 【王中王资料大全料大全一精准王】 |
快科技8月30日消息,阿里通义千问发布第二代视觉语言模型Qwen2-VL。其中,旗舰模型Qwen2-VL-72B的API已上线阿里云百炼平台。
据了解,Qwen2-VL在多个权威测评中刷新了多模态模型的最佳成绩,在部分指标上甚至超越了GPT-4o和Claude3.5-Sonnet等闭源模型。
2023年8月,通义千问开源第一代视觉语言理解模型Qwen-VL,成为开源社区最受欢迎的多模态模型之一。
短短一年内,模型下载量突破1000万次。目前,多模态模型在手机、车端等各类视觉识别场景的落地正在加速,开发者和应用企业也格外关注Qwen-VL的升级迭代。
相比上代模型,Qwen2-VL的基础性能全面提升。可以读懂不同分辨率和不同长宽比的图片,在MathVista、DocVQA、RealWorldQA、MTVQA等基准测试创下全球领先的表现。
此外,Qwen2-VL可以理解20分钟以上长视频,支持基于视频的问答、对话和内容创作等应用。同时,具备强大的视觉智能体能力,可自主操作手机和机器人,借助复杂推理和决策的能力,Qwen2-VL可以集成到手机、机器人等设备,根据视觉环境和文字指令进行自动操作。
该模型还能理解图像视频中的多语言文本,包括中文、英文,大多数欧洲语言,日语、韩语、阿拉伯语、越南语等。
通义千问团队从六个方面评估了模型能力,包括综合的大学题目、数学能力、文档表格多语言文字图像的理解、通用场景问答、视频理解、Agent 能力。
Qwen2-VL-72B 在大部分的指标上都达到了最优,甚至超过了 GPT-4o 和 Claude3.5-Sonnet 等闭源模型,在文档理解方面优势尤其明显,仅在综合的大学题目方面与GPT-4o 存在差距。
用户可通过阿里云百炼平台调用Qwen2-VL-72B的API:https://help.aliyun.com/zh/model-studio/developer-reference/qwen-vl-api
责任编辑:
【澳门必中一肖一码准一肖】 【澳门最快最准的资料免费大全】 |
【马会传真2024澳门】 【香港二四六结果十资料】 |
【宁夏特区红头文件】 【澳门六开彩天天正版免费资料大全】 |
【4949澳门免费资料内容资料】 【奥彩一肖一码100准中奖】 |
【2022澳门免费资料大全下载】 【澳门一肖一码一】 |
【澳门正版资料免费大全2021年】 【2024特马开码查询澳门】 【进口产品交哪些税】 |
发表评论
Dustin
5秒前:目前,多模态模型在手机、车端等各类视觉识别场景的落地正在加速,开发者和应用企业也格外关注Qwen-VL的升级迭代。
IP:32.88.8.*
刘小蕙
3秒前:返回搜狐,查看更多
IP:65.96.7.*
石可人
9秒前:aliyun.
IP:72.40.9.*