本文作者:访客

阿里云通义开源首个多模态推理模型QVQ,视觉推理比肩OpenAI o1

访客 2024-12-25 20:04:10 77020 抢沙发
阿里云通义开源首个多模态推理模型QVQ,视觉推理比肩OpenAI o1摘要: 36氪获悉,12月25日,阿里云通义千问发布业界首个开源多模态推理模型QVQ-72B-Preview。QVQ展现出...

36氪获悉,12月25日,阿里云通义千问发布业界首个开源多模态推理模型QVQ-72B-Preview。QVQ展现出超预期的视觉理解和推理能力,在解决数学、物理、科学等领域的复杂推理问题上表现突出。多项评测数据显示,QVQ超越了此前的视觉理解模型Qwen2-VL,整体表现与OpenAI o1、Claude3.5 Sonnet等推理模型相当。目前,开发者可在魔搭社区和HuggingFace平台上直接体验。

阿里云通义开源首个多模态推理模型QVQ,视觉推理比肩OpenAI o1

阅读
分享

发表评论

快捷回复:

评论列表 (暂无评论,77020人围观)参与讨论

还没有评论,来说两句吧...