阿里云通义开源首个多模态推理模型QVQ,视觉推理比肩OpenAI o1
摘要:
36氪获悉,12月25日,阿里云通义千问发布业界首个开源多模态推理模型QVQ-72B-Preview。QVQ展现出...
36氪获悉,12月25日,阿里云通义千问发布业界首个开源多模态推理模型QVQ-72B-Preview。QVQ展现出超预期的视觉理解和推理能力,在解决数学、物理、科学等领域的复杂推理问题上表现突出。多项评测数据显示,QVQ超越了此前的视觉理解模型Qwen2-VL,整体表现与OpenAI o1、Claude3.5 Sonnet等推理模型相当。目前,开发者可在魔搭社区和HuggingFace平台上直接体验。
还没有评论,来说两句吧...