视觉理解

夸克AI超级框升级 上线“拍照问夸克”功能:啥都能答

4月25日,阿里巴巴旗下的夸克AI超级框宣布推出一项创新功能——“拍照问夸克”。这一新功能基于先进的视觉理解和思考推理模型,能够更精准地理解和回答用户在物理世界中遇到的各类问题。在日常生活中,用户常常会遇到难以用文字准确描述的情况,尤其是在面对复杂的物体、表格和图形时。夸克的“拍照问夸克”功能通过精准识别图片中的人物、物体和细节,深入理解用户需求,并联想相关问题,从而提供更准确的答案。例如,用户在

火山引擎发布豆包1.5深度思考模型:结合视觉理解与智能项目管理

在近日举行的火山引擎FORCE LINK AI创新巡展上,火山引擎总裁谭待正式公布了豆包1.5深度思考模型,标志着这一创新技术将正式面向企业提供服务。豆包1.5不仅在基础功能上进行了升级,还引入了更多智能化的应用场景,助力企业实现更高效的数字化转型。谭待在发布会上表示,豆包1.5深度思考模型能够结合视觉理解,提供更多创新功能。例如,该模型能够根据用户上传的照片进行地貌分析,帮助旅行者在外出时更方便

通义+夸克,阿里AI要ToC

声明:本文来自于微信公众号 锌财经,作者:孙鹏越,授权站长之家转载发布。这一周,AI世界忙得不可开交。先是DeepSeek发布最新版本,V3-0324;然后阿里云通义千问开源更小尺寸的视觉理解模型Qwen2.5-VL-32B-Instruct。中国两大AI大厂轮番交替,持续给美国硅谷施加压力。DeepSeek的强大一如既往,但这一次,Qwen32B同样也吸足了眼球。Qwen,从幕后走上台前Qw