| 设为首页 | 加入收藏
阿里AI再摘一冠,大幅提高视觉对话世界纪录
2019-06-27 11:59  杭州网

近日, 在第二届视觉对话竞赛Visual Dialogue Challenge中,阿里AI击败了微软、首尔大学等十支参赛队伍,获得冠军。

阿里AI在视觉对话竞赛中得冠

视觉对话竞赛由美国佐治亚理工大学、Facebook人工智能实验室(FAIR)等机构联合全球视觉技术领域顶级学术会议CVPR发起,是目前视觉对话领域最权威的竞赛之一。

该竞赛要求参赛的AI在看完近万张图片后,回答出人类对于任一图片任一内容的提问。竞赛结果显示,阿里AI以74.57%的准确率获得冠军,将上一届比赛的纪录提高了16.82%。在相同的数据集中,人类的准确率仅为64.27%。

传统的视觉AI主要针对目标的检测和识别,例如识别出图片是否是一只猫,但对复杂场景中目标之间的逻辑关系理解、推理能力较弱,无法回答“这只猫旁边的男生穿了什么颜色的衣服”等复杂问题,也难以将图片信息转化为人类理解的语言输出。

阿里AI的突破在于提出了“递归探索对话模型”,综合集成了图像识别、关系推理与自然语言理解三大能力,它通过高效利用标注信息学习出模仿人类认知复杂场景的思维方式,能够有效识别图片里的实体以及它们之间的关系,推理出图片所描述的事件内容,并通过对上下文进行有效建模,理解人类提出的问题及真实意图,给出自然准确的回复。

视觉对话中,AI可以从容应对人类提问,左为AI,右为人类

视觉对话是近年来快速崛起的AI研究方向,目的在于教会机器用自然语言与人类讨论视觉内容。如果说视觉识别技术,让机器具备了视觉能力;那么视觉对话技术,则使得机器拥有了对真实视觉世界的理解与推断能力,意味着AI的认知能力将迈上新的台阶。

视觉对话技术有望人类提高地震救援效率

据了解,这项技术未来将被应用在人机交互诸多场景: 地震后在废墟中寻找幸存者的救援机器人,能够更加及时、高效地综合指挥指令和场景信息作出行动;视障人士可以通过提问阿里AI,理解网络照片中的内容,了解自身所处的周围环境;无人驾驶车辆对影响因子的意图理解会更为准确,乘客的乘坐体验更好。

来源:杭州网    作者:    编辑:赖正河    
上一篇:相互宝成员数超7200万 新一期公示救助人数增至150人
 【相关阅读】

活 动

更多>>

阿里巴巴举办公益颁奖盛典

5月13日晚,阿里巴巴橙点公益榜颁奖典礼在西溪园区揭幕,这是阿里专门为员工举办的一场公益“奥斯卡”

2019年315专题:信用让消费更放心

近年来,微商、团购、社交电商为获得错位竞争优势,主打低端商品,主动迎合农村消费者对

2018天猫双11活动专题

2018天猫双11已成为双11活动举办以来第10个天猫双11活动。2017天猫淘宝双11最终以1682亿元

曝光台

更多>>

科沃斯漏扫严重 松下清洁率最低

近日,中国消费者协会发布了20款扫地机器人比较试验结果,发现各款样机整体清洁性能差异较明显

网站简介 | 关于我们 | 广告服务 | 建站服务 | 帮助信息 | 联系方式

增值电信业务经营许可证:浙B2-20110366 | 信息网络传播视听节目许可证:1105105 | 互联网新闻信息服务许可证:国新网3312006002
网络文化经营许可:浙网文[2012]0867-091号 | 工信部备案号:浙ICP备11041366号-1 |  浙公网安备:33010002000058号
杭州网(杭州网络传媒有限公司)版权所有未经授权禁止复制或镜像
法律顾问:浙江智仁律师事务所律师 马宏利
Copyright © 2001 - 2017 Hangzhou.com.cn All Rights Reserved