中新网杭州12月23日电(赵小燕)近日,美国计算机协会(ACM)公布了2015年度杰出科学家名单,在上榜的两位亚裔学者中,阿里巴巴图像搜索的领军人物、阿里巴巴搜索事业部研究员华先胜位列其中。国际电气与电子工程师协会(IEEE)也在近期公布了华先胜当选2016年度IEEEFellow(IEEE会士)的消息,以嘉奖其“为多媒体内容分析和图像搜索做出的突出贡献”。
两大奖项的背后,不仅意味着阿里图像搜索技术已经获得国际最顶尖学术圈的认同,也让“拍立淘”这一阿里搜索“大杀器”再次获得关注。
数据显示,华先胜与同事们推出的“拍立淘”等王牌产品,正在被越来越多的手淘用户使用和喜爱:2015年双11当天,千万消费者使用“拍立淘”购买了数千万元的商品。
点击手淘搜索框里的“相机”图标,对准喜欢的商品,或者把商品拍成相片,手淘就会自动帮你找同款——移动时代的这种炫酷的“以图搜图”,与以往的搜图索行为大相径庭。
“双11”千万用户拍立淘扫货
得到国际同行的高度关注和认同,华先胜告诉表示记者,其原因在于背靠淘宝数十亿级的商品图片库,“与通用搜索不同的是,电商场景中,以图搜商品是用户的‘刚性需求’。”
无论是在杂志电视上,还是身边街头,看到一件心仪的商品,可能难以用文字描述,却可以拍成照片,上传到手淘的“拍立淘”找同款。在“拍立淘”背后默默发挥作用的,就是图片搜索这一可视化搜索方式。
阿里巴巴集团公布的资料显示,2015年双11当天,千万消费者使用了“拍立淘”功能,引导了超过数千万元的销售额。而拍立淘上线一年以来,拍立淘所覆盖的类目范畴,已经从最开始的女装,发展到目前的男女装、鞋包、配饰、食品、数码、家居、日用百货、内衣、瓶饮等十余个类目。
与通用搜索主要依靠字节不同,图像搜索被主要定义为“以图搜图”。据华先胜介绍,图像搜索的第一步是训练计算机进行图像理解,也就是通过计算机将图片中的要素,包括人像、颜色、纹理等具体特征以及深度学习产生的图像描述,转化为类似文字的“视觉词”,编成索引之后,才能再进行第二步——图像搜索。
从20世纪90年代开始,国际上就开始了对图像搜索的研究,但直到2008年前后,计算机开始能够处理大量图像,图像搜索技术才得以突飞猛进的发展。
2008年,还在微软亚洲研究院工作的华先胜,就因在图像和视频搜索方面的尝试,获得了由《麻省理工学院技术评论》颁发的“全球35位35岁以下的杰出青年创新人物(MITTR35)奖”。
评委会在颁奖词中写道:“有效的基于内容的视频搜索仍然还有很多困难没有解决。而华先胜希望通过自动识别图像和视频中物体、场景、事件和其他语义特征来攻克这个壁垒。”
但当时能解决的,也仅仅是同图和近似图片的搜索,图像搜索仍有很多未知领域有待探索。在华先胜看来,能推动图像搜索下一步突破的关键有三点:深度学习,大数据分析和大量用户使用反馈。谷歌等公司虽然擅长通用搜索,但图像搜索方面缺乏“刚性”的应用场景,无法积累大量真实的数据和用户。
环顾国内外,似乎只有阿里巴巴能够同时具备这三个条件。
“电商平台是图像技术最具用户’刚需’的应用场景,特别是以图搜图技术,目前只有电商场景才可以实实在在地产生可观的实际价值,而从另一个角度看,电商平台上大量的用户也是正是推动图像技术发展和应用的基础。”华先胜表示,阿里得天独厚的平台优势是吸引他从美国回来,加入阿里搜索团队的重要原因。
阿里图像搜索欲弯道超车
作为行业的翘楚人物,华先胜另一项为业界瞩目的成绩,就是设计并实现了不需要“人工标注训练数据”就能产生识别任意目标的图像识别系统。
“之前,图像识别需要要人工去给图像贴标签(Label),让计算机从这些数据中学习出识别模型,但我们提升了一步,训练计算机自己去找数据,建立自动识别的模型。比如要识别和搜索不同种类的花卉,不用标注900多种花卉的图片,而是直接输入花卉的名称列表,计算机就可以自行去网上找数据、进行清洗、补充、学习,然后就能进行图像识别了。”
华先胜介绍,这一技术可以适用于多种场景的图像搜索,比如明星脸识别,不用输入“范冰冰”的照片,计算机可以从网上自动学习辨认。
10月27号,在澳大利亚举行的国际顶尖多媒体学术会议ACMMultimedia2015上,华先胜代表阿里的图像搜索团队,向在场几百名与会专家分享了“拍立淘”和虚拟化妆等电商应用,引起在场同行惊叹。对此,华先胜感叹说,“普通用户会觉得好玩,但圈内人会知道我们目前做的一切,包括‘拍立淘’准确度的提升多么难得,有多大的含金量。”
随着近年来深度学习技术在图像分析和识别领域的广泛应用,图像的描述(特征)有了非常大的进步,而阿里的大量商品图像数据和用户数据,包括用户使用反馈数据的挖掘和回流,也使得电商平台搜索结果的相关性不断提升,“拍立淘”的用户UV在过去半年内猛增了两倍多。
比如,同样一件外套,无论是挂在屋内的衣架上,还是在郊外穿在模特身上,“拍立淘”都可以把它相当准确地识别出来。而从智能到更智能,阿里的团队还在继续向图像搜索的“地心”推进,包括任意图像的语义相同或相似图的检索,也是华先胜搜索团队希望下一步攻克的课题:因为用户在用“拍立淘”时拍什么都有可能,可能不是商品,可能是任何物品和场景,如何准确识别、并返回对用户有价值的信息?
2015年底,美国计算机协会(ACM)公布了2015年度杰出科学家名单,华先胜作为仅有的两位亚裔学者之一位列其中。ACM创立于1947年,是国际上历史最悠久、规模最大、最权威的计算机专业学会,有“计算机界诺贝尔奖”之称的图灵奖即由该组织评选颁布。而获得“ACM杰出科学家”称号的,必须是在计算机业界中拥有15年以上的从业经历并作出巨大成就和影响的研究人员。
与此同时,国际电气与电子工程师协会(IEEE)也公布了华先胜当选为2016年度IEEEFellow(IEEE会士)的消息。IEEE是全球最具影响力的国际学术组织之一,目前在全球160多个国家拥有超过40万会员。IEEEFellow是该组织授予的最高荣誉,在学术科技界被认定为权威的荣誉和重要的职业成就,当选人数每年不超过IEEE会员总人数的0.1%。
在被国际学界关注的同时,有分析人士表示,借助图像搜索技术的领先,阿里搜索也极有可能在视觉时代实现“弯道超车”。(完)