李飞飞四大视角看视觉智能:AI会改变世界,谁改变AI

时间:2017-01-01    信息来源:企顺宝

谈及计算机视觉领域的青年领袖,应该没有人比李飞飞更有代表性。作为斯坦福大学计算机系终身教授、Google Cloud首席科学家,李飞飞已然引领着学术界和产业界密切结合的探索新方向;而其作为一位女性的角色,又让她在人工智能多样性的探索中有着自己崭新且不同的视角。

在1月15日,未来论坛2017年会暨首届未来科学大奖颁奖典礼上,李飞飞作为人工智能领域的代表,发表了题为《视觉智能探索(The  Quest  for  Visual  Intelligent)》的主题演讲。演讲中,李飞飞从生物领域视觉的出现开始娓娓道来,进而阐述了计算机视觉探索过程中的四大视角:从孩子成长、大脑发展、技术从业者、教育者和母亲的角度,如何看待计算机视觉和人工智能。

演讲的最后一个部分,李飞飞提出了这样的问题:人工智能AI会改变世界,但这里真正的问题是,谁会改变AI?由此,她鼓励人工智能多样化的发展,让更多人更多元的文化参与到相关研究和产业中来,这样我们会看到技术发现上的大爆炸,使我们的世界变得更好。

(李飞飞在1月15日未来论坛2017年会上发表演讲 图 | 魏子敏)

以下内容基于李飞飞演讲(原演讲为英文),在不改变原意的情况下部分有删改:

今天我想跟大家分享一下计算机视觉方面最新的进展。

大概5亿年前,一些非常简单的生物生活在海洋中,捕获猎物、或者成为别人的食物。动物世界在当时非常简单,只有一些简单的物种存在,后来可能是出于偶然或者“上帝之手”,某种生物衍化出了第一双真正意义上的“眼睛”,这时的眼睛还很简单,就像我们最初最简单的照相机一样。

视觉的出现让生物世界大不一样:生物物种变得更加有活力和积极,捕猎者可以自发进攻,被捕猎的生物也会寻找更隐蔽的地方躲藏起来,避免自己成为它人的食物。

在很短的时间内,生物物种数量以惊人的速度增加,这也是视觉发展的一个结果——寒武纪大爆发。寒武纪大爆发之后,视觉就在动物中发挥着非常重要的作用,帮助它们寻找食物、帮助它们躲避敌人等。作为人,我们也是一样的,我们也用视觉支持我们的生活、我们的工作、我们的交流,让我们更好地了解世界。

人类社会还处于“失明”状态 

事实上,在5亿年的进化之后,视觉已经成了我们人最重要的感知系统,我们的大脑中有一半的功能都是和视觉系统联系在一起的,动物们大概在5.3亿年前就看到了世界的光明,而对于我们的机器和计算机来说,整个世界还是黑暗一片。

尽管,目前到处都是监控器,但是当一个孩子在泳池溺水时,机器并不能提醒人类;目前每一分钟我们都有成百上千万小时的视频上传到YouTube或者Facebook的服务器上,但是我们仍然无法根据内容进行视频搜索;现在无人机可以在非常广的范围航行,但我们还无法根据无人机拍摄的图景标记出地球环境。总而言之,人类社会还处于“失明”状态,因为即便是最智能的机器,目前还没有视觉能力。

一个小目标:让计算机视觉 为数字世界带来光明 

作为计算机视觉的科学家,我们希望使用能够学习视觉世界的人工智能算法来识别图像和视频,我们有这样一个小目标,让计算机视觉为数字世界带来光明。

相关资讯