原标题:学习也需要监督,让我们换种方式对待AI

今早开例会,才发现最近说了太多的AI。不过看看奥迪A8——L3级自动驾驶的量产车都已经出街,而像凯迪拉克CT6等等眼见就要迎头赶上,说点啥也绕不过AI了吧。

而说到全自动驾驶车辆的AI学习,还真是需要勤勉有加:得学会避让车辆、识别红绿灯、辩识警灯、识别行人,甚至还要学会正确避让跳跃的袋鼠……可无论是Waymo、Uber还是汽车大咖们到底是如何教AI看懂、听懂、判断和决定的呢?

当你无聊时,都在干点啥?农药还是刷朋友圈?可山的那边、海的那边有一个宠物撰稿人安阿姨就不同了,人家无聊的时候打开一个应用程序,根据程序随机给出的图片细致地涂涂画画。在玩秘密花园之类的涂色游戏吗?仔细一看填涂的并不是纹饰图案,而是一张张街景的图片。她将这些图片放大、逐像素地用不同的颜色标记出信号灯、交通指示牌、电线杆、安全锥……并画出一个个边框或“盒子”。

天哪,还有这么无聊的游戏?但看着安阿姨如此认真细致地乐此不疲,奇怪了么?来听听安阿姨怎么说吧:

当初你的爸爸妈妈第一次带你上街的时候一样一样耐心指给你看的时候,他们也没嫌枯燥啊!更何况去年我就这么闲来标注几张图片,还挣了300美金呢!

一有空闲时间,就打开App领取图片,并为目标物画出轮廓或“沙盒”

并根据图片上目标物的不同种类,分别涂上不同的颜色。

除了在手机上操作以外,电脑上也可以完成任务挑战,甚至还可以承担更精细的边框勾勒工作。

而且这个“游戏”和我们平时玩的游戏设置没什么不同,都是要达到一定数量与质量的累积才能进入更高等级的挑战关卡。

每一幅图片完成之后的样子,是不是也特别有成就感呢?

“玩家”们把这些图片上传后,系统将把这些标注转化成为计算机能够理解的语言注释,工程师们把这称之为“语义分割掩码”【semantic segmentation mask】。

让AI浏览过足够多标注过的图片,一遍遍强化对目标的识别能力和记忆,只要训练样本足够多,最终一天AI便能以类似人类的方式去理解标的物。

就像南加州大学信息科学研究院【USC Information Sciences Institute】专门从事计算机视觉研究二十多年的执行总监、副院长Premkumar Natarajan所说:“这是唯一的办法!虽然我们也对无监督学习做了一些有希望的研究,但是现在看来,人工智能的智力取决于其监督学习的训练数据的质量与数量。”

监督学习?无监督学习?

副院长先生你到底在说什么?

你听懂了么?

我们用熟悉的吴恩达博士当年在斯坦福大学授课时的定义和案例来说明吧:

监督学习——

监督学习中,对于数据集中的每个数据都有相应的正确答案,而(训练集) 算法就是基于这些来做出预测。

吴博士给出的例子是,比方说你现在想要买一套房子,可这么热的天你肯定不愿意一个楼盘一个楼盘地去蹓跶。怎么办呢?于是你搜集了一下你所在城市的房价数据,之后在电脑上建立了一个模型:纵轴是你所在城市各区域的单位房价(哪个区域平均多少钱/平方米),横轴是房屋面积。

这样你就可以躺在沙发上玩城市地图飞镖了:“嘿,我飞中了人民西路,那个位置120平方的房子大概得多少钱?”

说回到我们自己的领域,吴博士的意思是监督学习就是帮AI打好标签,监督它得到正确答案。

就只拿红绿灯来说:

只要安阿姨们标注的样本足够多,AI就能学会识别如上图一般虽然长相都不一致,安装方式也不尽相同的这些装置都是红绿灯,都得红灯停绿灯行。

据这家叫做Mighty AI的AI数据训练营所说,正在与至少10家汽车制造商合作。就拿他们近期公布的西雅图地区部分路线数据包来说,合作的汽车制造商可以直接用于训练自己的全自动驾驶车辆AI做视觉识别。有可能只用不到几天(或者更短)的时间,就能把这一地区情况摸得烂熟,而不用自己再重新劳心劳力地去实测、标记、训练、纠错……。

这样想想也怪过瘾的,虽然那小小的积分和奖金比起如此枯燥的游戏来说未免太不匹配,但过几年全自动驾驶车辆出街的时候,自己能够站在街道边上:“你们,可都是经过我训练的!”

有没有感觉像是正在创造历史的主角?你难道不想去试试么?

责任编辑: