几个星期前,纽约举行了LDV视觉峰会。该峰会专注于计算机视觉的高潜力领域。它涵盖了从3D成像,VR深入学习到Facebook实时视频的各个领域。这个领域在各个行业都得到密切关注。 计算机视觉的潜力不可小视 LDV峰会创始人Evan Nisselson在LDV视觉峰会开场白中表示:现今,被链接在一起的相机和视觉传感器可以说是无处不在。这些无处不在的录像和实时大数据,可组合成智慧建筑。其能够根据人的运动量调节能量分配。这也将引领智能家园的到来。那时,你的镜子可以告诉你体重是否增加,你喝了多少酒。这都得益于内置的3D扫描仪和气体传感器。 而且,一旦这成为现实,镜中广告就可以让你买到低热量食物以及阿司匹林,并在几分钟内直接送到浴室交付给你。 计算机能看到人类看不见的东西 计算机并不只通过我们现在这个领域所知道的图像识别方式来“看”世界(计算机通过将图像分解成像素来认知世界)。计算机视觉依赖于可实时访问的大数据,地理定位,传感器,超声波,和其他类型的数据(如热成像),可以让一台电脑“看到”人类无法看到的东西:例如气体,热量等。 计算机视觉的应用远远超过处理大量图像这个范畴。它除了快速识别那些人已经可以看到的东西,真正的作用是处理那些人看不到的东西。基于扩充内存,可以“看”到气体泄漏。计算机视觉通过多个实时渠道将使超人的感觉变为现实。 目前我们还没有这种技术。正如康奈尔大学计算机视觉技术教授Serge Belongie所说的那样:“正如你现在看到的计算机视觉领域中的状态,我们无法在人们没有具象概念的情况下,告诉一个人某个东西是什么。我们真能告诉人们的是,像香蕉和自行车这种看见的东西。”但,这就是进步,将来计算机视觉能够而且将会通过照片中提取出来的信息,告诉人们更多的数据。 如果我们得不到足够的训练数据,我们会变得停滞不前 深度学习网络,低成本以及更快计算能力的计算机,使得判定图像识别能力的游戏规则已经被改变。但除非它们有机会获得大量的图像训练数据,否则这些辉煌的算法就什么也不是。就说医学影像所面临的问题:绝大多数可被用于训练数据的图片是专有的,基本被这两个庞然大物所持有:谷歌Facebook。考虑到目前用户共享和上载在这些公司消费平台上的数据量,这一趋势没有明显放缓的迹象。就像Greylock的合伙人Josh Elman接受记者采访时提醒的一样,它们会变成计算机视觉发展道路上的潜在障碍,如果两家大公司一直持有所有的训练数据的话。 VR和AR需要计算机视觉 一些人认为,现在虚拟现实(VR)和增强现实(AR)被过度炒作。而把计算机视觉带入这两项技术纯属能源浪费。不过,VR与AR这两种技术都需要长期的发展。作为进一步提升,它们都需要高品质的计算机视觉功能来完善其技术(如使用图像识别来提高VR 的“互动”形式)。 很多人把今天的VR技术比做90年代中期的互联网:或许它目前还不是主流可获利的技术,但在将来会被广泛应用。计算机视觉技术越是先进,它的功能将吸引更多的人们来关注VR和AR,也会使得其更加实用并变得可盈利化。 计算机视觉已经在人身安全方面增加了投入力度 除了深度学习和AI,另一项大型科技的发展趋势就是机器人。是的,大多数机器人会需要(并且绝对需要)计算机视觉。从掌管流水线检验到所做的一切,都会需要这项技术。例如,Nanotronics公司使用图像识别来寻找计算机内存晶圆的缺陷,这比使用人类更精确,更快速。 通过LDV视觉峰会我们可得知,现在仍然是计算机视觉发展的初期。但是,目前的创新有一个光明的未来,无论是在业务层面和更广泛的社会层面。研究还证实,令年轻工程师兴奋的是:相较以往,会有更多的机会来改变产业内一部分的游戏规则。 |