国际机器视觉技术的未来展望

机器视觉24

本段内容翻译整理自前美国自动化工业协会主席 Mr. Perry West 的 The Future Starts Today”。

千百年来,对未来的预测是人类永恒的话题。当历史步入瞬息万变的现代社会,随着科学发展和技术变革给人类社会带来翻天覆地的变化,占卜未来已经不再局限于的对宇宙和生命的探索,在市场化的社会形态中,谁能够准确预知未来技术的发展,谁就能在激烈的竞争中赢得先机,从而获得飞速的发展。前美国自动化工业协会主席 Mr. Perry West 为中国机器视觉人带来了题为“The Future Starts Today”的演讲,老先生用其 30 年机器视觉行业的丰富经验,与我们一同分享了机器视觉行业的前世今生,并启发我们如何用科学的视角来展望技术发展的未来。

下文是我们整理的讲稿内容,与大家一起共享。

Vision China 2009

我非常高兴今天能参加本届 Vision China,尤其是在今天这个时刻。最近我们迎来了机器视觉行业一个又一个的里程碑事件,图像与视觉行业正在发生着一场翻天覆地的变革,未来将从今天起航!

相信我们在座的每个人怀着学习新知识的愿望相聚在这里,都希望能够能学到新的知识,因为我们都渴望拥有美好的未来。那今天,我愿与大家分享我的观点,希望这些观点对你们有意义,并能帮助你们的公司在未来拥有更好的优势。

首先给大家讲一件我曾亲身经历的事。许多年前,我曾参加一家美国公司的紧急高层会议。那家公司在当时是美国自动化行业机器视觉设备市场份额最高的企业,其产品客户满意度很好。但他们遇到了严重的财务困难,没有资金引进新技术。他们问题是:如果不进行技术更新和产品升级,公司是否能够存活下去?当时,尽管我知道我的观点会对他们的决策有很大影响,但我还是坦诚地说“不行,没有技术更新,公司无法存活下去。”就这样,这个公司从此被关闭了。但我想说的是,希望不会有类似的情况发生在我们在座的各位企业身上。

这个故事告诉我们,掌握未来的技术是企业成功的关键。那么,如何预测机器视觉行业的未来呢?让我们来从三个方面来考虑:
首先,以往哪些重要技术进步对我们现在的应用有着巨大的影响?

其次,需要关注新技术的哪些方面?

最后,新技术的突破是可以预见的,如何找到线索?

从这些角度考虑,会让我们更好的预见未来的技术趋势。

技术的发展分为两类,一类是技术的进步,另一类是技术变革。技术进步是指发展和优化现有的技术,我们每一位同事都可能在为技术进步做着贡献。而技术变革是指翻天覆地的变化,这些技术不仅彻底地改变了产品形态,甚至改变人们的工作模式和企业的商业模式。

回顾机器视觉的历史,为这个行业带来重大变革的三项技术是:电视机、半导体和电脑。

电视机:

电视机

电视机出现之前,人们最主要的娱乐方式是听收音机,后来“WOO !”,电视机横空出世。在改变人类娱乐方式的同时也开启了机器视觉行业的发展。最早的机器视觉系统出现于1967 年,采用闭路电视成像,然后将视频信号传输到电子电路中,来检测工件。当时采用电视机的理由仅仅是因为这是我们唯一可以获得物体图像的途径,尽管隔行扫描,模拟信号,固定的分辨率都不是我们所喜欢的,但是我们别无选择。

此后,又一次电视技术的变革同样给机器视觉带来巨大的影响,这就是高清电视HDTV 制式。自从今年年初美国强制推广HDTV 以来,很多国家都有各自的HDTV 计划,中国也正在进行。HDTV 为机器视觉带来了更高的图像分辨率、逐行扫描以及数字信号。

半导体:

半导体

1947 年贝尔实验室研制出第一个晶体管,拉开半导体行业的序幕。又过了14 年,当1961 年在德州仪器的Jack Kilby 和仙童半导体的Rorbert Noyce 同时研发出集成电路时,才开始了这个行业的飞速发展历程。由于Kilby 的发明更早几天,而最终被授予了该项技术的专利。

半导体技术的发展给机器视觉奠定了重要的技术基础,早期的电视摄像机都是采用真空电子管进行成像,而半导体技术给我们带来的真正的固态成像芯片(solid-state image sensor)。就在前几天,让我们整个机器视觉业兴奋的是,Willard Boyle 和George Smith 因为他们在1969 年发明了CCD 图像传感芯片的杰出贡献而被授予了2009 年诺贝尔物理学奖。

CCD 技术和CID 及MOS 成像传感技术一同,让我们拥有了更加小巧、轻便、稳定和鲁棒的相机,同时也开启了一个新的行业领域,即数码摄像。

半导体技术不仅让我们更容易的能看到影像,同时也让系统拥有了会思考的大脑。

早期的机器视觉系统完全是依靠硬件电子电路来处理图像,这些电路的处理速度和图像采集速度同步,而且灵活性很差。

这时有一个划时代的产品,微处理器出现了。

微处理器

Intel 公司在1947 年开发微处理器microprocessor,不仅在技术上获得了迅速的成功,而且真正开启了数字处理时代。而在今天,开发一套没有应用一片微处理器的视觉系统,几乎是难以想象的事。

个人电脑:

微处理器的诞生衍生出另一个重要的行业,那就是“家用电脑”。“家用电脑”一开始仅仅是一个超级宠物,当苹果公司基于他们的可视化计算软件VisiCalc 在家用电脑领域取得了巨大的商业成功后,人们才开始意识到它的潜力。

1981 年,IBM 公司经过慎重的决策,决定全力进军个人电脑行业。这个计算机行业的蓝色巨人立刻给个人PC 市场罩上了荣誉的光环,从此也稳步奠定了机器视觉行业的PC 之路。

-------------------------------------------------------------------

在上一章回中我们回顾了电视、半导体和电脑技术在机器视觉历史上发挥的巨大作用。面临如此多的机遇和挑战,未来的机器视觉会如何发展呢?

尽管对系统可能有各种各样的要求,但是如果能关注以下三个方面,可能让我们拥有更大的优势。

1. 更高性能的图像传感器,高分辨率和高灵敏度;

2. 系统在复杂环境下的稳定性和适应性;

3. 系统的易用性,包括系统自身具有适应具体应用的自我学习能力。

Five Future Enablers 五大驱动因素

为了更深入地探讨这三个方面,那就让我们来看看哪些行业的发展会给机器视觉行业带来重大的影响吧。我认为以下五个行业的发展会对视觉技术产生至关重要的影响,他们分别是:

  1. 数码摄影
  2. 半导体
  3. 自动驾驶
  4. 安防
  5. 互动娱乐
  6. 数码摄影:Smile 笑一下

在机器视觉领域,我们销售数以万计的相机;而在数码影像领域应用的相机数量将是数千万的量级。很显然,数码摄影将给图像传感行业带来的影响将远比机器视觉更重大。幸运的是,在数码摄影应用上对芯片技术指标的期望和要求,与机器视觉行业的要求是基本一致的,我们都希望能够拥有更高的分辨率和更高的灵敏度。

分辨率Resolution

对于半导体成像芯片而言,有两种提高分辨率的途径,一是在不改变单个像元大小的前提下扩展芯片的尺寸;另外就是缩小单个像元的尺寸以在同样的芯片面积上拥有更多的像元。

下图是一张放大后的CMOS芯片,用方框标出的部分是一个成像单元。固态成像芯片的成本并非与他的尺寸成正比。制造一个高分辨率的大面阵的芯片会大大增加芯片的成本。

通常,图像传感器芯片的像元尺寸都在4um到7um之间。尽管Sony公司一年前宣布他们正在设计开发1.2um像元的芯片,但这么小的像元并不能充分发挥它在分辨率上的优势。镜头光学分辨率的极限大概是在4um到7um之间,目前还没有适合1.2um的像元普通光学镜头,在可接受的价格范围内镜头能做到什么程度,是值得我们拭目以待的事情。

分辨率Resolution

灵敏度Sensitivity

那灵敏度又如何呢?在研究固态成像芯片的灵敏度前,我们先来看一下传统胶片的工作原理。如果放大胶片,就能看到一个一个的卤化银液态颗粒。很多人不知道的是,这些颗粒有两种状态,当吸收了一个光子后就变成黑色。而图像中灰度是有无数的这样的二值状态的颗粒的百分比来获得的。

灵敏度Sensitivity

现在科学家们正在研制一种新型的成像芯片,他的工作原理和胶片相似,每个感光单元都是二值状态的,一但感光就会改变状态,我们称之为盖革模式(Geiger)。理论上这种成像芯片的灵敏度可以做到单光子探测。在传统像元大小的面积上(如4um见方),将会有几千个这样的感光单元,通过他们的均值获得图像灰度。下图显示的是一个图像阵列,其中每个像元工作在盖革模式下,通过改变每个成像单元面积的大小,我们可以在灵敏度和分辨率之间进行平衡。

半导体:Semiconductors

自从1971年第一个微电子处理器4004问世以来,半导体工业给世界带来了翻天覆地的变化,现在普通PC中的CPU的运算能力已经提高了数百倍以上,并且还出现了专门针对图形处理微处理芯片GPU。GPU可以并行处理512路信号,是高数据量密集型的复杂处理器,同时针对图像图形处理函数,适合大数据量,阵列模式的数据处理,能满足现有CPU因速度而无法满足的应用需求。

半导体:Semiconductors

现在还有一种新兴处理方式叫做云计算。他是通过网络上的数百台计算机共同完成同一计算任务从而缩短运算时间的方法。原来通过一台计算机需要1年半的时间完成的神经网络训练,通过云计算的方法可以将时间缩短到1天以内。在机器视觉领域,如果能够将GPU和云计算相结合,运用几百台含有GPU处理芯片的网络计算机联合,将有可能将这样的训练过程最终缩短到几分钟以内。

说到半导体行业,我们不能不提及的是摩尔定律。戈登·摩尔,Intel的创始人之一,指出:IC上可容纳的晶体管数目,约每隔18个月(后来被修正成2年)便会增加一倍,性能也将提升一倍。

半导体

这是一个几何级数的曲线,增速非常快,从上图中我们可以看到,30年间半导体的集成度从最早的单位面积1000个晶体管发展到现在的100万个晶体管。半导体行业已经出人意料地遵循摩尔定律发展了38年,在这么高的基数上,半导体行业还能遵循摩尔定律继续发展下去吗?很多人都对此产生怀疑,包括戈登·摩尔本人。这不仅仅是因为技术本身,同时也是经济问题。因为每当半导体行业发生代跃迁的时候,都需要巨大的投资,新设备的研制和新产线(Foundry)的投入。

但我还是相信有这种可能,因为在过去的半导体行业的发展过程中也遇到过很多困难,这些困难在当时被人们认为是不可克服的,但最终都会由技术的突破得以实现。目前,半导体芯片还都是在二维的平面上进行集成,未来可能出现三维的集成方式,如果这种技术得到突破,半导体行业就会遵照摩尔定律继续发展下去。

半导体行业这种发展会对机器视觉有怎样的影响呢,那就是处理速度,在未来我们可以拥有系统更高的运算能力,让以前不敢想象的复杂的算法变成现实。

自动驾驶:Autonomous Vehicle Navigation

自动驾驶:Autonomous Vehicle Navigation

接下来我们再来看一个新的行业,那就汽车自动驾驶。今天我们已经能够在一些高端的汽车上发现自动驾驶装置,用以帮助司机做各种操作。比如:

  1. 车道偏离预警;
  2. 碰撞预警;
  3. 行人预警;
  4. 夜视;
  5. 智能大灯控制;
  6. 交通信号灯探测;
  7. 驾驶员驾驶状态监控。

在汽车自动驾驶领域,要求相机能够处理越来越复杂的场景。因为我们无法知道汽车会开到什么地方,我们对汽车行驶的场景没有先验的信息,所以需要相机智能的对场景进行分析。这里可能用到一些3D的图像芯片,以便我们能够直接获取场景的三维信息,为驾驶操作提供依据。

自动驾驶:Autonomous Vehicle Navigation

在美国已经有例行的自动驾驶大奖赛中,自动驾驶技术的应用已经逐步从概念变成现实。上面的图像是去年“自动驾驶大奖赛”的年度冠军,他们采用激光雷达技术成像来是实现自动驾驶,该公司是目前唯一一家取得商业成功的汽车自动驾驶设备提供商。尽管规模还有限,但至少设备已经具备一定鲁棒性,能够实际应用起来。并且,系统的成本已从一开始的25万美元,降到目前的7万美元。提及这个例子的目的是,希望我们也可以进一步拓宽视野,从其他角度,如从图像源获取的角度,考虑哪些技术可能会在未来给机器视觉行业带来巨大的影响。

安防:Security

全球各地目前都在不遗余力地提升安防级别,安防领域又将给机器视觉带来什么样的贡献呢?

以往的安防监控系统,是将安防摄像机在各个监控点上的图像传输到数据中心,并通过人在数据中心对视频的观察,来发现是否有不合法的事件发生。而这里我们所谈及的安防与传统的安防系统有很大的区别。在现代的安防系统中会有很多基于视频流的自动分析功能,实现自动的安防控制。

生物识别

这里首先来看看三种生物识别方式。首先是人脸识别系统,通过获取人脸的图像,对人脸的特征进行提取,如眼间距、鼻子的宽度、脸颊的曲线等。其中的难点在于不论图像采集时人的表情如何,高兴、伤心或沉默,采集到的特征信息都应该是一致的。更重要的是这些特征会与数据库中巨大的特征数据进行快速匹配,识别个体的身份。其应用领域包括:重点场所的进入控制、网站注册会员的身份验证等。其次是指纹识别,最后是虹膜识别(虹膜的唯一性非常强,即使是双胞胎或者同一个人的左右眼,他的虹膜特征都是不一样的),后两者的工作原理和人脸识别相似。

智能事件分析

接下来我们再看看监控领域,正如前面所述,与传统监控最大的区别就是现代监控可以无需人的参与进行自动监控。比如在机场等重要场所,有一个人在某处放下一个包裹并走开,再如有些人发生打斗的行为,系统会自动识别并预警。同时,现代监控系统能够以其高分辨率的相机,在人群中捕捉到犯罪嫌疑人的面孔,并进行预警。

太赫兹技术

另外在安防领域中的应用的一项新技术,Terahertz太赫兹。太赫兹是介于红外和微波之间的一个波段,这个波段的光线可以穿透人的衣服,从而发现藏在衣服下面的枪械、毒品等禁运物品。

太赫兹技术太赫兹技术

为什么会提及太赫兹呢,因为将来我们可能在机器视觉领域里应用到它。如果我们想要观测包装箱内部的物品形态,而不希望拆箱时,太赫兹就会派上用场。实际上,目前已经有现在的应用了,比如一家假肢制造公司在派送货物时,希望产品与包装箱上的对应客户及型号保持一致,又不愿意每个产品都拆箱检验,于是他们使用了用太赫兹进行检测。当然X-ray射线能完成同样的功能,只是太赫兹是相对而言更加经济和安全的方式。

娱乐:Gaming

下面我们来谈谈大家最感兴趣的事情 — 娱乐。我们知道,中国人很喜欢打麻将,但今天我们要讨论的不是像麻将这样的娱乐,而是与视频相配合的互动娱乐。

娱乐:Gaming

上图中我们看到的是微软公司的两款互动娱乐产品。右侧一款通过两个相机模仿人员进行立体成像,而左侧一款是直接通过3D芯片开发的娱乐设备,这种3D芯片未来将会突破芯片成本的瓶颈,使这样的互动娱乐设备容易获得。他们可以分析游戏参与者的动作和表情,开心、伤心、深思等表情,甚至将来我们可以在工位上放一个这样的摄像头,老板就会看到我们工作的是否开心了。

总结一下,展望机器视觉的未来,这五大行业将会是能够给视觉技术带来突破的领域。

在数码摄像行业将给我们带来具有更高分辨率和更高灵敏度,同时价格更合理的成像芯片。半导体行业将会给我们带来更高的处理能力,让更复杂的图像处理算法得以实现。而自动驾驶领域将推动新型3D芯片的研发,推动机器视觉系统工作在更加复杂的环境中,更加智能。在监控领域中,基于视频流的处理要求,也能够推动系统的拥有更高的处理速度和更智能地工作。在互动娱乐行业中,同样可以看到3D芯片发展,以及智能处理技术发展。

所以,未来将从今天开始,祝各位好运!

微视界为您精心推荐的适用于机器视觉的专业相机: ICMOS  MTR3CCD 

  • 客服专线:
  • 电子邮箱:
  • QQ:236071139
  • 24小时手机:
页面地址: http://www.microdemo.com/technical-data/1337/ 转载时请声明出处及地址。