计算机视觉

什么是计算机视觉?通过信息技术实现视觉感知

Stefan Platzer

在这篇博文中,我们将仔细研究计算机视觉这一主题,看看机器学习和深度学习的应用。 

计算机视觉(CV),也被称为计算机视觉或电脑视觉,正在影响我们的工作世界和日常生活,而我们大多数人都没有意识到这一点。人工智能(AI)领域的这项变革性技术使机器能够以类似于人类的方式 "看",识别和解释复杂的视觉数据。

在今天这个数据驱动的世界里,计算机视觉的应用发挥着越来越重要的作用。也就是说,在从图像和视频格式的大量非结构化数据中提取有价值的信息。与机器学习,特别是与深度神经网络(深度学习)的结合,在这里是至关重要的。这使得计算机视觉能够实时识别物体以及人脸,现在甚至是情感。

以下是云计算中关于该主题的一个英文短视频:

录像带

通过加载视频,你接受YouTube的隐私政策。
了解更多

加载视频

应用的领域是多样的,从文件的识别和处理到交通标志的识别和X射线的图像分析。 

这就是为什么这项技术被越来越多的行业所采用,从农业到汽车行业再到保险行业。顺便说一下,微软在其云计算平台Azure的过程中使用这项技术。它被用来支持一系列广泛的服务。

CV还有助于改进智能视频分析软件。而且,它通过支持复杂的任务,如场景重建和实时物体识别来做到这一点。聪明的公司已经认识到这项技术的巨大潜力,并利用它来改善业务流程和数据分析。因为通过这种方式,他们可以节省时间和金钱。 

最后,你还可以读到一个例子,一个职业玩家和世界冠军在他的游戏中使用计算机视觉而被击败。

什么是计算机视觉?

计算机视觉是人工智能(AI)的一个专门领域。它的应用是模拟,在某些情况下甚至超越人类视觉。它的核心是处理视觉数据(图像和视频)的自动获取、处理、分析和解释。

计算机视觉中开发的算法和技术使计算机系统能够以类似于人类的方式理解和解释视觉信息。这包括从图像分析和文本阅读的简单应用到复杂的场景理解和场景重建。

近年来,计算机视觉取得了重大进展,仍然是一个活跃的研究和发展领域。随着深度学习和先进的人工智能技术的出现,数据的视觉分析的使用和应用潜力已经大大扩展。

同样,云计算也确保了更多的密集使用。这些进步使得在许多应用领域使用计算机视觉成为可能。从文本识别到人脸识别再到自主车辆导航,涵盖了广泛的任务,不断扩大学习范围。

计算机视觉是如何以及在哪里使用的?

计算机视觉被各个行业和组织所使用。自动化以及由此带来的时间和成本节约是应用中最大的优势。 

以下是一些在选定部门应用的实际例子,以便更好地理解:

汽车行业

汽车制造商将计算机视觉用于驾驶辅助系统、自动驾驶、交通标志和行人检测,并用于监控车辆内部。

医疗保健

在医学上,计算机视觉被用来分析医学图像,改善诊断程序和检测疾病。例如,对X射线图像、CT扫描或MRI图像的分析。

零售业

零售业的公司利用计算机视觉来分析顾客的购物行为,自动跟踪库存,提供以顾客为中心的建议,并改进防盗系统。

农业

计算机视觉在农业中被用来检测植物疾病,监测作物生长,自动收割过程和优化肥料或农药的使用。

当局和银行

在这里,计算机视觉被用于文件处理,以自动读取护照、身份证或驾驶执照等文件并提取相关信息。这加快了行政程序,如身份验证或 文件创建

计算机视觉在公共机构中的应用和 银行 有助于提高安全性、效率和客户体验。 

这些例子说明,计算机视觉被用于各个领域,以改善流程、提高效率、加强安全和开发新的创新解决方案。 

计算机视觉作为人工智能的一个子领域

人工智能(AI)

人工智能(AI)指的是计算机或机器系统执行通常需要人类思考的任务的能力。它涉及到算法和技术的发展,使计算机能够分析数据,识别模式,得出结论和解决问题。

计算机视觉 (CV)

计算机视觉使用机器学习和深度学习来分析和解释视觉数据。这涉及到诸如物体识别、图像分类、人脸识别、图像分割、运动跟踪等任务。通过使用深度学习模型,特别是卷积神经网络(CNN),计算机视觉系统能够以高精确度处理复杂的视觉任务。

深度学习在计算机视觉中的应用使图像识别、分析和处理方面取得了重大进展。通过用大量的数据训练大型神经网络,计算机视觉系统可以识别和理解图像中的复杂模式和特征。

"因此,计算机视觉是人工智能中的一个应用领域,它以机器学习,特别是深度学习为基础。"

机器学习(ML)

机器学习(ML)是各种算法和技术的总称,允许计算机系统从经验中学习并识别数据的模式。它使计算机能够执行任务或进行预测,而不需要为该应用明确编程。

深度学习(DL)

深度学习是一种基于人工神经网络的机器学习的特殊方法。这些网络由相互连接的若干层组成。这就是 "深度 "一词的由来,来自英文单词 "deep"。深度学习模型能够通过提取数据中的分层特征来自动学习数据的抽象表示。很多时候,这些应用都是在所谓的云中使用。

计算机视觉与机器视觉--区别

计算机视觉和机器视觉是经常被同义使用的术语。主要是因为它们指的是类似的概念和技术。然而,这两个术语之间有一些微妙的区别。

计算机视觉

计算机视觉是指与视觉信息的自动处理、分析和解释有关的科学和技术领域。计算机视觉的目标是使计算机能够像人一样看东西。

它包含了广泛的技术来捕捉、理解和解释视觉数据(图像或视频)。这包括图像处理、模式识别、物体识别、图像分割、三维重建等等。计算机视觉在各个领域都有应用,如文档识别、人脸识别、医学成像和分析、图像和视频的安全监控系统等。

机器视觉

机器视觉技术帮助工业工厂在现场做出决策。机器视觉的应用被用于视觉检查和缺陷检测、定位和识别、物体分类等。

机器视觉是工业自动化的创始技术之一,有助于提高产品质量,加快生产速度和优化制造。 

总之,计算机视觉是一个更广泛的概念。它涉及视觉信息的整个处理和解释范围,包括图像和视频的形式。机器视觉是计算机视觉的一个特定子集。机器视觉经常使用计算机视觉的技术来实现其目标。

定义 计算机视觉(概述)

"总的来说,计算机视觉可以被描述为接受视觉数据(图像、视频)的人工能力,同时对其进行阅读、理解和反应。这类似于人眼和大脑的自然合作方式。

计算机视觉的发展历史

以下是计算机视觉历史上的一些里程碑和发展。一般公众在2017年开始意识到了令人印象深刻的能力。因为在那个时候,神经网络 阿尔法狗 对阵世界冠军的 棋类比赛 在胜利的使用,从而展示了人工智能系统在现实生活中的视觉感知能力。

  • 1960s
    • - 1966年:马文-明斯基开发的夏季视觉会议被认为是计算机视觉历史上最早的里程碑之一。会上讨论了基本原理和挑战。
  • 1970s
    • - 1970年:第一个能够识别几何形状的图像处理系统由Lawrence Roberts开发。
    • - 1973年:Michael Fischler和Robert Elschlager开发了 图形化结构模型 用于检测和跟踪图像中的物体。
  • 1980s
    • - 1980年:大卫-马尔提出了视觉感知的理论,并提出了一个图像分析的数学模型。
    • 1983年: 尺度不变的特征转换 (David Lowe的SIFT方法使图像中的特征得到了强有力的识别和描述。
    • - 1986年: 光流过程 Berthold K. P. Horn和Brian G. Schunck的著作使追踪图像序列中物体的运动成为可能。
  • 1990s
    • 1994年:The 活跃的外观模型 (由蒂莫西-库茨(Timothy Cootes)设计的AAM系统实现了对面部特征的实时建模和追踪。
    • 1999年: 加快了稳健的特征程序 由Herbert Bay开发的SURF(Surface),能够在图像中进行快速和稳健的特征提取。
  • 2000s
    • 2001年: 维奥拉-琼斯程序 用于实时人脸识别,是由Paul Viola和Michael Jones开发的。
    • 2012年:深度神经网络AlexNet赢得了ImageNet竞赛,并显著提高了图像分类性能。
  • 2010年代到今天
    • 2014年: 基金会 生成式对抗网络 (伊恩-古德费罗(Ian Goodfellow)提出的 "GAN "使人们能够生成逼真的图像。
    • - 2015年: 在 卷积神经网络(CNN) ResNet在图像分类方面取得了非常高的准确性。
    • 2017年:《中国青年报》。 AlphaGo神经网络 在棋盘游戏中击败了世界冠军,并展示了人工智能系统在视觉感知方面的能力。
    • 2020年:的 转换器-模型最初是为语音处理而开发的,被应用于计算机视觉,并导致了图像处理和文本-图像交互方面的重大进展。

这些里程碑式的事件塑造了计算机视觉的发展和进步,并在自动驾驶、医学、安全、娱乐(电影、视频)和文档处理等领域带来了广泛的应用。

简历中的里程碑一览

未来展望

计算机视觉仍然是一个活跃的研究领域,在未来有很大的发展和创新潜力。由于每天都有大量的数据被读出,学习在不断发展。

计算机视觉与计算机视觉综合症

计算机视觉与 计算机视觉综合症 (CVS)。在这里,该术语被用于完全不同的背景:即当涉及到因看屏幕时间过长而引起的眼疲劳。任何花大量或过多时间在屏幕前阅读和学习的人都会,比如说,得到 这里 查看缓解CVS的十个有用步骤。

常见问题

什么是计算机视觉?

计算机视觉是计算机科学的一个领域,涉及视觉数据的自动处理、分析和解释,使计算机能够以类似人类的方式进行观察。

计算机视觉在哪里被使用?

工业自动化、 文件处理,机器人技术,自动 文件检查扩增实境(AR)、面部识别、医疗成像、监控和安全、 文件管理,等等。

顺便说一句,微软在其Azure云平台中使用了CV。

关于我

更多精彩文章

自动化金字塔标题

自动化金字塔:掌握工业 4.0

自动化金字塔是工业自动化的一个基本概念,它为工业自动化中的技术集成提供了一个结构层次。

阅读故事
OCR服务

用于自动化文件管理的OCR服务

您的文档管理是否还在为笨重且容易出错的流程所累?您是否愿意将资源用于手动扫描和打字?

阅读故事

应收账款:通过AI更有效地处理

检查信用度、监控收到的付款并撰写催款函:企业通过应收账款会计来确保自身流动性的工作量很大...

阅读故事
箭头向上