AI 模型及其在分领域中的位置

人工智能模型--从控制系统到神经元全能选手

Tim Filzinger

在围绕人工智能(AI)模型的讨论中,经常会出现机器学习和神经网络等密切相关的术语。尽管它们经常被当作同义词使用,但两者之间存在着根本性的区别,这种区别源于各自所使用的技术。

分化正在加剧。这体现在对特别流行的人工智能模型及其在各个子领域的功能进行的分类中。

什么是人工智能模型?

人工智能模型是能够借助人工智能自主决策的计算机程序和算法。因此,它们代表了人类思维能力的模型,旨在自动执行依赖于它们的行动。其核心是利用经验库来解决迄今未知的问题,这也是最流行的人工智能技术之一。 情报的定义 对应。借助数据分析,机器可以调整这一原则。实施的可能性数不胜数,还有许多其他方法可以为程序和算法提供智能操作。

人工智能只是所有这些技术的总称,它开辟了一个由不同子领域组成的复杂系统,每个人工智能模型都必须在其中进行单独分类。关于机器学习(machine learning)的讨论尤为频繁,作为最大的子集,机器学习实际上在很大程度上与人工智能是一致的,但并非完全一致。其中,深度学习又是主要基于神经网络的实现技术。人工智能模型最重要的应用领域包括 自然语言处理 (NLP)、计算机视觉和机器人技术,而这些领域又根据技术的不同在人工智能的各个子领域之间游走。

因此,有两个方面对分类起着决定性作用:

  • 技术/方法
  • 应用领域

人工智能与机器学习的区别

简单的人工智能模型早在 20 世纪 60 年代就已经存在,但在很长一段时间里,它们并没有真正的实际用途。问题在于,它们必须使用规则以耗时的方式进行编程,从而为个别情况做好准备。20 世纪 80 年代,随着机器学习的出现,这种情况发生了改变。最大的区别在于:它可以基于数据进行自主学习,从而识别并执行行动原则。 

计算能力的提高和可用数据集的不断扩大大大加快了这一发展。如今,大多数模型都以机器学习为基础,这也是这两个术语经常同义使用的原因。

尽管如此,这仍然是事实: 所有机器学习模型都是人工智能模型,但并非所有人工智能模型都是机器学习模型。

深度学习--通过神经网络挖掘更多潜力

深度学习是机器学习中一个非常热门的子领域,也是人工智能模型目前备受关注的主要原因。它将基于数据的概率原理应用于受人脑功能启发的复杂神经网络。它们由多层人工神经元组成,每一层都以数学方式将输入值转化为输出。

因此,整个网络会根据所有神经元及其在训练过程中优化的权重形成输出值。由于这些网络的深度和无数的神经元连接,与没有深度学习的机器学习模型相比,可以分析更复杂的关系。

它适用: 所有深度学习模型都是机器学习模型,但并非所有机器学习模型都是深度学习模型。

神经网络的简单显示
神经网络的简化表示法

简单模型及其分类

在对人工智能模型进行考虑和分类时,我们可以清楚地看到,这些技术的优势和适用性是如何随着相应类别系统的发展而增长的。

无机器学习的人工智能模型

由于投入大而附加值小,这些模式几乎已经绝迹,尽管在特定情况下仍在使用。最常见的代表有

  • 专家系统: 这些算法使用了大量由专家定义的规则和原则。它们通过 推理机 最终导致决策不使用概率。这也防止了错误概率过高,使该方法适用于避免致命错误。使用案例:医疗诊断、IT 故障排除、地震预测。
  • 遗传算法 作为优化技术,它们并不一定基于机器学习,而是基于进化原理,如选择、重组和突变。通过这种方式,针对优化问题提出的单个解决方案会被系统地修改,从而产生最佳方案。使用案例路线规划、车辆设计、组合优化。
遗传算法
遗传算法是受大自然启发的另一种建模技术。

无深度学习的 ML 模型

在这一领域,利用经典统计原理的模型简单而有效。在使用神经网络之前,它们通常可作为快速基线,并提供来自数据库的初步见解。无监督学习方法(使用非结构化的训练数据)和有监督学习方法(使用结构化的训练数据)是有区别的。

  • 奈何贝叶斯: 这就是概率 贝叶斯定理 用于分类问题。根据相互独立的属性,算法可以计算出一个对象最有可能隶属于某个类别。机器学习所需的数据库包括正确的分配和相应的概率分布。使用案例:垃圾邮件过滤器、 文件分类推荐系统。
  • 决策树 通过树状结构对数据进行分层分析,可以做出有理有据的预测。分类和回归问题也可以用这种方法来解决。根据数据属性,此类算法使用所谓的决策节点来应用最合适的规则。使用案例:银行业风险评估、营销策略制定、欺诈检测。
  • 逻辑回归: 这种经典的人工智能模型使用 logit 函数来研究自变量和二元因变量之间可能存在的关系。这使得它非常适合计算事件发生的概率。与 Naive Bayes 相比,该模型通过估算误差概率来提供更好的可解释性。使用案例降雨概率、社会科学研究、风险评估。

重要神经网络年表

迄今为止,最强大的模型几乎无一例外都是基于深度学习的。由于其高性能和广泛的应用领域,尤其是在语音和图像处理方面,它们现已成为许多应用的首选。

多层感知器

作为最早的神经网络之一,感知器在 20 世纪 50 年代问世时只有一个输入层、一个隐藏层和一个输出层。由于没有多层,因此也就没有相应的信息处理深度,所以还谈不上深度学习。

到了 20 世纪 80 年代,这种情况发生了变化,它被扩展为一种由多层神经元组成的前馈网络。随着多层感知器的出现,利用输入数据模式优化神经元权重的复杂模型训练首次出现。为此,一种重要的学习算法是 反向传播.迄今为止,感知器仍是线性可分离模式识别的一种流行人工智能模型,可用于 Pytorch 和 Tensorflow 等各种开源框架。

使用案例:手写识别、股票分析、图像分析。

卷积神经网络(CNN)

与多层感知器相比,最大的创新在于神经元的多维排列。神经元的活动是通过专门开发的 卷积层 计算得出。该层的另一个特点是神经元权重的对应关系。此外,所谓的 汇集层 用于减少数据。这一过程以大脑视觉皮层的横向抑制为基础,旨在确保考虑到最相关的信息或防止过度拟合。这使得 CNN 特别适用于低错误率的精确图像识别。

用例:图像识别和分类、光学字符识别 (OCR)。

递归神经网络(RNN)

RNN 专门处理序列和有序时间数据。为此,它打破了以往仍作为标准的输入和输出独立假设。取而代之的是,该网络在计算时会考虑先前元素的顺序。从这个意义上说,它是一种记忆模型,因此特别适用于语言处理。这种人工智能模型的进一步发展是 长短期记忆这样就能捕捉到更长的语境。因此,2000 年代制定了新的性能标准,其中与 CNN 的结合也做出了重大贡献。

用例:语音处理、手写识别、翻译。

转换器

如今,由编码器、解码器和所谓的注意力模块组成的特殊神经网络已被用于自动语音处理领域。这使得迄今为止最强大、最灵活的广泛语境分析成为可能。最受欢迎的应用是 ChatGPT 或 Bard,其背后是 GPT-4 和 PaLM 2 模型。 NLP 模型.新的代表是 LLama 2,它完全使用公共数据集和大约两万亿个参数进行训练。它使可检测的上下文长度进一步增加。

利用神经网络的力量进行文档管理

所介绍的许多模型和应用可能性都涉及语言和视觉元素的处理。因此,一个特别令人兴奋的应用案例就是对文档的分析,因为文档往往以布局、文本或手写的形式结合了这些内容。文档软件 Konfuzio 依赖于深度学习技术和神经网络的多功能组合。例如

文件分类

文件首先是 发票, 交货说明 或类似问题,是神经网络可以解决的典型分类问题。Konfuzio 只需要少量的训练数据就能达到很高的准确率。

文本识别

利用自然语言处理和光学字符识别等技术,可实现自动识别、分析和处理数据。 萃取 对 Konfuzio 来说,处理文本是小菜一碟。这也得益于其背后的深度学习模型的学习能力。

如果您想进一步了解人工智能在贵公司文档管理方面的潜力,请联系我们。 联系我们 给我们。我们的专家期待着交流。

总结

随着时间的推移,人工智能已经分化成一个由不同技术组成的日益复杂的系统。只要看看无数具有各自功能的人工智能模型,这一点就一目了然。不过,一个主要的共同点是使用机器学习,即从数据中自动提取知识。这种算法不再依赖规则系统的复杂编程,而是使用逻辑回归或奈维贝叶斯等统计模型。

目前,深度学习领域取得的进展最大,其定义是使用人工神经网络。人工神经网络的多维结构以及各种优化、修改和强化学习程序的适用性,使其能够在许多任务中实现独特的性能。例如,在文件处理方面,这一点就非常明显,现在几乎不需要任何人的关注。


关于我

更多精彩文章

随机森林Python

在 Python 中实现随机森林的 5 种方法 - 开发人员指南

随机森林是决策树的集合,是机器学习领域最流行的方法之一,经常被用于...

阅读故事

数据保护 - 使用 PDF 编辑工具保护敏感数据

无论是报税表、合同还是银行对账单--在官僚程序中,我们往往别无选择,只能将包含敏感数据的文件与其他文件一起发送。

阅读故事
半结构化数据

半结构化数据:挑战和解决方案

现代企业周围的数据流迅速增长,在这个时代需要定制化的处理策略。除了非结构化格式,...

阅读故事
箭头向上