用AI为您的文件管理进行分类

您阅读了原始德文帖子自动翻译的版本。

实施在线文件管理

本教程是关于用人工智能对文件进行分类。与教程不同的是,这是关于 1, 23 这不是从文件中提取信息,而是将文件自动标记为某些预定义的类别。这可以用来归档和优化你的文件管理和后台任务。 

像往常一样,我们将通过一个实际的例子向你展示如何在你的文件管理在线的AI项目中实现这一点。我们将为此再次使用收据。正如教程中已经提到的那样 12 我们从一个你可以访问的公共数据集中获得我们的文件。 这里 可以访问。我们的目标是将收据分为五个行业(咖啡馆、餐馆、酒店、零售和公共交通)。在不创建规则的情况下,人工智能从实例中学习新收据属于哪个行业。

在本文档中,一些元素被标记为测试版。如果这些功能中的任何一个还不能操作,请通过我们的网站联系我们。 联系表格.我们的支持将立即处理你的问题,当然,是免费的。


训练人工智能对文件进行分类和关键词。

  1. 创建项目

    你可以创建一个新的项目或使用一个现有的项目。如果你想创建一个新的,你可以去到 教程1 再查一下如何创建一个项目。

  2. 创建默认模板

    现在每个文件类别都需要一个默认模板。这是一个不从属于所谓 "父级默认模板 "的模板。你通过 "主页">"模板">"创建"。 添加默认模板+.在这里,你只需输入你的类别名称(这里是:"咖啡馆"、"餐厅"、"酒店"、"零售 "和 "公共交通")并选择你的项目。如果像我们一样,你想创建几个默认模板,你应该通过模板视图和ADD DEFAULT TEMPLATE+按钮再次进行。

  3. 创建训练数据

    现在点击 文件 来访问文档视图。在这里,你可以使用你现有的文件或上传新的文件。如果文件名表明该文件属于哪个类别,训练AI就特别容易。现在我们向人工智能展示哪些文件属于哪个类别。我们通过在文件的相应标签中选择 "类别模板 "一栏中的相应类别,并点击右下方的 "保存 "按钮来实现。可以为一个页面上的所有文件指定相应的类别,最后为所有文件点击 "保存"。只有在文件不在训练、测试或准备数据集中的情况下,才有可能实现这一程序。然而,如果是这种情况,你应该先用 "从数据集中删除 "的动作将文件从数据集中删除,以便之后再给它们分配类别。完成这一步后,将这些文件添加回训练数据集。
    为了获得适合暗处理的高质量结果,你应该在每个类别中至少有50个文件。因此,对于我们的5个类别,我们使用由250个文件组成的训练数据集。你可以向测试数据集添加更多的文件,以便以后评估人工智能模型(beta)。非常重要的是,这里的文件在任何情况下都不能重叠。如果你有一个包含几个文件类别的文件,关键是你要事先把它们分割开来,单独上传,这样你就可以分别给每个文件分配类别了。

  4. 激活再培训

    你通过 "主页 "激活再培训 > 项目.在这里选择你的项目,并在行动标签中选择行动 "重新训练类别ai模型",然后点击 "开始"。
    现在,人工智能将只寻找基于映射的类别之间的模式、相似性和差异。你可以在我们关于分类的技术方面的文章中了解更多这方面的信息。

  5. 测试

    要看你的 类别 AI模型 训练完毕后,点击主页>"类别ai模型"。在这里,你也可以看到对你的人工智能模型的统计评估(beta)。此外,你可以简单地上传新文件作为测试,看看它们是否被正确分类。这里AI应该已经在 "CATEGORY TEMPLATE "一栏中自动显示了正确的类别。例如,在我们的项目中,人工智能应该将上传的酒店发票自动归入 "酒店 "类别。

  6. 出口

    你可以通过多种方式将分类的使用纳入公司的知识管理。
    首先,它允许你通过在文件视图的右侧按类别进行过滤来在线管理文件。这使得它非常容易,例如,只导出某个文件类别的内容。
    此外,类别也会显示在CSV导出中。这导致,例如,如果你导出所有文件的数据,在一个文件目录中按类别排序,供你用Excel管理文件。当然,你也可以通过API集成,将分类法整合到你现有的系统中(如来自SAP的系统),并使其适应你的输入管理。这使你能够组织正确的文件归档,并为你的后台活动带来巨大潜力。


有什么问题吗?我们一直在努力改进我们的说明,以便您能够尽可能快速和容易地使用Konfuzio。如果有任何问题没有得到解答,请让我们知道,以便我们能够为您提供尽可能好的解决方案。谢谢你!

照片来自 卡洛琳娜-格拉博夫斯卡 从 Pexels

"
"
Maximilian Schneider 的头像

最新文章