Especias varias en cucharas

Clasificación de documentos con IA para su gestión documental

Maximilian Schneider

Implantar la gestión de documentos en línea

Este tutorial trata sobre la clasificación de documentos con IA. A diferencia del tutorial, se trata de 1, 2 o 3 No se trata de extraer información de un documento, sino de etiquetarlo automáticamente en determinadas categorías predefinidas. Esto puede utilizarse para archivar y optimizar la gestión de documentos y las tareas administrativas. 

Como siempre, te mostraremos cómo puedes implementarlo en un proyecto de AI de tu gestión documental online con un ejemplo práctico. Volveremos a utilizar los recibos para esto. Como ya en Tutorial 1 y 2 obtenemos nuestros documentos de una base de datos pública a la que usted puede acceder. aquí puede acceder. Nuestro objetivo es clasificar los recibos en cinco sectores (cafetería, restaurante, hotel, comercio minorista y transporte público). Sin crear reglas, la IA aprende a partir de ejemplos a cuál de las industrias pertenecen los nuevos recibos.

En esta documentación, algunos elementos están marcados como beta. Si alguna de estas funciones aún no está operativa, póngase en contacto con nosotros a través de nuestro Formulario de contacto. Nuestro servicio de asistencia se ocupará de su problema inmediatamente y, por supuesto, de forma gratuita.


Entrene a la IA para categorizar y asignar palabras clave a los documentos.

  1. Crear proyecto

    Puede crear un nuevo proyecto o utilizar uno ya existente. Si desea crear una nueva, puede ir a Tutorial 1 busca de nuevo cómo crear un proyecto.

  2. Crear plantillas por defecto

    Ahora se requiere una plantilla por defecto para cada categoría de documento. Se trata de una plantilla que no está subordinada a una denominada "Plantilla padre por defecto". Se crea a través de INICIO > Plantillas > AÑADIR PLANTILLA POR DEFECTO+. Aquí sólo tiene que introducir el nombre de su categoría (aquí: "Café", "Restaurante", "Hotel", "Comercio minorista" y "Transporte público") y seleccionar su proyecto. Si, como nosotros, desea crear varias plantillas por defecto, deberá hacerlo de nuevo a través de la vista de plantillas y el botón AÑADIR PLANTILLA POR DEFECTO+.

  3. Crear datos de entrenamiento

    Ahora haga clic en DOCUMENTOS para acceder a la vista del documento. Aquí puede utilizar los documentos que ya tiene o cargar otros nuevos. Entrenar la IA es especialmente fácil si el nombre del archivo indica a qué categoría pertenece este documento. Ahora mostramos a la IA qué documentos pertenecen a cada categoría. Para ello, seleccionamos la categoría correspondiente en la pestaña correspondiente de los documentos en la columna "CATEGORY TEMPLATE" y pulsamos el botón "Save" en la parte inferior derecha. Es posible asignar la categoría correspondiente a todos los documentos de una página y, por último, hacer clic en "Guardar" para todos ellos. Este procedimiento sólo es posible si los documentos no se encuentran en el conjunto de datos de entrenamiento, prueba o preparación. Sin embargo, si este es el caso, primero debe eliminar los documentos del conjunto de datos con la acción "Eliminar del conjunto de datos" para poder asignarles la categoría posteriormente. Una vez finalizado este paso, vuelva a añadir los documentos al conjunto de datos de entrenamiento.
    Para obtener resultados de alta calidad aptos para el tratamiento oscuro, debe tener al menos 50 documentos por categoría. Así, con nuestras 5 categorías, utilizamos un conjunto de datos de entrenamiento compuesto por 250 documentos. Puede añadir más archivos al conjunto de datos de prueba para evaluar el modelo de IA más adelante (beta). Es muy importante que los documentos no se solapen en ningún caso. Si tiene un archivo que contiene varias categorías de documentos, es fundamental que los divida previamente y los cargue de forma individual para poder asignar después la categoría a cada uno de ellos por separado.

  4. Activar el reentrenamiento

    El reentrenamiento se activa a través de INICIO > Proyectos. Seleccione aquí su proyecto y elija la acción "Retrain category ai model" en la pestaña de acciones y, a continuación, haga clic en "Go".
    A partir de ahora, la IA sólo buscará patrones, similitudes y diferencias entre las categorías basándose en el mapeo. Encontrará más información al respecto en nuestro artículo sobre los aspectos técnicos de la clasificación.

  5. Prueba

    Para ver si su Categoría Modelo AI está entrenado, haga clic en INICIO> "Categoría ai modelo". Aquí también puede ver una evaluación estadística de su modelo de IA (beta). Además, puede cargar nuevos documentos a modo de prueba para comprobar si se clasifican correctamente. Aquí la IA ya debería mostrar automáticamente la categoría correcta en la columna "CATEGORY TEMPLATE". En nuestro proyecto, por ejemplo, la IA debe clasificar automáticamente una factura de hotel cargada en la categoría "Hotel".

  6. Exportar

    Puede integrar el uso de la clasificación en la gestión del conocimiento de su empresa de muchas maneras.
    En primer lugar, permite gestionar documentos en línea filtrando por categorías en la parte derecha de la vista de documentos. Esto hace que sea muy fácil, por ejemplo, exportar sólo el contenido de una determinada categoría de documentos.
    Además, la categoría también se muestra en la exportación CSV. Esto resulta, por ejemplo, si exporta los datos de todos los documentos, en un directorio de archivos ordenados por categorías para su gestión documental con Excel. Por supuesto, también puede integrar la clasificación en sus sistemas existentes (por ejemplo, de SAP) mediante una integración API y adaptarla a su gestión de entradas. Esto le permite organizar el archivo correcto de sus documentos y encierra un gran potencial para sus actividades de back office.


¿Alguna pregunta? Trabajamos constantemente para mejorar nuestras instrucciones para que puedas utilizar Konfuzio de la forma más rápida y sencilla posible. Por favor, háganos saber si queda alguna pregunta sin responder para que podamos ofrecerle la mejor solución posible. Gracias.

Foto de Karolina Grabowska de Pexels

Sobre mí

Más artículos interesantes

Publicar artículo Artículo invitado

Escribir y publicar artículos ahora - guest post

Un dilema habitual para los expertos es la pericia por descubrir. Pero no tiene por qué ser así. Ha venido al lugar adecuado si: Su anterior...

Leer el artículo
Consulta gratuita del balance Balance

Guía: Cómo consultar un balance gratuitamente

El balance tiene una amplia gama de aplicaciones en casi todos los sectores. Permite conocer el activo y el pasivo, es decir, la salud financiera de...

Leer el artículo
AI debugging data overfitting underfitting performanceAI debugging data overfitting underfitting performance

Evite el sobreajuste y el infraajuste: Guía de depuración de la IA

Mucha gente está entusiasmada con el aprendizaje automático, pero no todo el mundo comprende los complejos retos que...

Leer el artículo
Flecha arriba