kentoh - Fotolia

Cómo administrar datos no estructurados usando un sistema ECM

Los sistemas de gestión de contenido empresarial son el sistema más común en el que las empresas administran datos no estructurados, que incluyen documentos, hojas de cálculo y archivos de audio y video.

Las empresas generan una enorme cantidad de información, que puede resultar difícil de manejar si no la gestionan correctamente.

Las empresas crean datos estructurados y no estructurados y los gestionan en varios lugares diferentes. Los datos estructurados se encuentran normalmente en los sistemas CRM y las plataformas ERP, mientras que los datos no estructurados son un componente de las bases de conocimiento, los sistemas de gestión de activos digitales y los sistemas de gestión de contenido empresarial.

El sistema de gestión de contenidos empresariales (ECM), sin embargo, es el mejor y más común lugar para administrar y almacenar datos no estructurados.

Diferencias entre datos estructurados y no estructurados

Los datos estructurados son información gobernada por una estructura de base de datos, organizada en campos definidos, generalmente dentro del contexto de una base de datos relacional. La estructura de la base de datos requiere que los datos de los campos sigan un formato prescrito. Por ejemplo, una fecha debe tener el formato de una fecha y un nombre debe tener una longitud limitada. El lugar más común en el que las personas encuentran datos estructurados es en las celdas de una hoja de cálculo.

Los datos estructurados tienen muchas aplicaciones dentro de las empresas y son fáciles de buscar. Se encuentran en finanzas, gestión de relaciones con los clientes, cadena de suministro y otras aplicaciones donde el cumplimiento de las estructuras está relacionado con las tareas comerciales.

Los datos no estructurados, por otro lado, son datos sin reglas y no se pueden buscar tanto. Los usuarios que crean datos no estructurados escriben de forma libre, en lugar de cumplir con los campos de datos estructurados. Existe un cumplimiento mínimo de las reglas sobre la extensión del contenido, el formato del contenido o qué contenido va a dónde. A pesar de la falta de estructura formal, la información no estructurada, que los usuarios crean en programas de procesamiento de texto, hojas de cálculo, archivos de presentación, PDF, feeds de redes sociales y archivos de audio y video, constituye la mayor parte de los datos creados en una organización. Los datos no estructurados pueden contener especificaciones de diseño de ingeniería, planes de marketing o un resumen del desempeño financiero.

Algunas empresas optan por poner este contenido no estructurado en un sistema simple de intercambio de archivos, pero hacerlo limita su acceso y capacidad de búsqueda. En cambio, los datos no estructurados funcionan mejor en un sistema ECM, especialmente uno que es compatible con los servicios de contenido, por lo que la integración de búsqueda, la minería de datos, el análisis de texto y otras herramientas pueden ayudar a los usuarios a descubrir, usar y colaborar en el contenido.

Cómo administrar y acceder a datos no estructurados usando un ECM

Un sistema de gestión de contenido empresarial organiza el contenido no estructurado para su acceso y capacidad de búsqueda. Al almacenar datos no estructurados en asociación con metadatos sobre ellos, un sistema ECM proporciona alguna explicación de lo que hay dentro.

Aquí hay algunas funciones y herramientas dentro del sistema ECM que ayudan a administrar datos no estructurados:

  • Automatización. Esto puede exponer metadatos que están incrustados en los archivos binarios de datos no estructurados, como el autor del contenido, la fecha de modificación del contenido y el título del contenido.
  • Escaneo de IA. La inteligencia artificial puede aplicar análisis de datos en todo un repositorio de datos para determinar tendencias importantes, comparando cada dato no estructurado con todo el contenido no estructurado que ha visto la IA. También puede aplicar reglas comerciales o algoritmos a los datos para comprender cómo funciona el contenido en marketing o en otros usos.

Hay tres formas principales de acceder a datos no estructurados en un sistema de gestión de contenido empresarial:

  • Metadatos. El uso de metadatos permite que el contenido no estructurado aparezca en los resultados de búsqueda empresarial en función de características definidas comúnmente. Los metadatos de un extracto bancario, por ejemplo, pueden incluir la fecha del extracto y un número de cuenta que representa el extracto. Los usuarios de las empresas pueden etiquetar el contenido de forma manual o automática, utilizando un software como Microsoft SharePoint.
  • Enlace directo. Un banco, por ejemplo, puede tener enlaces directos a términos y condiciones comunes desde su sitio web, enlazando a su sistema de gestión de contenido.
  • Búsqueda de texto completo. La búsqueda de texto completo permite a los usuarios buscar todos los extractos de tarjetas de crédito con cargo a Barnes & Noble, por ejemplo. Esa búsqueda usaría metadatos para buscar solo declaraciones y luego usaría texto completo para encontrar las declaraciones en cuestión.

Los datos estructurados y no estructurados no funcionan en el vacío. Deben utilizarse en el contexto empresarial correcto para que sean valiosos y dependen de los metadatos que se les asignen. Por ejemplo, alguien puede solicitar una hipoteca y proporcionar al banco una serie de documentos, incluidas declaraciones de impuestos, extractos bancarios, talones de cheques de pago e informes de crédito. En este caso, el contexto de estos documentos existe en dos formas: la primera es la solicitud de hipoteca y la segunda es el solicitante. Pero si ese mismo solicitante solicita un préstamo de automóvil en el futuro con ese mismo banco, el banco puede usar esos mismos documentos en un tercer contexto: una solicitud de préstamo para adquirir un automóvil.

Investigue más sobre Gestión y metodologías

ComputerWeekly.com.br
Close