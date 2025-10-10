El año pasado, las “alucinaciones” producidas por la inteligencia artificial generativa (IAGen) volvieron a ser el centro de atención en los tribunales de Estados Unidos, y en todas las noticias. Más recientemente, Bloomberg News señaló que, en sus informes anuales de 2024, “Goldman Sachs Group Inc., Citigroup Inc., JPMorgan Chase & Co. y otras compañías de Wall Street están advirtiendo a los inversionistas sobre los nuevos riesgos derivados del creciente uso de la inteligencia artificial, incluidas las alucinaciones del software, los problemas de estado de ánimo entre los empleados, el uso por parte de los ciberdelincuentes y el impacto de los cambios legislativos a nivel mundial”.

Mientras tanto, Michael Barr, quien hace poco dejó su cargo de vicepresidente de supervisión de la Reserva Federal de EE. UU., anticipó estas inquietudes en los comentarios espontáneos que realizó en febrero en el Consejo de Relaciones Exteriores en Estados Unidos, donde afirmó que la presión competitiva en torno a la incorporación de inteligencia artificial generativa podría aumentar los riesgos en los servicios financieros. La presión competitiva “puede llevar a todas las instituciones, incluidas las reguladas, a adoptar un enfoque más agresivo hacia la adopción de IAGen, lo que incrementaría los riesgos de gobernanza, alineación y financieros en torno a la IA”, destacó Barr.

No podría estar más de acuerdo. Por eso, en FICO siempre hemos abogado por operativizar la inteligencia artificial generativa (IAGen) de manera responsable, a través de soluciones como modelos de lenguaje enfocados (FLM, por sus siglas en inglés) y modelos de tareas enfocados, a fin de impedir las alucinaciones antes de que ocurran.

Las alucinaciones no son una ilusión Las alucinaciones de la IAGen son, en efecto, problemáticas. Investigadores de la Universidad de Stanford descubrieron, el año pasado, que las herramientas de IAGen para propósitos generales, como ChatGPT, tienen una tasa de error de hasta el 82 % cuando se utilizan con fines legales. Las herramientas de IAGen diseñadas específicamente para aplicaciones jurídicas son mejores, ya que producen alucinaciones en el 17 % de los casos, según otro estudio de Stanford, y no deberían emplearse sin revisarse de manera cuidadosa y exhaustiva. Independientemente de la tasa de alucinaciones, el problema se agrava aún más en cualquier industria cuando el humano consume los resultados de la IAGen. La persona puede no percatarse de la alucinación ni confirmar el resultado, sino actuar directamente en función de éste.

El combustible que aviva el fuego Los factores que pueden conducir a las alucinaciones de la IAGen incluyen: El tipo, calidad, cantidad y amplitud de los datos utilizados para el preentrenamiento.

Baja cobertura de datos de preentrenamiento para los tokens y temas clave solicitados. Esto se relaciona con la asociación de palabras y/o grupos de palabras con estadísticas ligadas a una solicitud o uso en una respuesta. Si la cobertura es insuficiente, el modelo de lenguaje de gran tamaño (LLM, por sus siglas en inglés) puede hacer inferencias con base en el “ruido”, en lugar de señales claras respaldadas por una cobertura sólida.

Las alucinaciones son difíciles de ver Detectar las alucinaciones es complicado, porque los algoritmos de los LLM, por lo general, no son interpretables ni ofrecen visibilidad para justificar sus respuestas. Incluso si en la respuesta se hace referencia a un contexto de RAG, una inspección humana podría revelar que en realidad no fue utilizado en la respuesta. La mejor manera de minimizar las alucinaciones es que cada organización desarrolle su propio modelo fundamental de IA generativa preentrenado. Muchas empresas ya están aplicando, o planean aplicar, este enfoque mediante modelos enfocados en dominios específicos y basados en tareas. De esta forma, se puede tener un control crítico de los datos que se utilizan en el preentrenamiento –donde surgen la mayoría de las alucinaciones–, y limitar el uso de la contextualización aumentada para asegurar que dicho uso no incremente las alucinaciones, sino que refuerce las relaciones ya presentes en el preentrenamiento. Además de desarrollar modelos propios generativos enfocados, es necesario minimizar el daño creado por las alucinaciones. La política [empresarial] debería priorizar el proceso de cómo se utilizarán los resultados de estas herramientas en un contexto de negocio, y luego confirmar todo.