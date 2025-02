El año pasado, mientras asistía a Febraban Tech 2024, un evento organizado por la industria de servicios financieros en América Latina, me llamó la atención saber que 96 % de los bancos encuestados tienen iniciativas de inteligencia artificial (IA). Me pregunto cuántos serían los bancos que efectivamente están sacando provecho de las iniciativas de IA, cómo podrían las empresas de servicios financieros (FSI) aprovechar lo que los modelos de lenguaje pequeños pueden ofrecerles, y si se podrían aplicar estas ventajas en otro ámbito que no sea el de los servicios financieros.

¿Qué son los modelos de lenguaje pequeños? Uno de los aspectos clave de un modelo de IA es la cantidad de parámetros que se utilizan para entrenar un modelo determinado. A la hora de explorar modelos, observaremos que esta cifra asciende a miles de millones por cada modelo. Cuanto mayor sea el valor, más nutrido será el aprendizaje y más avanzada su capacidad para manejar tareas lingüísticas más complejas. Thiago Araki Thiago Araki Ahora bien, ¿cuánto más grande, mejor? Eso depende. Si tenemos que personalizar un modelo de cientos de miles de millones de parámetros, necesitaremos una capacidad informática y de GPU considerable (medido en días o semanas) para realizar una sola ronda de entrenamiento de ese modelo. Un modelo de lenguaje pequeño (SLM) es un modelo que se puede personalizar o ajustar con datos propios, en un plazo de tiempo razonable, con el hardware con el que ya se dispone. Si investigamos los modelos de IA por nuestra cuenta, veremos que algunos ofrecen variantes de parámetros del modelo base. Por ejemplo, la familia de modelos Granite 3.1 ofrece variantes de parámetros que van desde menos de mil millones hasta 34 mil millones. Sugerimos comenzar con variantes de menor tamaño a fin de ir conociendo las capacidades de un modelo y ampliarlo si fuera necesario, para luego descubrir las mejoras (si las hubiera) que podría proporcionar un modelo de parámetros más amplios. Un modelo más pequeño nos permitirá comenzar más rápido y ajustarlo en un período de tiempo razonable.

Los SLM en los servicios financieros Mientras investigaba este tema, me topé con un artículo de Drew Breunig muy interesante. En él, Breunig divide la IA en tres casos de uso principales: dioses, pasantes y engranajes: El “dios” es la IA que reemplaza por completo a los seres humanos, como la inteligencia artificial generativa (IAG), a la que actualmente se destinan muchos fondos e investigación;

los “pasantes”, que generan un contenido muy bueno, pero cuya precisión y adecuación hay que revisar (son los copilotos supervisados); y, por último,

los “engranajes” (donde ubico a los SLM), son modelos diseñados específicamente con una baja tasa de error que les permite funcionar sin supervisión y en un ámbito en el que los usuarios pueden lograr grandes ahorros de costos. Las pruebas, el desarrollo de códigos, las pruebas de estrés y los pronósticos son fuertes candidatos para la IA de tipo "pasante". Los casos especializados y con márgenes de error reducidos en la industria de servicios financieros, como la atención al cliente, la hiperpersonalización, la detección de fraudes y el tratamiento de documentos, son candidatos naturales para los modelos de “engranajes” específicos y especializados. En principio, estas tareas no son exclusivas de la industria financiera, así que no hay duda de que otros sectores también podrán aprovechar los engranajes basados ​​en SLM de manera similar.