Latam-GPT: Un Modelo de Inteligencia Artificial Colaborativo para América Latina

Más que un modelo de lenguaje, Latam-GPT es un reflejo de nuestra identidad: una inteligencia artificial diseñada para comprender y celebrar la cultura latinoamericana.

El Centro Nacional de Inteligencia Artificial (Cenia) de Chile está liderando la creación de Latam-GPT, un modelo de lenguaje de gran escala (LLM) diseñado específicamente para América Latina y el Caribe. Este proyecto, que se espera lanzar a mediados de junio de 2025, busca reflejar la rica diversidad cultural, lingüística e histórica de la región.

Motivación y Objetivos

La iniciativa surgió de la necesidad de contar con un modelo de IA que comprenda y represente mejor el contexto latinoamericano. Los LLM existentes, aunque avanzados, a menudo ofrecen respuestas genéricas o incompletas sobre la cultura y la historia de la región. Latam-GPT pretende ser un modelo público, abierto e inclusivo, construido a través de la colaboración de más de 30 instituciones y 60 expertos de toda América Latina.

Desarrollo y Colaboración

El proyecto, anunciado en la Cumbre para la Acción sobre la Inteligencia Artificial en París, ha reunido un corpus de datos de 50 billones de parámetros, comparable al ChatGPT-3.5. Se han recopilado 8 TB de información de bibliotecas virtuales públicas y privadas. La Universidad de Tarapacá (UTA) proporcionará la infraestructura de alto rendimiento necesaria para entrenar el modelo, utilizando un supercomputador recientemente adquirido.

Aspectos Técnicos y Desafíos

El entrenamiento del modelo, a cargo del experto Omar Florez, podría tardar entre 35 y 40 días. Actualmente, se están filtrando y organizando los datos, realizando pruebas de entrenamiento a menor escala y ajustando el modelo para desarrollar un «sentido común».

Impacto y Soberanía Tecnológica

Latam-GPT busca posicionar a América Latina como un actor relevante en el desarrollo de IA, promoviendo la independencia tecnológica y ofreciendo soluciones adaptadas al contexto regional. Sin embargo, algunos expertos, como Ulises A. Mejías, cuestionan si este tipo de iniciativas pueden realmente lograr la soberanía tecnológica, señalando la necesidad de cuestionar las premisas básicas de los modelos de IA generativa.

Consideraciones Ambientales y Éticas

El proyecto también aborda el impacto ambiental del entrenamiento del modelo, destacando el uso de energía renovable en la infraestructura de la UTA. Además, se han establecido políticas de transparencia y protección de datos para garantizar el respeto a la propiedad intelectual y los derechos de autor.

Financiamiento y Alianzas

El proyecto ha recibido financiamiento del Cenia de Chile y cuenta con alianzas estratégicas con países como México, Colombia, Argentina, Perú, entre otros. Se espera que la colaboración continua y el aporte de los usuarios permitan mejorar y ampliar las capacidades de Latam-GPT en futuras versiones.

Motivación y Objetivos

Desarrollo y Colaboración

Aspectos Técnicos y Desafíos

Impacto y Soberanía Tecnológica

Consideraciones Ambientales y Éticas

Financiamiento y Alianzas

Cesar Tinjacá

Entradas relacionadas

El oscuro mundo de los «incels» y su aparición en la serie «Adolescencia»

«Desinfluencers»: El movimiento que desafía la cultura de consumo excesivo

El Boom DS