El Latam-GPT de Chile avanza hacia el primer modelo de IA abierto de la región

Un modelo grande de lenguaje entrenado en español y portugués, construido para América Latina y el Caribe

Publicado: 10 de junio de 2026 • 9 min de lectura • Artículo

Latam-GPT de Chile, el primer modelo de IA abierto entrenado en español y portugués para América Latina

Respuesta Rápida:

Latam-GPT es el primer modelo grande de lenguaje construido para América Latina. Según Tech Policy Press, fue lanzado el 10 de febrero de 2026 por el CENIA como infraestructura de código abierto, no como un chatbot de uso directo, se construyó sobre Llama 3.1 de Meta como un modelo de 70 mil millones de parámetros, y fue entrenado con más de 8 terabytes de datos en español y portugués.

Puntos Clave:

  • Lanzamiento: Según Tech Policy Press, Latam-GPT fue lanzado el 10 de febrero de 2026 como infraestructura de código abierto —una base para desarrolladores, todavía no un chatbot de uso directo.
  • Liderazgo regional: El proyecto está liderado por el CENIA e involucra 15 países, más de 200 colaboradores y 33 alianzas institucionales.
  • Escala técnica: Es un modelo de 70 mil millones de parámetros, construido sobre Llama 3.1 de Meta, entrenado con más de 8 terabytes de datos (2,6 millones de documentos).
  • El problema que resuelve: El material en español y portugués representa solo entre el 2 % y el 3 % del material existente de entrenamiento de IA, según Tech Policy Press.
  • Inversión: La Universidad de Tarapacá invirtió 10 millones de dólares en un centro de supercómputo; el CENIA destinó 300.000 dólares y la CAF comprometió 250.000 dólares.

Durante años, la inteligencia artificial que usan los negocios de habla hispana fue construida en otro idioma, para otro mercado. Los modelos dominantes aprendieron del inglés, del contexto estadounidense y de los matices de un consumidor que no siempre se parece al cliente que entra a tu local en Houston, Cypress, Monterrey o Bogotá. Esa brecha es exactamente lo que un proyecto regional busca cerrar.

Según Tech Policy Press, Chile lanzó Latam-GPT, descrito como el primer modelo grande de lenguaje construido específicamente para América Latina. Para cualquier dueño de negocio que dependa de que la IA entienda a sus clientes —en su idioma, con su contexto— este es un movimiento que vale la pena entender.

Qué es Latam-GPT y quién lo construyó

Según Tech Policy Press, Latam-GPT fue lanzado el 10 de febrero de 2026 como infraestructura de código abierto —no un chatbot de uso directo, sino una base sobre la que desarrolladores e instituciones pueden construir. El proyecto está liderado por el CENIA, el Centro Nacional de Inteligencia Artificial de Chile, dirigido por Álvaro Soto. Esa distinción es la razón por la que el modelo abierto hecho en la región todavía madura hacia un lanzamiento plenamente usable: la base abierta ya está disponible, y el trabajo de convertirla en productos de uso cotidiano es el camino que falta por recorrer.

No se trata de un esfuerzo de un solo país. Tech Policy Press reporta que el proyecto involucra 15 países, más de 200 colaboradores y 33 alianzas institucionales en toda la región. Es un esfuerzo colaborativo a una escala poco común para la infraestructura de IA en América Latina.

En términos técnicos, según Tech Policy Press, Latam-GPT es un modelo de 70 mil millones de parámetros construido sobre Llama 3.1 de Meta. En lugar de partir de cero, el equipo tomó un modelo base abierto y lo adaptó con datos regionales —una ruta práctica para un proyecto que busca soberanía tecnológica sin el costo de entrenar un modelo desde el inicio.

El dato que lo explica todo: Según Tech Policy Press, el material en español y portugués representa solo entre el 2 % y el 3 % del material existente de entrenamiento de IA. Esa escasez es la razón por la que los modelos globales suelen tropezar con la jerga, las referencias culturales y el contexto de mercado de la región.

La escala de datos detrás del modelo

Construir un modelo que entienda de verdad la región exige datos de la región. Según Tech Policy Press, el desarrollo de Latam-GPT procesó más de 8 terabytes de datos, equivalentes a 2,6 millones de documentos, con datos de entrenamiento provenientes de 20 países de América Latina más España.

Ese volumen importa por una razón concreta: un modelo entrenado mayoritariamente con texto en inglés aprende el mundo a través de un lente estadounidense. Cuando un cliente en América Latina formula una pregunta usando modismos locales, nombres de productos regionales o referencias culturales propias, un modelo global puede malinterpretarlo. Un modelo entrenado con datos provenientes de 20 países de América Latina más España tiene, al menos en teoría, una mejor oportunidad de entenderlo bien.

La decisión de construir sobre un modelo base abierto merece una pausa. Según Tech Policy Press, Latam-GPT se construyó sobre Llama 3.1 de Meta en lugar de entrenarse desde cero. Esa elección dice algo sobre la estrategia: en vez de competir dólar por dólar con los presupuestos de cómputo de los laboratorios comerciales más grandes, el proyecto sumó datos regionales a una base abierta existente. Según Tech Policy Press, la IA global sigue dominada por OpenAI, Google y Anthropic, con recursos varios órdenes de magnitud mayores que este esfuerzo regional. Adaptar un modelo abierto es la forma en que una región que trabaja con presupuestos mucho menores puede aun así producir algo a la medida de sus propios idiomas y contexto.

Soberanía de IA: el argumento de fondo

El marco que sus líderes le dieron al proyecto va más allá de la tecnología. Álvaro Soto, director del CENIA, planteó la limitación técnica que justifica un modelo regional. Según Tech Policy Press, Soto señaló que, por más poderosos que sean los grandes modelos, no pueden cubrir todos los aspectos relevantes de la realidad de la región.

El argumento es de autodeterminación tecnológica: una región cuyos idiomas y contexto están subrepresentados en los modelos dominantes construyendo su propia base, en lugar de depender por completo de sistemas hechos en otros lugares. Según Tech Policy Press, el español y el portugués representan solo entre el 2 % y el 3 % del material de entrenamiento de los modelos de IA existentes —la brecha que un modelo hecho en la región busca cerrar.

Tech Policy Press también ubica el proyecto en un contexto histórico, señalando la red de fibra óptica de UNASUR —un esfuerzo tecnológico regional anunciado en 2009 que colapsó en 2019 en medio de desacuerdos políticos y falta de financiamiento— como un precedente que invita a la cautela. La pregunta abierta es si una iniciativa de IA puede sostener la cooperación transfronteriza que aquel proyecto de infraestructura no logró mantener.

La inversión detrás del proyecto, según Tech Policy Press:

  • La Universidad de Tarapacá, en Arica, Chile, invirtió 10 millones de dólares en un centro de supercómputo.
  • El CENIA destinó 300.000 dólares al proyecto.
  • El Banco de Desarrollo de América Latina y el Caribe (CAF) comprometió 250.000 dólares.

Aspiración regional frente a la realidad del mercado

El entusiasmo por un modelo hecho en la región es real, pero también lo son los desafíos. Tech Policy Press enmarca el proyecto precisamente en la brecha entre la aspiración regional y la realidad del mercado: financiamiento, acceso a capacidad de cómputo y adopción.

Un modelo abierto, por sí solo, no garantiza usuarios. Para que Latam-GPT cambie la forma en que los negocios operan, los desarrolladores tienen que construir sobre él, las empresas tienen que integrarlo y los modelos comerciales dominantes —ya consolidados— tienen que dejar espacio. Ese es el camino que, según Tech Policy Press, el proyecto todavía debe recorrer.

Para los dueños de negocios, la lección no es esperar a ver qué modelo gana. La lección es que la IA, en todas sus formas, se está convirtiendo en la capa por la que los clientes descubren negocios. Y eso plantea una pregunta más urgente que la elección del modelo: cuando un cliente le pregunta a la IA por un servicio como el tuyo, ¿aparece tu negocio en la respuesta?

Qué significa esto para tu negocio

Latam-GPT es una señal de una tendencia más grande: la IA está aprendiendo a entender el español y el portugués regional cada vez mejor. A medida que eso ocurre, más consumidores —tanto en América Latina como entre la comunidad hispana de Estados Unidos— van a buscar negocios preguntándole directamente a un asistente de IA, en su propio idioma. Si la IA no conoce tu negocio, no puede recomendarlo.

Aquí es donde entra la Optimización para Motores de Respuesta (AEO), el servicio de MerchandisePROS diseñado exactamente para este momento. La AEO estructura tu sitio web, tus datos de negocio (schema), tu contenido de preguntas frecuentes y tus citas en directorios para que modelos como ChatGPT, Perplexity, Google AI Overviews —y los modelos regionales que vienen— puedan encontrar, entender y citar tu negocio con confianza. El problema que resuelve es concreto: ser invisible para la capa de IA por la que cada vez más clientes pasan antes de tomar una decisión.

El primer paso es saber dónde estás parado hoy. Nuestra auditoría gratuita revisa tu presencia digital en más de 20 factores —incluida tu visibilidad ante la IA— y te entrega una puntuación de 0 a 100 con un plan de acción claro, en menos de 60 segundos.

Preguntas Frecuentes

¿Qué es Latam-GPT?

Latam-GPT es el primer modelo grande de lenguaje construido específicamente para América Latina. Según Tech Policy Press, fue lanzado el 10 de febrero de 2026 como infraestructura de código abierto (no un chatbot de uso directo), está liderado por el CENIA y se construyó sobre Llama 3.1 de Meta como un modelo de 70 mil millones de parámetros entrenado con material en español y portugués.

¿Quién está detrás de Latam-GPT?

Según Tech Policy Press, el proyecto está liderado por el CENIA (Centro Nacional de Inteligencia Artificial de Chile), dirigido por Álvaro Soto, e involucra 15 países, más de 200 colaboradores y 33 alianzas institucionales en la región.

¿Por qué importa un modelo de IA entrenado en español y portugués?

Según Tech Policy Press, el material en español y portugués representa solo entre el 2 % y el 3 % del material existente de entrenamiento de IA. Un modelo entrenado con datos regionales promete capturar mejor el contexto, el lenguaje y los matices de mercado que los modelos centrados en Estados Unidos suelen pasar por alto.

¿Qué tan grande es el conjunto de datos de entrenamiento de Latam-GPT?

Según Tech Policy Press, el desarrollo procesó más de 8 terabytes de datos, equivalentes a 2,6 millones de documentos, con datos de entrenamiento provenientes de 20 países de América Latina más España.

¿Qué significa Latam-GPT para mi negocio?

A medida que más modelos de IA entienden el español y el portugués regional, más clientes buscarán negocios preguntándole a la IA en su propio idioma. La optimización para motores de respuesta (AEO) estructura tu sitio y tus datos para que esos modelos citen tu negocio. La auditoría gratuita de MerchandisePROS revisa qué tan visible eres para la IA.

"No importa qué modelo de IA gane. Importa si la IA conoce tu negocio lo suficiente como para recomendarlo cuando un cliente pregunta en su idioma."
- Diego Medina F, Fundador de MerchandisePROS

¿La IA conoce tu negocio?

Obtén tu auditoría gratuita y descubre exactamente qué señales de IA te faltan. Puntuación en 60 segundos, reporte en PDF a tu correo.

Revisar Mi Puntuación Gratis Consulta Gratis