Jopara Vibe · Infraestructura escalable a otras lenguas

Infraestructura de lenguaje con IA
para el guaraní y el jopará.

Voz, texto, corpus lingüísticos y validación cultural — para que cooperativas, universidades, bancos, telcos e instituciones públicas ofrezcan servicios digitales en la lengua que la gente realmente habla.

Moonshot 2026 Top 100 · ueno · itti
AWS Créditos de infraestructura
App de recolección Tu Voz Guaraní ↗
Validación lingüística Prof. Ramón Silva (UNA)

Por qué importa

Cuando una lengua no se representa, desaparece de los sistemas que dan forma a la vida diaria.

El guaraní lo hablan ~6,5 millones de paraguayos. Para los sistemas digitales, en la práctica, no existe.

Lo que la gente habla es jopará — una mezcla viva de guaraní y español, moldeada por región, contexto y uso diario. La mayoría de los sistemas de IA no están construidos para este tipo de lenguaje. Asumen consistencia, estructura y estandarización.

Cuando una lengua no se reconoce, no se sostiene. Cuando no se sostiene, queda fuera de cómo la gente interactúa con la tecnología, de lo que puede acceder y de cómo su lengua se transmite a la siguiente generación.

La estandarización asume una lengua fija. El jopará es un continuo.

No existe un guaraní homogéneo. En un extremo está el guaraníete — el registro purista y académico, lleno de neologismos creados para evitar el español. En el otro extremo: el español paraguayo con fuerte sustrato guaraní. En el medio, donde vive la gente, está el jopará.

Entrenar IA con diccionarios y texto purista produce sistemas que hablan un guaraní que nadie usa. El estado del arte falla de forma medible:

  • facebook/mms-1b-all · WER 86,74 % · CER 49,37 % en STT jopará
  • NLLB (Meta) · traduce «Aguyje» (gracias) como «es muy fuerte»
  • Whisper Large V3 · transcribe «Jopara Vibe» como «Zafaraguay»

Por eso nuestro trabajo se centra en capturar el habla tal como existe — validada por expertos lingüísticos, no extraída de diccionarios.

Evidencia

Esto es lo que la IA actual hace con nuestra lengua.

El Prof. Ramón Silva habla en jopará. Las herramientas líderes lo fuerzan al español y devuelven texto sin sentido.

Original · Jopará
Prof. Ramón Silva — Visión para Jopará Habla en jopará fluido sobre la necesidad de reflejar la lengua viva en los sistemas digitales.
Whisper Large V3
Transcripción Whisper — mismo audio El STT de última generación de OpenAI escucha a Silva y produce texto sin relación con lo dicho.

Fallos documentados

facebook/mms-1b-all WER 86,74 % · CER 49,37 % (STT en jopará)
NLLB · Meta «Aguyje» («gracias») → «es muy fuerte»
Whisper Large V3 «Jopara Vibe» → «Zafaraguay» (ver demo arriba)

Referencias seleccionadas

  • Jojajovai: A Parallel Guarani-Spanish Corpus for MT Benchmarking Chiruzzo, Góngora, Alvarez, Giménez-Lugo, Agüero-Torales, Rodríguez · LREC 2022 · ~30.855 pares · CC-BY-NC-4.0 · aclanthology.org
  • Grammar-based Data Augmentation for Low-Resource Languages: The Case of Guarani-Spanish NMT Lucas, Baladón, Pardiñas, Agüero-Torales, Góngora, Chiruzzo · NAACL 2024 · aclanthology.org
  • Construction of the First Multimodal Dataset for Spoken Jopará — Baseline Experiments BLP24 Uruguay · STT benchmarks para jopará hablado
  • Logistical Difficulties and Findings of Jopara Sentiment Analysis Agüero-Torales et al. · 2021 · arxiv.org/abs/2105.02947
  • Meenz bleibt Meenz, but Large Language Models Do Not Speak Its Dialect Bui, Mager, Kann, von der Wense · LREC 2026 · JGU Mainz · LLMs en el meenzerisch (rama renano-franca, misma que el pfälzisch): 6,27 % de precisión en el mejor modelo · arxiv.org/abs/2602.16852

Sistema

Cómo funciona el sistema.

Un dataset lingüístico estructurado forma la base. Entornos de grabación controlados aseguran calidad acústica. La app refina el dataset con aporte del mundo real, validado por expertos.

01 · Dataset

Corpus de jopará vivo

Entradas estructuradas con IPA, CEFR, registro, fuente y contexto cultural. No de diccionario — de habla real, validada con expertos.

Campos59
Split80 / 10 / 10
FormatoJSONL
02 · Studio

Grabación controlada

Entorno acústico controlado en Asunción para registrar la voz de referencia — base para STT y TTS de alta fidelidad.

Audio48 kHz · 24-bit
VozProf. R. Silva
UsoSTT · TTS
03 · App

Capa de refinamiento

PWA que captura aportes guiados de hablantes nativos y enriquece el dataset con variación regional y contextual.

URLapp.tuvozguarani.com
StackPWA · Supabase
EstadoEn vivo

El acceso al sistema no es abierto en el sentido de «cualquiera sube cualquier cosa». La recolección es guiada: prompts diseñados con criterios lingüísticos, hablantes invitados, registro etiquetado. Cada entrada pasa por revisión antes de incorporarse al dataset de entrenamiento.

La validación final la hace el equipo lingüístico — encabezado por el Prof. Ramón Silva (UNA / Ateneo de Lengua y Cultura Guaraní). Este pase asegura que el corpus refleje jopará real, no aproximaciones ni ruido.

Escalabilidad

Construido para transferirse.

La clase de problema que resolvemos no es exclusiva del guaraní: lenguas sin ortografía estándar, habladas en mezcla viva con una lengua de contacto, existen en todo el mundo. Para probar que la metodología se transfiere, la aplicamos en paralelo al pfälzisch — un dialecto alemán sin forma escrita estandarizada, donde el cambio de código con el alemán estándar es la norma y siglos de contacto dejaron una capa léxica francesa — igual que en el jopará. Mismo enfoque: corpus paralelo, pipeline de datos y app de recolección, validado por un hablante nativo del equipo. Otra lengua, otro continente, el mismo sistema.

El mismo patrón de fallo cross-variety se repite. En un benchmark propio sobre 157 audios públicos de una variedad lingüística renano-franca emparentada — dentro del mismo continuo dialectal — Whisper Large-v3-Turbo, el modelo ASR insignia de OpenAI, falla en cuatro patrones distintos:

Identificación de lengua errónea.
74 % clasificado como inglés, 26 % como alemán, 0 % como la variedad evaluada.
Bucles de repetición.
31 de 157 clips (20 %) con palabras repetidas sin fin.
Ecos del entrenamiento.
Un clip transcrito íntegramente en ruso.
Confianza injustificada.
Confianza media del modelo: 87 % — sobre cero aciertos de lengua.

La IA está segura, y se equivoca — exactamente como con el audio jopará de Ramón.

Validación externa. Los LLMs actuales muestran un rendimiento sistemáticamente inferior con hablantes de dialectos alemanes (Bui et al., EMNLP 2025). En el meenzerisch — la misma rama dialectal renano-franca que el pfälzisch — el mejor LLM disponible alcanza solo el 6,27 % de precisión al definir palabras del dialecto (Bui et al., LREC 2026). Nuestro hallazgo en audio es la mitad fonética del mismo patrón documentado.

Paraguay es el comienzo. La infraestructura está diseñada para el Mercosur, las lenguas indígenas de la región — y las numerosas lenguas subrepresentadas que la IA actual ni comprende ni puede servir.

El idioma

Cómo funciona el idioma — y por qué la IA falla.

El guaraní es de las pocas lenguas indígenas que habla a diario una población mayoritariamente no indígena. Pero casi nadie usa guaraní «puro» ni español «puro»: se habla jopará.

  • No hay un único «guaraní»: hay un continuo que va del guaraníete (purista, académico) al jopará cotidiano y al castellano paraguayo.
  • Jehe'a y jopará no son lo mismo: en el jehe'a el préstamo español se adapta a la morfología guaraní; el jopará es una mezcla más profunda, con cambio de código.
  • Lo que se escribe (registro formal) rara vez coincide con lo que se habla.
  • Sonidos que el español no tiene: vocales nasales (ã, ẽ, ĩ, õ, ũ, ỹ), la sexta vocal y (/ɨ/) y el puso (oclusiva glotal ʼ, fonémico).
  • Armonía nasal y consonantes prenasalizadas (mb, nd, ng): la nasalidad se propaga por toda la palabra.
  • Lengua aglutinante: alineamiento activo-estativo, tiempo/aspecto también en el sustantivo (-kue «ex-», -rã «futuro»), reduplicación, partículas evidenciales.
  • Ortografía estandarizada reciente: el achegety de 33 grafías (Academia de la Lengua Guaraní).
  • Cambio de código constante: una frase entrelaza guaraní y español, a veces dentro de la misma palabra.
  • Integración morfológica: raíces españolas que toman afijos guaraníes (jehe'a).
  • Sin ortografía fija para lo hablado: una misma palabra se escribe de muchas formas — enorme dispersión de datos.
  • Traducción (MT): los modelos asumen un idioma por vez; el jopará entrelaza dos. NLLB de Meta traduce «Aguyje» («gracias») como «es muy fuerte».
  • Voz → texto (STT): el inventario de sonidos no coincide. El modelo multilingüe mms-1b-all rinde WER 86,74 % / CER 49,37 % sobre jopará.
  • Texto → voz (TTS): sin audio etiquetado de habla real, no hay con qué entrenar una voz fiel.
  • Todos se entrenan con texto formal y escrito; el habla real queda fuera.

Equipo y modelo

Las personas detrás del trabajo — y cómo se sostiene.

Un pequeño equipo fundador en Asunción, con validación lingüística del Prof. Ramón Silva, referente académico en lengua y cultura guaraní en Paraguay.

Co-fundador · Arquitectura

Matthias Dieter Roessner

15 años en construcción de exposiciones internacionales (CEO, SIA MKB International). Diseña la arquitectura del sistema y la estrategia.

Co-fundadora · Lingüística aplicada

María Mercedes Esquivel Chamorro

Traductora profesional médica y jurídica, hablante nativa de español paraguayo. Define los criterios de calidad y validación.

Socio académico · Autoridad lingüística

Dr. Ramón Raimundo Silva Fernández Devalicoff

UNA · Ateneo de Lengua y Cultura Guaraní · Corte Suprema de Justicia. Co-autor de la Ley de Lenguas, autor principal del Diccionario General Bilingüe.

La base — el corpus de jopará vivo — es patrimonio: abierta y reutilizable. Encima se construyen modelos de dominio que sostienen el trabajo.

Capa 1 · Base abierta

Corpus de jopará vivo

Licencia abierta (CC-BY 4.0). Reutilizable por investigación, Estado y comunidad. Elegible para fondos de patrimonio lingüístico (Lacuna Fund, etc.).

Capa 2 · Modelos de dominio

Aplicaciones especializadas

Modelos especializados (medicina, derecho, cooperativas, banca, telecomunicaciones, entre otros). Propietarios y comerciales. Financian la base abierta. También el sector público: la Ley de Lenguas (4251/2010) obliga al Estado paraguayo a prestar servicios en guaraní.

Modelo de negocio híbrido: configuración inicial personalizada + licencia mensual institucional para cooperativas, universidades y entidades públicas. Acceso vía API para integraciones B2B en banca, telecomunicaciones y otros sectores.

Lo abierto da legitimidad cultural y acceso; la capa comercial encima hace el proyecto sostenible sin depender de un único financiador.

Contacto

Hablemos de cómo trabajar juntos.

Para alianzas, pilotos institucionales y colaboración en investigación:

contact@joparavibe.com