Uno de los elementos más importantes de un país, región o cultura es su idioma, porque es la herramienta de comunicación más común. Pero en el caso de las inteligencias artificiales no están siendo muy tomados en cuenta, pues es el inglés el que prevalece.
Estos nuevos modelos, como ChatGPT, son mucho menos competentes cuando se usan en otras lenguas diferentes al inglés. Incluso algunos idiomas no están incluidos en estos sistemas.
Investigadores de Inteligencia Artificial se muestran preocupados ante la pérdida de diversidad lingüística que esto conlleva.
Todos los estudios hechos hasta ahora tienen una conclusión común: los sistemas de IA entregan más resultados erróneos, se inventan datos o sencillamente no son tan eficaces en otros idiomas diferentes al inglés.
La supremacía del inglés se echa raíces más largas
Los estudios demuestran que la supremacía del inglés frente a otros lenguajes y culturas se podría estar haciendo aún más grande. Y la inteligencia artificial sería muy responsable de ello.
“Vamos a exacerbar el sesgo a favor del inglés y de los angloparlantes”, comenta Thien Huu Nguyen, investigador de la Universidad de Oregón. “La gente seguirá la norma y no pensará en su propia identidad o cultura. Eso acaba con la diversidad. Mata la innovación”, agregó.
Los modelos lingüísticos con los que trabajan los chats inteligentes recopilan miles de millones de datos extraídos de internet, libros y otros recursos. Aunque este sistema también es capaz de recabar información en otros idiomas, la mayoría de los textos se encuentran en inglés y chino debido al predominio económico y de población de estos países.
Entonces, para obtener mejores respuestas en los sistemas de inteligencia artificial es necesario formular preguntas en inglés.
Traducciones en un solo sentido
Se ha observado, además que las inteligencias artificiales son buenas traduciendo otros idiomas al anglosajón, pero no en la dirección contraria, sobre todo si estos idiomas no emplean alfabeto latino.
Un equipo de investigadores intentó pedir a ChatGPT que tradujera 30 frases del inglés al indonsesio. La IA acertó 28, pero en la otra dirección apenas alcanzó los 19. Resultados similares se repitieron también con al menos otros cinco idiomas.
Esta preferencia por el idioma de Shakespeare es incluso reconocida por los creadores de ChatGPT, OpenAI. En sus informes indican que la mayoría de los datos con los que trabajan proceden del inglés. Además, sus esfuerzos por afinar y estudiar el rendimiento del modelo se realizaron “con un punto de vista centrado en EE.UU.”.
Uso del inglés es casi una obligación
En el mundo científico están claros de que si no publicas en inglés, no eres relevante. Y esto se agravará en el futuro cercano si las herramientas de investigación con IA continúan funcionando peor en otros idiomas. Es como un castigo para quienes no hablan el idioma.
Más del 52% de la producción científica a nivel mundial está en inglés y solo un 2% de las publicaciones son escritas en español, de acuerdo con PubMed. Los artículos en el idioma de Cervantes se ven penalizados, reciben menos visualizaciones y tienen menor impacto en la comunidad científica.