En este artículo de Datos.gob se reflexiona sobre los datos abiertos utilizados para entrenar los modelos de lenguaje SLM (Small Language Models) -ligeros y eficientes- y los LLM (Large Language Models) -pesados y potentes- en los que se basan las aplicaciones de IA generativa.