Inicio / Tecnologia y Sociedad / Meta AI se Sabe Harry Potter de Memoria (Y Eso Nos Debería Preocupar)

Meta AI se Sabe Harry Potter de Memoria (Y Eso Nos Debería Preocupar)

Meta AI se Sabe Harry Potter de Memoria (Y Eso Nos Debería Preocupar)

Por Marta | 22 de June de 2025


¡Ojo al dato, queridos muggles tecnológicos! Que tenemos un problemón de los gordos entre manos. Resulta que los investigadores de Stanford, Cornell y West Virginia se han puesto a investigar qué tanto se acuerdan las inteligencias artificiales de los libros que han leído, y los resultados son para echarse las manos a la cabeza.

Vamos a ver, que me expliquen esto bien, porque la cosa tiene miga. Han pillado al modelo Llama 3.1 70B de Meta (sí, el mismo Meta de las gafas molones que os acabo de contar) y resulta que se sabe de memoria el **42% del primer libro de Harry Potter**. ¡El 42%! Que levante la mano quien se acuerda del 42% de un libro que leyó hace años. Pues esta IA sí.

¿En serio? ¿En serio de la buena? Porque esto no es que la IA haya «aprendido» de Harry Potter, es que se lo sabe palabra por palabra. Los investigadores han demostrado que puede reproducir fragmentos exactos de 50 palabras seguidas del libro de J.K. Rowling. Y aquí viene lo bueno: lo más flipante es que el modelo anterior de Meta, el Llama 1, solo se sabía el 4.4% del mismo libro. O sea, que en lugar de mejorar el problema, lo han empeorado.

Y yo me pregunto: ¿cómo narices se supone que esto es legal? Porque una cosa es que una IA «aprenda» de un texto y otra muy distinta es que se lo sepa de memoria y pueda reproducirlo. Esto huele a chamusquina legal de las gordas.

A ver, a ver, que esto se pone interesante. Los investigadores no se han quedado solo con Harry Potter. Han probado con montones de libros y han descubierto que Llama 3.1 se acuerda mucho mejor de los libros famosos (como El Hobbit o 1984) que de los libros raros que nadie conoce. Vamos, que tiene mejor memoria para los bestsellers que para la literatura independiente. Como todos nosotros, vaya.

Pero aquí viene la parte que me da más yuyu: esto significa que Meta ha entrenado su IA con libros protegidos por copyright sin pedir permiso. Y no solo eso, sino que la IA puede reproducir esos libros casi palabra por palabra. ¿Esto no es piratería a lo bestia?

No me digáis que no es una pasada (en el mal sentido) que tengamos a The New York Times demandando a OpenAI por hacer exactamente lo mismo, y mientras tanto Meta está ahí tan pancha con su IA que se sabe Harry Potter mejor que muchos fans de la saga.

Lo que más me mosquea es que Mark Lemley, uno de los investigadores del estudio, dice que esperaban encontrar «un nivel bajo de replicabilidad del orden del 1 o 2 por ciento». Pero se han encontrado con que algunos libros están memorizados al 42%. ¡Al 42%! Esto no es un «nivel bajo», esto es una biblioteca entera metida en el cerebro de la IA.

Vamos a ver, que me expliquen esto: si yo me descargo un libro de internet sin pagar, me pueden meter un puro legal. Pero si Meta entrena su IA con miles de libros sin pagar y luego esa IA puede reproducir esos libros, ¿eso está bien? Porque a mí me parece que hay algo que no cuadra en esta ecuación.

Y aquí viene lo que más me preocupa: esto va a ser un follón legal de dimensiones épicas. Porque resulta que no todos los autores están en la misma situación. Mientras que Harry Potter está memorizado al 42%, otros libros como «Sandman Slim» solo están memorizados al 0.13%. O sea, que J.K. Rowling tiene un caso legal mucho más fuerte que otros autores. Esto va a ser un caos para las demandas colectivas.

Esto es de locos, pero de los malos. Porque al final, lo que está pasando es que las grandes tecnológicas están usando el trabajo de miles de autores para entrenar sus IAs sin pagar un duro, y luego esas IAs pueden reproducir ese trabajo casi palabra por palabra. Y mientras tanto, nosotros aquí discutiendo si está bien o mal.

Y hasta aquí el drama legal de hoy, mis queridos geeks. Que esto va para largo y va a haber más capítulos que en una serie de Netflix. Nos leemos en la próxima, que seguro que hay más lío.

Un abrazo virtual y a seguir trasteando (pero con cuidado con lo que leen nuestras IAs).

Este artículo fue generado automáticamente por el Sistema de Blog de Marta
¡Que la tecnología os acompañe!