Nvidia en el ojo del huracán: La polémica del uso de contenido de YouTube y Netflix para entrenar IA

Una filtración masiva de documentos internos ha revelado que la compañía ha estado utilizando videos de plataformas populares como YouTube y Netflix para entrenar sus modelos de IA

Tecnología06/08/2024 13News-Tecnología

La Newsletter de Gustavo Reija - Economista y CEO de NETIA GROUP

4 informes exclusivos cada mes, con el análisis de las tendencias macroeconómicas y políticas con perspectivas sobre mercados financieros y su impacto en la industria. Recomendaciones estratégicas para inversores y empresarios.

Suscripción con MERCADOPAGO

En el vertiginoso mundo de la inteligencia artificial, donde la innovación y la ética a menudo se encuentran en una delicada danza, Nvidia, el gigante de la tecnología, se ha visto envuelto en una controversia que podría sacudir los cimientos de la industria. Una filtración masiva de documentos internos ha revelado que la compañía ha estado utilizando videos de plataformas populares como YouTube y Netflix para entrenar sus modelos de IA, una práctica que levanta serias preguntas sobre los derechos de autor y la ética en el desarrollo de la inteligencia artificial.

El proyecto en cuestión, conocido internamente como Cosmos, no es un simple experimento de laboratorio. Se trata de una iniciativa ambiciosa destinada a alimentar varios sistemas de IA de Nvidia, incluyendo su generador de mundos 3D Omniverse, sistemas de conducción autónoma y productos de "humanos digitales". La escala de esta operación es, francamente, asombrosa. Según un correo electrónico filtrado de Ming-Yu Liu, vicepresidente de Investigación en Nvidia y líder del proyecto Cosmos, la compañía estaba procesando "una experiencia visual de una vida humana en datos de entrenamiento por día". Imaginen eso por un momento: toda la información visual que una persona podría experimentar en una vida, condensada y procesada en un solo día. Es un volumen de datos que desafía la comprensión.

Pero, ¿cómo logra Nvidia recopilar tal cantidad de información? Aquí es donde las cosas se ponen interesantes, y potencialmente problemáticas. Según los documentos filtrados, la compañía ha estado utilizando un programa llamado yt-dlp para descargar videos de YouTube. Para evitar ser bloqueados por la plataforma de Google, utilizan máquinas virtuales que cambian constantemente de dirección IP. Es una táctica ingeniosa, pero que plantea serias dudas sobre su legalidad y ética.

La escala de esta operación es igualmente impresionante. Los encargados del proyecto Cosmos discutieron usar entre 20 y 30 máquinas virtuales en Amazon Web Services para descargar el equivalente a 80 años de videos completos y clips cada día. Es una cantidad de contenido que hace palidecer incluso a los más voraces consumidores de medios.

Naturalmente, esta revelación ha encendido un debate acalorado sobre los derechos de autor y el uso justo en la era de la IA. Nvidia, por su parte, se defiende argumentando que cumple "plenamente con la letra y el espíritu de la ley de derechos de autor". La compañía sostiene que la ley protege expresiones particulares, pero no hechos, ideas, datos o información, y que el uso de estos para propósitos como el entrenamiento de modelos está protegido por el uso justo.

Sin embargo, esta posición está lejos de ser universalmente aceptada. La práctica de "scraping" o raspado de datos de websites para entrenar modelos de IA ha sido objeto de creciente escrutinio y controversia en los últimos años. No es la primera vez que Nvidia se enfrenta a acusaciones de este tipo. En julio de 2023, la compañía fue acusada, junto con Anthropic y Salesforce, de extracción ilegal de videos con derechos de autor. Incluso en el CES 2024, surgieron dudas sobre cómo se entrenó su motor de IA generativa para juegos.

El caso de Nvidia es solo la punta del iceberg de un problema más amplio que enfrenta la industria de la IA. A medida que estas tecnologías se vuelven más sofisticadas y omnipresentes, la cuestión de cómo se obtienen y utilizan los datos de entrenamiento se vuelve cada vez más crucial. YouTube, por ejemplo, acusó a OpenAI de entrenar a Sora, su modelo de videos generativos con IA, utilizando contenido de su plataforma sin autorización. Reddit, por su parte, ha dejado claro a Microsoft que si quiere usar la información de su web para entrenar modelos de IA, tendrá que pagar por ello.

Estos casos plantean preguntas fundamentales sobre la propiedad intelectual en la era digital. ¿Quién es el dueño de los datos que circulan libremente por internet? ¿Cómo se puede equilibrar la necesidad de innovación en IA con la protección de los derechos de los creadores de contenido? ¿Es ético utilizar el trabajo creativo de millones de personas sin su conocimiento o consentimiento explícito para entrenar sistemas de IA que podrían, en última instancia, competir con ellos?

La situación se complica aún más cuando consideramos el potencial de estos modelos de IA. Los sistemas que Nvidia está desarrollando no son simples juguetes tecnológicos. Tienen el potencial de revolucionar industrias enteras, desde el entretenimiento hasta la automoción. El generador de mundos 3D Omniverse, por ejemplo, podría cambiar radicalmente la forma en que se crean videojuegos y películas. Los sistemas de conducción autónoma podrían transformar nuestras ciudades y la forma en que nos movemos. Y los "humanos digitales" abren un abanico de posibilidades que van desde asistentes virtuales ultrarrealistas hasta actores digitales indistinguibles de los reales.

Pero con gran poder viene gran responsabilidad. Si estos sistemas se están entrenando con contenido que potencialmente viola los derechos de autor, ¿qué implicaciones tiene esto para su uso futuro? ¿Podrían los creadores de contenido exigir compensación si un sistema de IA entrenado con su trabajo genera contenido similar? ¿Cómo se puede garantizar la transparencia en el proceso de entrenamiento de estos modelos?

La respuesta de Nvidia a estas acusaciones será crucial. Hasta ahora, la compañía ha optado por defender la legalidad de sus acciones, pero es posible que esto no sea suficiente para calmar las preocupaciones de la industria y el público en general. Es probable que veamos un aumento en las llamadas a una mayor regulación y transparencia en el desarrollo de la IA.

Este caso también podría tener implicaciones más amplias para la industria de la IA en su conjunto. Si se establece un precedente legal que restrinja el uso de contenido en línea para el entrenamiento de IA, podría ralentizar significativamente el desarrollo de estas tecnologías. Por otro lado, si se permite que esta práctica continúe sin restricciones, podría llevar a una erosión de los derechos de los creadores de contenido y potencialmente desincentivar la creación de nuevo contenido en línea.

Es importante recordar que la IA, como cualquier tecnología, no es inherentemente buena o mala. Su impacto depende de cómo la desarrollemos y utilicemos. El caso de Nvidia nos recuerda la importancia de considerar las implicaciones éticas y legales de nuestras innovaciones tecnológicas desde el principio, no como una ocurrencia tardía.

A medida que avanzamos hacia un futuro cada vez más moldeado por la IA, necesitamos un diálogo abierto y honesto sobre estos temas. Necesitamos encontrar un equilibrio entre fomentar la innovación y proteger los derechos de los creadores. Necesitamos regulaciones que sean lo suficientemente flexibles como para adaptarse al rápido ritmo del cambio tecnológico, pero lo suficientemente robustas como para prevenir abusos.

El caso de Nvidia y el proyecto Cosmos es un recordatorio de que estamos en territorio inexplorado. Las leyes y normas éticas que hemos desarrollado para el mundo analógico no siempre se traducen fácilmente al ámbito digital. Necesitamos repensar nuestros conceptos de propiedad intelectual, uso justo y consentimiento en la era de la IA.

En última instancia, el desarrollo de la IA debe ser un esfuerzo colaborativo que involucre no solo a las empresas tecnológicas, sino también a los creadores de contenido, los legisladores y el público en general. Solo a través de un diálogo abierto y una consideración cuidadosa de todas las perspectivas podremos navegar los complejos desafíos éticos y legales que plantea esta tecnología revolucionaria.

El caso de Nvidia es un punto de inflexión. Cómo respondamos a estos desafíos determinará no solo el futuro de la IA, sino también el tipo de sociedad digital que queremos construir. ¿Será un futuro donde la innovación tecnológica y los derechos de los creadores coexistan en armonía, o uno donde uno se sacrifique en aras del otro? La elección, en última instancia, es nuestra.

Te puede interesar

La inteligencia artificial y la demanda de energía: ¿la nueva crisis invisible del siglo XXI?

Claudia Grioni-Analista Política

Tecnología23/03/2026

Los centros de datos podrían concentrar hasta el 8% del consumo eléctrico mundial en 2040. La IA promete optimizar recursos, pero su expansión sin regulación energética es el desafío estructural del siglo.

GPT-5.4: OpenAI lanza el primer modelo de IA que controla ordenadores de forma autónoma

Rocío Reija Directora Marketing Digital

Tecnología07/03/2026

El nuevo sistema integra razonamiento avanzado, codificación y agentes autónomos con capacidad para ejecutar flujos de trabajo complejos sin intervención humana, con un contexto de un millón de tokens.

Anthropic vs. Pentágono: la batalla por los límites de la IA que divide a Silicon Valley y al Congreso

Rocío Reija - Directora de Marketing Digital

Tecnología03/03/2026

OpenAI admitió que su acuerdo con el Departamento de Defensa fue "oportunista", mientras demócratas prometen legislación para proteger a empresas que marquen límites éticos al uso militar de la inteligencia artificial.

Anthropic vs. Pentágono: Dario Amodei rechaza uso militar de Claude y enfrenta ultimátum

Rocío Reija-Directora Marketing Digital

Tecnología25/02/2026

La startup de IA valorada en 380.000 millones de dólares tiene plazo hasta el viernes para ceder ante el Departamento de Defensa, que amenaza con invocar una ley de la Guerra Fría.

Agentes de IA Sin Controles de Seguridad: El Riesgo Sistémico que la Industria Tecnológica No Quiere Mostrar

Rocío Reija-Directora Marketing Digital

Tecnología20/02/2026

Un estudio de Cambridge, MIT y Stanford revela que solo 4 de 30 agentes de IA líderes publican documentos formales de seguridad. La autonomía crece. La transparencia, no. Las implicancias para empresas, inversores y usuarios son más graves de lo que el sector reconoce.

Guerra de titanes IA: OpenAI busca u$s100.000 millones y Anthropic vale u$s380.000 millones; la carrera que redefine el capitalismo tecnológico global

Rocío Reija-Directora Marketing Digital

Tecnología19/02/2026

Dos rondas de financiación históricas en el mismo mes configuran un nuevo paradigma de concentración de capital en inteligencia artificial. Amazon, SoftBank, Nvidia y Microsoft apuestan cifras sin precedentes mientras surgen interrogantes sobre la sostenibilidad estructural del modelo.

Lo más visto

Economía en K: el país que crece para unos pocos y se rompe para la mayoría

Gustavo Rodolfo Reija-CEO Netia Group SAS

Economía16/06/2026

El RIGI vuela con blindaje de 30 años mientras las pymes proyectan perder 500.000 empleos en 2026. La grieta que importa ya no es política: es productiva.

La madre de todas las industrias trabaja a media máquina: la metalurgia perforó el piso de la pandemia

Gustavo Rodolfo Reija-CEO Netia Group SAS

Economía17/06/2026

El último informe del sector metalúrgico expone un dato que el discurso oficial prefiere no mirar: la actividad cayó 5,1% interanual en mayo y la utilización de la capacidad instalada se hundió al 39,8%, su peor nivel desde marzo de 2020. Detrás de la desinflación celebrada conviven fábricas que apagan sus máquinas.

El crecimiento que esconde una primarización

Redacción 13News

Economía24/06/2026

El PIB sube 2,3%, pero la industria y la inversión retroceden: el dato desnuda qué Argentina está creciendo primarizando su estructura productiva

Todas las fichas a la economía: la macro de la foto y el país que no aparece

Gustavo Rodolcfo Reija- CEO Netia Group SAS

Economía29/06/2026

El Gobierno apuesta a la reactivación para 2027, pero los dólares que celebra se fugan y la industria se contrae

El ancla que empieza a ceder: la baja calidad del ajuste fiscal argentino

Gustavo Rodolfo Reija-CEO Netia Group SAS

Economía17/07/2026

El resultado fiscal de junio, con déficit primario y financiero, comienza a mostrar la fragilidad de una de las bases del relato libertario: el ancla fiscal.

Newsletter