La Realidad, lo más increíble que tenemos

OpenAI y Anthropic: Polémica por ignorar robots.txt en el entrenamiento de IA

El mundo de la inteligencia artificial generativa se encuentra en el centro de una controversia. OpenAI y Anthropic, dos líderes en el campo de la IA, están siendo acusadas de ignorar una regla no escrita de internet conocida como robots.txt

Tecnología25/06/2024 13News-Tecnología

 La Newsletter de Gustavo Reija - Economista-CEO NETIA GROUP

Informe Privado Semanal - Suscripción Mensual (4 informes) con MERCADOPAGO

Captura de pantalla 2025-03-22 191711

 

El mundo de la inteligencia artificial generativa se encuentra en el centro de una controversia. OpenAI y Anthropic, dos líderes en el campo de la IA, están siendo acusadas de ignorar una regla no escrita de internet conocida como robots.txt. Esta práctica levanta preocupaciones sobre la ética en la recopilación de datos para el entrenamiento de modelos de IA.

01.-Microsoft-Open-AI-Are-Developing-Artificial-General-IntelligenceMicrosoft bajo escrutinio: La UE acusa prácticas antimonopolio con Teams

Según informes recientes de Business Insider, ambas compañías estarían haciendo caso omiso de las solicitudes de editores de medios que piden que no se utilice el contenido de sus sitios web para alimentar los modelos de entrenamiento de IA. Esta revelación contradice las declaraciones públicas de OpenAI y Anthropic, que afirman respetar robots.txt y los bloqueos de sus rastreadores web específicos, GPTBot y ClaudeBot.

La startup TollBit, especializada en negociar acuerdos de licencia entre editoras y empresas de IA, ha descubierto que varias compañías están eludiendo esta norma. Aunque no se han nombrado específicamente a las empresas en cuestión, las evidencias apuntan hacia OpenAI y Anthropic.

VC4CP3IO3RC5HAR57C6FLT6IC4Milei en Praga: Premio Liberal, Teoría y como convertir a Argentina en "el país más libre y rico del mundo"

Robots.txt es un fragmento de código utilizado desde finales de los años 90 para indicar a los rastreadores de bots que ciertos datos de un sitio web no deben ser recopilados. Esta práctica se ha convertido en una regla no oficial ampliamente aceptada en internet.

El auge de la IA generativa ha intensificado la necesidad de datos de alta calidad para entrenar modelos cada vez más potentes. Chatbots como ChatGPT de OpenAI y Claude de Anthropic requieren enormes cantidades de información para funcionar, gran parte de la cual está protegida por derechos de autor.

Anticioa-Inegi-caida-de-la-actividad-economica-en-febreroDesempleo en Argentina Alcanza el 7,7%: Impacto de la Recesión y Análisis del Mercado Laboral en 2024

Esta situación ha generado un debate sobre los derechos de autor en la era de la IA. Algunas empresas han argumentado ante la Oficina de Derechos de Autor de Estados Unidos que, en lo que respecta a datos de entrenamiento para IA, nada en la web debería tener protección de autoría.

OpenAI ha tomado medidas para abordar estas preocupaciones, firmando acuerdos con algunos editores para acceder al contenido de sus sitios web. Sin embargo, la polémica persiste y se espera que la Oficina de Derechos de Autor de Estados Unidos actualice sus directrices sobre IA y derechos de autor a finales de este año.

redditEl auge de Reddit: Cómo el tráfico de la plataforma creció un 39% gracias a Google

Esta controversia plantea importantes cuestiones éticas y legales sobre el uso de datos en internet para el desarrollo de la IA. ¿Cómo se puede equilibrar la necesidad de innovación en IA con el respeto a los derechos de propiedad intelectual? ¿Deberían establecerse nuevas regulaciones para abordar estas prácticas?

El debate seguramente continuará a medida que la tecnología de IA siga evolucionando. Mientras tanto, la industria de la IA se enfrenta a un escrutinio cada vez mayor sobre sus prácticas de recopilación de datos y el respeto a las normas establecidas de internet.

envejecer-algo-aterrador-empresas-utilizan-ese-miedo-vender-3554520Millennials y el Miedo a Envejecer: Cómo las Marcas Aprovechan la Ansiedad Generacional

Esta situación subraya la necesidad de un diálogo continuo entre las empresas de tecnología, los creadores de contenido y los reguladores para establecer pautas claras y éticas en el desarrollo de la inteligencia artificial. El futuro de la IA dependerá en gran medida de cómo se resuelvan estos desafíos.

Te puede interesar
21-hbr-ceo-ranking-jensen-huang

Nvidia apuesta 5.000 millones por Intel en crisis

13News-Tecnología
Tecnología20/09/2025

La industria de semiconductores presenció esta semana una de las alianzas más significativas de los últimos años cuando Nvidia confirmó una inversión estratégica de 5.000 millones de dólares en Intel, marcando un punto de inflexión para el fabricante de procesadores que atraviesa su peor crisis en décadas

OIP

Gemini 2.5 Flash: Google desafía dominio de Photoshop

13News-Tecnología
Tecnología30/08/2025

La industria del software de edición gráfica enfrenta una disrupción tecnológica significativa tras el lanzamiento oficial de Gemini 2.5 Flash, la propuesta de inteligencia artificial de Google que amenaza directamente el liderazgo histórico de Adobe Photoshop en el mercado de manipulación digital de imágenes

5nGaTKC_qdFN7qQKa5HIg

Chatbots de compañía dominan el 20% del mercado global de IA

13News-Tecnología
Tecnología30/08/2025

El ecosistema de aplicaciones de inteligencia artificial presenta una composición mucho más diversa y controversial de lo que cabría esperar, según revela el más reciente análisis semestral publicado por la prestigiosa firma de inversión Andreessen Horowitz

Lo más visto

Suscríbete al newsletter para recibir periódicamente las novedades en tu email