Tecnología 13News-Tecnología 25/06/2024

OpenAI y Anthropic: Polémica por ignorar robots.txt en el entrenamiento de IA

El mundo de la inteligencia artificial generativa se encuentra en el centro de una controversia. OpenAI y Anthropic, dos líderes en el campo de la IA, están siendo acusadas de ignorar una regla no escrita de internet conocida como robots.txt

El mundo de la inteligencia artificial generativa se encuentra en el centro de una controversia. OpenAI y Anthropic, dos líderes en el campo de la IA, están siendo acusadas de ignorar una regla no escrita de internet conocida como robots.txt. Esta práctica levanta preocupaciones sobre la ética en la recopilación de datos para el entrenamiento de modelos de IA.

Microsoft bajo escrutinio: La UE acusa prácticas antimonopolio con Teams

Según informes recientes de Business Insider, ambas compañías estarían haciendo caso omiso de las solicitudes de editores de medios que piden que no se utilice el contenido de sus sitios web para alimentar los modelos de entrenamiento de IA. Esta revelación contradice las declaraciones públicas de OpenAI y Anthropic, que afirman respetar robots.txt y los bloqueos de sus rastreadores web específicos, GPTBot y ClaudeBot.

La startup TollBit, especializada en negociar acuerdos de licencia entre editoras y empresas de IA, ha descubierto que varias compañías están eludiendo esta norma. Aunque no se han nombrado específicamente a las empresas en cuestión, las evidencias apuntan hacia OpenAI y Anthropic.

Milei en Praga: Premio Liberal, Teoría y como convertir a Argentina en "el país más libre y rico del mundo"

Robots.txt es un fragmento de código utilizado desde finales de los años 90 para indicar a los rastreadores de bots que ciertos datos de un sitio web no deben ser recopilados. Esta práctica se ha convertido en una regla no oficial ampliamente aceptada en internet.

El auge de la IA generativa ha intensificado la necesidad de datos de alta calidad para entrenar modelos cada vez más potentes. Chatbots como ChatGPT de OpenAI y Claude de Anthropic requieren enormes cantidades de información para funcionar, gran parte de la cual está protegida por derechos de autor.

Desempleo en Argentina Alcanza el 7,7%: Impacto de la Recesión y Análisis del Mercado Laboral en 2024

Esta situación ha generado un debate sobre los derechos de autor en la era de la IA. Algunas empresas han argumentado ante la Oficina de Derechos de Autor de Estados Unidos que, en lo que respecta a datos de entrenamiento para IA, nada en la web debería tener protección de autoría.

OpenAI ha tomado medidas para abordar estas preocupaciones, firmando acuerdos con algunos editores para acceder al contenido de sus sitios web. Sin embargo, la polémica persiste y se espera que la Oficina de Derechos de Autor de Estados Unidos actualice sus directrices sobre IA y derechos de autor a finales de este año.

El auge de Reddit: Cómo el tráfico de la plataforma creció un 39% gracias a Google

Esta controversia plantea importantes cuestiones éticas y legales sobre el uso de datos en internet para el desarrollo de la IA. ¿Cómo se puede equilibrar la necesidad de innovación en IA con el respeto a los derechos de propiedad intelectual? ¿Deberían establecerse nuevas regulaciones para abordar estas prácticas?

El debate seguramente continuará a medida que la tecnología de IA siga evolucionando. Mientras tanto, la industria de la IA se enfrenta a un escrutinio cada vez mayor sobre sus prácticas de recopilación de datos y el respeto a las normas establecidas de internet.

Millennials y el Miedo a Envejecer: Cómo las Marcas Aprovechan la Ansiedad Generacional

Esta situación subraya la necesidad de un diálogo continuo entre las empresas de tecnología, los creadores de contenido y los reguladores para establecer pautas claras y éticas en el desarrollo de la inteligencia artificial. El futuro de la IA dependerá en gran medida de cómo se resuelvan estos desafíos.

Te puede interesar

La inteligencia artificial y la demanda de energía: ¿la nueva crisis invisible del siglo XXI?

Los centros de datos podrían concentrar hasta el 8% del consumo eléctrico mundial en 2040. La IA promete optimizar recursos, pero su expansión sin regulación energética es el desafío estructural del siglo.

GPT-5.4: OpenAI lanza el primer modelo de IA que controla ordenadores de forma autónoma

El nuevo sistema integra razonamiento avanzado, codificación y agentes autónomos con capacidad para ejecutar flujos de trabajo complejos sin intervención humana, con un contexto de un millón de tokens. 

Anthropic vs. Pentágono: la batalla por los límites de la IA que divide a Silicon Valley y al Congreso

OpenAI admitió que su acuerdo con el Departamento de Defensa fue "oportunista", mientras demócratas prometen legislación para proteger a empresas que marquen límites éticos al uso militar de la inteligencia artificial.

Anthropic vs. Pentágono: Dario Amodei rechaza uso militar de Claude y enfrenta ultimátum

 
La startup de IA valorada en 380.000 millones de dólares tiene plazo hasta el viernes para ceder ante el Departamento de Defensa, que amenaza con invocar una ley de la Guerra Fría.

Agentes de IA Sin Controles de Seguridad: El Riesgo Sistémico que la Industria Tecnológica No Quiere Mostrar

Un estudio de Cambridge, MIT y Stanford revela que solo 4 de 30 agentes de IA líderes publican documentos formales de seguridad. La autonomía crece. La transparencia, no. Las implicancias para empresas, inversores y usuarios son más graves de lo que el sector reconoce.

Guerra de titanes IA: OpenAI busca u$s100.000 millones y Anthropic vale u$s380.000 millones; la carrera que redefine el capitalismo tecnológico global

Dos rondas de financiación históricas en el mismo mes configuran un nuevo paradigma de concentración de capital en inteligencia artificial. Amazon, SoftBank, Nvidia y Microsoft apuestan cifras sin precedentes mientras surgen interrogantes sobre la sostenibilidad estructural del modelo.