OpenAI eliminó datos cruciales en la demanda presentada por el New York Times sobre el uso de artículos periodísticos para entrenar sus modelos de inteligencia artificial: ¿se debió todo a un fallo técnico?
OpenAI, la empresa que creó ChatGPT, ha sido acusada de eliminar datos cruciales en una demanda presentada por The New York Times y otros periódicos importantes. La controversia se refiere al uso de artículos periodísticos para entrenar los modelos de inteligencia artificial de OpenAI, una cuestión que plantea importantes cuestiones sobre los derechos de autor y la propiedad intelectual en la era digital.
Según se informa, los abogados de los periódicos pasaron más de 150 horas analizando los datos de entrenamiento de OpenAI para identificar los artículos incluidos. Sin embargo, debido a un error no especificado, estas pruebas habrían sido eliminadas.
Datos eliminados por error: un fallo desafortunado
OpenAI admitió el error, pero el intento de recuperar los datos resultó ineficaz: la información recuperada era, de hecho, incompleta y poco fiable, comprometiendo la posibilidad de establecer con precisión cómo se utilizaron los artículos en el desarrollo de los modelos de inteligencia artificial. Los abogados de la empresa hablaron de datos eliminados debido a un «fallo» genérico , pero los del New York Times no levantaron sospechas de intenciones maliciosas, afirmando que no tienen «ninguna razón para creer» que la eliminación fue voluntaria.
La demanda, presentada en diciembre pasado por The New York Times Company, alega que OpenAI y su socio Microsoft utilizaron ilegalmente millones de artículos para entrenar sus herramientas de inteligencia artificial, creando competencia desleal con los editores. El New York Times pide miles de millones de dólares en concepto de daños y perjuicios.
Si bien el uso de obras protegidas por derechos de autor sin permiso es una clara violación de las leyes en la mayor parte del mundo, la complejidad de los procesos de entrenamiento de la IA dificulta determinar el origen exacto de los datos y su influencia en los modelos finales. Por tanto, la historia encaja en un contexto más amplio de debate sobre el impacto de la inteligencia artificial en el mundo de la información.
¿Qué opinas? Cuéntanos tu opinión en los comentarios a continuación, mientras OpenAI actualiza el modelo GPT-4o, que se confirma como el mejor en Chatbot Arena .