[11/01/2023] La inteligencia artificial (IA) se ha convertido de repente en la estrella del mundo de la tecnología gracias a ChatGPT, un chatbot capaz de mantener conversaciones y escribir ensayos y artículos con una habilidad que algunos consideran humana. En sus primeros cinco días, más de un millón de personas se inscribieron para probarlo. El New York Times alaba su "brillantez y rareza" y afirma que inspira tanto asombro como temor.
A pesar de todo el bombo y platillo que rodea a ChatGPT, lo que está haciendo ahora son esencialmente acrobacias, una forma de captar toda la atención posible. El futuro de la IA no está en escribir artículos sobre Beyonce al estilo de Charles Dickens, ni en ninguna de las otras cosas raras para las que la gente utiliza ChatGPT. En su lugar, la IA será principalmente una herramienta de negocio, que reportará miles de millones de dólares a las empresas que la utilicen para tareas como mejorar las búsquedas en Internet, escribir código de software, descubrir y solucionar ineficiencias en el negocio de una empresa, y extraer información útil y procesable de cantidades masivas de datos.
Pero hay un pequeño y sucio secreto en el núcleo de la IA: el robo de propiedad intelectual. Para hacer su trabajo, la IA necesita ingerir constantemente datos, muchos datos. Piense en ella como en la planta monstruosa Audrey II de La pequeña tienda de los horrores, que grita constantemente "¡Aliméntame!". Los detractores afirman que la IA viola las leyes de propiedad intelectual al acaparar información sin obtener los derechos sobre ella, y que las cosas no harán más que empeorar a partir de ahora.
Una demanda de propiedad intelectual contra Microsoft puede determinar el futuro de la IA. En ella se acusa a Microsoft, al repositorio de código de Microsoft GitHub y a OpenAI, matriz de ChatGPT, de haber utilizado ilegalmente código creado por otros para construir y entrenar el servicio Copilot, que utiliza IA para escribir software. (Microsoft ha invertido mil millones de dólares en OpenAI).
El futuro de la IA puede depender del resultado de la demanda.
A por todas con la IA
Para entender la demanda, primero hay que comprender la gran apuesta de Microsoft por la IA. Satya Nadella, CEO de Microsoft, cree que la IA transformará Microsoft de la misma manera que lo hizo la nube. Recientemente dijo: "Creo que la próxima fase -si se dice que el móvil y la nube fueron el último paradigma- va a ser la IA".
La IA se utilizará en todos los ámbitos de la empresa, desde la nube a la búsqueda en Bing, e incluso en el propio Windows. En la conferencia CES de la semana pasada, explicó: "La Inteligencia Artificial va a reinventar cómo se hace todo en Windows, literalmente". Solo dio algunos detalles, como una interfaz de lenguaje natural, pero sin duda hay mucho trabajo en marcha que aún no quiere desvelar.
La combinación de la IA y la nube es quizá el enfoque más importante de la empresa. ChatGPT funciona con la tecnología en la nube Azure de Microsoft, y se entrenó utilizando la infraestructura de supercomputación de IA de Azure. Microsoft venderá a las empresas capacidades de IA basadas en Azure, lo que significa que las empresas podrán aprovechar las ventajas de la IA sin necesidad de crear ninguna infraestructura: simplemente podrán utilizar la IA basada en la nube de Microsoft. El producto, denominado Azure OpenAI Service, ya está disponible en versión preliminar.
Microsoft también planea integrar la IA ChatGPT3 con la búsqueda Bing para mejorar los resultados de las búsquedas y ofrecer directamente la información que la gente busca, en lugar de limitarse a remitirla a páginas web.
Copilot y la piratería informática
Ahora llegamos al servicio que ha provocado la demanda contra Microsoft: Copilot. Se trata de un asistente de codificación de IA que escupe código para crear funciones básicas de software, liberando a los desarrolladores para que puedan centrarse en tareas de programación más complicadas y de mayor nivel. Los programadores solo tienen que decirle a Copilot lo que quieren crear, y Copilot crea código listo para usar que pueden pegar en su trabajo. Pero esto es solo por hoy. Con la formación suficiente, no sería de extrañar que los no programadores fueran capaces de crear aplicaciones sencillas sin saber una línea de código y, con el tiempo, quizá también aplicaciones más complicadas.
Para hacer su magia, Copilot necesita una gran cantidad de código. El repositorio de código abierto GitHub, propiedad de Microsoft, en el que se ejecuta Copilot, dice que está "entrenado en miles de millones de líneas de código público". La forma en que Copilot obtiene ese código fuente abierto es el núcleo de la demanda.
El código fuente abierto no es de dominio público. A menudo está protegido por derechos de autor. Se puede utilizar sin pagar por él, pero solo si la persona que lo utiliza acepta los términos de la licencia del software. Existe una gran variedad de licencias de código abierto con distintos términos. Por ejemplo, una licencia puede exigir que cualquier software creado a partir del código fuente abierto incluya el nombre del creador del código original y un aviso de copyright.
Copilot no se adhiere a esas licencias. Microsoft afirma que no necesita hacerlo. El consejero delegado de GitHub, Nat Friedman, afirma que Copilot puede utilizar cualquier código fuente abierto para entrenar, independientemente de las licencias, porque entra dentro del "uso justo" de la ley de derechos de autor. Muchas otras empresas e investigadores de IA afirman lo mismo.
Matthew Butterick, programador, escritor y abogado, no está de acuerdo. Él y el bufete de abogados Joseph Saveri han presentado una demanda colectiva contra Microsoft GitHub y OpenAI, alegando que "se aprovechan del trabajo de los programadores de código abierto violando las condiciones de sus licencias de código abierto". En lenguaje llano, la demanda señala que Microsoft y los demás son piratas informáticos, que roban la propiedad intelectual de quienes crearon el código utilizado para entrenar a Copilot. (Butterick dice que a veces, cuando alguien pide a Copilot que escriba software, el código resultante es una copia exacta del código de fuente abierta sobre el que se formó a Copilot).
Butterick advierte que Copilot es solo la nariz del camello bajo la tienda, y que se avecinan robos de propiedad intelectual mucho más masivos, no solo de código, sino de imágenes, escritos y datos de cualquier tipo. Según declaró a The New York Times, "las ambiciones de Microsoft y OpenAI van mucho más allá de GitHub y Copilot. Quieren entrenar con cualquier dato en cualquier lugar, gratis, sin consentimiento, para siempre".
Y tiene razón. Los generadores de imágenes de IA, como DALL-E 2, gestionado por OpenAI, ya se entrenan en imágenes encontradas en la Web.
Una de las grandes ironías del uso que hace Microsoft del software de código abierto y de su confianza en el argumento del "uso justo", es que durante años la empresa luchó contra el código abierto como si fuera el mismísimo diablo. En el 2000, el entonces director ejecutivo de Microsoft, Steve Ballmer, dijo que el software de código abierto de Linux tiene "las características del comunismo". Un año después redobló la apuesta, calificándolo de "cáncer".
Hacia dónde vamos
En gran medida, este pleito determinará el futuro de la IA. Si Microsoft gana, la IA avanzará a toda velocidad y podrá engullir y entrenarse con código, imágenes, artículos y datos creados por otros. La advertencia de Butterick de que la IA utilizará cualquier dato de forma gratuita en cualquier momento y lugar se hará realidad casi con toda seguridad. Si Microsoft pierde, quienes creen IA tendrán que actuar con mucho más cuidado, posiblemente frenando la creación de IA, pero respetando la propiedad intelectual de artistas, escritores, programadores y otros.
Basado en el artículo de Preston Gralla (Computerworld) y editado por CIO Perú