
[27/06/2023] El panorama informático empresarial está plagado de tecnologías que supuestamente cambiaron el paradigma, aunque no estuvieron a la altura de las expectativas. Pero la IA generativa, que ha tomado el mundo por asalto en forma del chatbot ChatGPT de OpenAI, podría ser el verdadero negocio.
Chris Bedi, director de información digital de ServiceNow, afirma que el lanzamiento de ChatGPT el pasado noviembre fue "un momento iPhone", un acontecimiento que captó la atención del público de una forma que "lo cambió todo para siempre". Predice que la IA generativa se integrará en el tejido de todas las empresas, y recomienda que los CIO y otros responsables de TI empiecen ya a desarrollar sus estrategias de IA generativa.
Gartner no es menos efusivo y predice que la IA generativa se convertirá en "una tecnología de uso general con un impacto similar al de la máquina de vapor, la electricidad e Internet". Aunque la IA generativa aún está en pañales y hay que sortear muchos escollos, Gartner señala que "la IA generativa ofrece oportunidades nuevas y disruptivas para aumentar los ingresos, reducir los costos, mejorar la productividad y gestionar mejor los riesgos. En un futuro próximo, se convertirá en una ventaja competitiva y un elemento diferenciador".
La IA existe desde hace mucho tiempo, pero la IA generativa lleva el aprendizaje automático al siguiente nivel con una arquitectura de red neuronal llamada transformer (la T de GPT), descrita por primera vez por investigadores de Google en el 2017. Por lo tanto, esto es nuevo. Los sistemas de IA generativa se construyen sobre conjuntos de datos preentrenados (la P de GPT) (45 terabytes para ChatGPT), y son capaces de responder a consultas en lenguaje conversacional. La IA generativa puede producir texto, imágenes y video, así como código de software y scripts de red.
Fuimos directamente a la fuente y preguntamos a la propia ChatGPT cómo puede facilitar la vida a los informáticos de empresa. Tras una pausa de no más de un par de segundos, nos respondió con una lista numerada: 1) solución de problemas y resolución de incidencias, 2) documentación y gestión del conocimiento, 3) automatización y scripting, 4) formación e incorporación, 5) seguridad y cumplimiento, 6) gestión y planificación de proyectos, 7) estar al día de las tendencias tecnológicas.
Es importante señalar que, aunque ChatGPT puede proporcionar una valiosa orientación y apoyo, no se debe confiar únicamente en él para la toma de decisiones críticas. La experiencia y el juicio humanos deben considerarse siempre junto a las sugerencias generadas por la IA.
Después de conocer la perspectiva del chatbot, pasamos a los especialistas para que nos dieran su opinión sobre varias cuestiones clave acerca de la IA generativa: ¿Qué es exactamente? ¿Qué puede hacer por las empresas de TI? ¿Qué no puede hacer? ¿Cómo se consigue? ¿Cuáles son algunos de los peligros potenciales que se deben tener en cuenta?
¿Qué es la IA generativa y en qué se diferencia de la IA "tradicional"?
En su mayor parte, la tecnología tradicional de IA/ML permanece en segundo plano, tratando de identificar patrones en grandes conjuntos de datos. Realiza predicciones y ofrece recomendaciones basadas en ellas.
La IA generativa es fundamentalmente diferente. Es un gran modelo lingüístico (LLM) entrenado con grandes cantidades de datos, incluidas muestras de conversaciones humanas. Es capaz de digerir y resumir datos y puede interactuar con un humano utilizando lenguaje natural. ChatGPT es un súper Siri que sorprendió incluso a sus creadores cuando acumuló un millón de usuarios en su primera semana tras el lanzamiento, y 100 millones al cabo de dos meses. Actualmente genera 1.800 millones de visitas al mes.
En general, cuando los sistemas escalan rápidamente, se vuelven más complejos, más difíciles de gestionar, menos fiables y menos eficientes. Con grandes modelos lingüísticos, cuantos más datos, más consultas, más interacciones, más inteligente se vuelve el sistema, y más empieza a parecerse a la inteligencia humana.
Pero, al menos en esta fase, estos modelos no son lo mismo que la inteligencia humana. Rowan Curran, analista de Forrester, afirma: "Lo que no están haciendo es crear nueva información neta que tenga una comprensión contextual de sí misma. Estos modelos predicen la siguiente palabra de una secuencia basándose en las palabras anteriores de esa secuencia. Es importante no tratarlos como una fuente de autoridad, un oráculo o algo que tenga una mente detrás".
¿Qué puede hacer la IA generativa por la informática empresarial?
En la capa de red, los grandes modelos lingüísticos pueden realizar funciones como generar configuraciones de red, escribir scripts para herramientas de automatización de TI y crear mapas de red, anota Shamus McGillicuddy, vicepresidente de investigación de Enterprise Management Associates.
"Es muy bueno para la inspiración, la imaginación y la antiprocrastinación. Se puede utilizar para empezar una tarea o un proyecto. Pídale que le dé algo, como un contenido o un código. Entonces uno puede utilizar sus conocimientos y habilidades para convertirlo en algo bueno, ya sea un documento de política o un archivo de configuración de red", afirma McGillicuddy.
En el desarrollo de software, la IA generativa puede escupir fragmentos de código y tiene capacidad para depurar códigos. Los grandes modelos lingüísticos utilizan el término "token" del mismo modo que los profesionales informáticos hablan de bytes. En ChatGPT, un token representa cuatro caracteres, es decir, aproximadamente tres cuartas partes de una palabra. Esto es importante porque cada consulta/respuesta de ChatGPT tiene un límite de unos cuatro mil tokens, y la propia redacción de la consulta cuenta para ese límite. Así pues, los sistemas de IA generativa pueden escribir fragmentos de código en diversos lenguajes de programación, pero no le pida que creen nuevas versiones de un sistema operativo, porque cuando alcanzan ese límite, se detienen y se reinician.
A nivel estratégico, a medida que los responsables de TI se familiaricen y se sientan más cómodos con la IA generativa, podrán desplegarla en toda la empresa para aumentar la productividad de los empleados, agilizar los procesos empresariales, mejorar el servicio al cliente e impulsar la transformación digital.
Bedi señala que la capacidad de la IA generativa para tomar grandes piezas de información dispar y compleja y resumirlas para el consumo humano tiene aplicaciones para ITOps, análisis de registros de seguridad y eventos, atención al cliente, centro de llamadas, servicio de asistencia, finanzas, recursos humanos, ventas y marketing. "Todo el mundo está inundado de toneladas de contenido; la IA generativa tiene la capacidad de destilarlo en algo útil y consumible. Puede acelerar todas las operaciones de la empresa", añade.
Escollos de la IA generativa
Si todo esto suena demasiado bueno para ser verdad, es porque probablemente lo sea, al menos por ahora. Un informe de McKinsey advierte: "Los resultados que producen los modelos de IA generativa pueden parecer a menudo muy convincentes. Pero a veces la información que generan es simplemente errónea. Peor aún, a veces está sesgada (porque se basa en los prejuicios de género, raciales y de otro tipo de Internet y de la sociedad en general), y puede manipularse para permitir actividades poco éticas o delictivas".
Curran, de Forrester, utiliza el término "sinsentido coherente" para describir este fenómeno. Pero el término que está ganando más adeptos en el ecosistema de la IA generativa es "alucinación".
El futurista Bernard Marr afirma: "La alucinación en IA se refiere a la generación de resultados que pueden parecer plausibles, pero que son incorrectos o no están relacionados con el contexto. Estos resultados suelen surgir de los sesgos inherentes al modelo de IA, la falta de comprensión del mundo real, o las limitaciones de los datos de entrenamiento. En otras palabras, el sistema de IA "alucina" con información para la que no ha sido explícitamente entrenado, lo que da lugar a respuestas poco fiables o engañosas".
Esto significa que el departamento de TI de la empresa no debe poner en producción código de software de IA generativa o scripts de red sin que una persona los verifique primero, un enfoque denominado "humano en el bucle". Y las organizaciones deben disponer de sistemas para detectar casos en los que el chatbot pueda interactuar con los clientes de una forma que pueda considerarse argumentativa, ofensiva o inapropiada.
La explosión de interés en ChatGPT también ha desencadenado preocupaciones sobre la privacidad de los datos y la IA generativa en la sombra, ya que debe asumirse que los empleados de todos los niveles están haciendo preguntas a ChatGPT.
"Me preocupan mucho los datos que se introducen en ChatGPT cuando se realizan consultas", afirma McGillicuddy. "Me preocupa cómo se utilizan y almacenan esos datos, y qué derechos hace valer Open AI sobre ellos".
Keatron Evans, asesor principal de ciberseguridad del InfoSec Institute, advierte: "No utilice datos protegidos ni información personal cuando utilice o experimentes con IA. Por ejemplo, digamos que tiene un informe de ventas confidencial y quiere generar un resumen utilizando IA. Sube el informe, pero ahora los datos que ha introducido están almacenados en los servidores de ChatGPT, y utilizará esos datos para responder a consultas de otras personas, exponiendo posiblemente la información confidencial de su empresa".
Añade que los hackers podrían explotar las vulnerabilidades del código de ChatGPT para robar información de los usuarios, o encontrar una forma de robar esos datos directamente de la propia app. "En cualquier caso, subir datos o información sensible podría violar las leyes de privacidad, lo que haría que su empresa se enfrentara posiblemente a grandes multas", señala Evans.
Otra cuestión más confusa se refiere a la propiedad intelectual. Supongamos que un empleado sube a ChatGPT un código de software propietario, y le pide que lo depure o le añada una funcionalidad. Ese código se introduce en la base de datos de ChatGPT. ¿Qué ocurre cuando otra persona de otra empresa consulta ChatGPT y el resultado incluye fragmentos del código original?
Samsung prohibió recientemente el uso de ChatGTP a sus empleados después de que un ingeniero "filtrara accidentalmente código fuente interno cargándolo en ChatGPT", según una nota interna.
Cómo deben adquirir las organizaciones la IA generativa
La comunidad de proveedores se apresura a ofrecer IA generativa a las empresas. Los sospechosos habituales están a la cabeza (Google, AWS, Microsoft, IBM), ya que disponen de los recursos necesarios para desarrollar estos grandes modelos lingüísticos. Pero casi todos los proveedores están buscando la manera de integrar la IA generativa en sus plataformas.
Nancy Gohring, analista de IDC, afirma: "Los proveedores de ITSM e ITOps ya están aplicando la IA generativa a diversos casos de uso, principalmente con el objetivo de mejorar la usabilidad de las herramientas, acelerar los tiempos de respuesta y ampliar los casos de uso. Aunque garantizar la supervisión humana es fundamental, sobre todo dada la inmadurez de la tecnología, las empresas deben considerar seriamente la adopción de nuevas ofertas como una forma de mejorar la eficiencia".
Para los responsables de TI, un enfoque sensato sería trabajar con los socios de plataformas existentes para determinar cómo se alinea la hoja de ruta del proveedor con el estilo de adquisición de tecnología de sus empresas. ¿Tiene la empresa la voluntad y la preparación (ya sea desde el punto de vista de las competencias, la financiación o la infraestructura de procesamiento de datos) para crear sus propias capacidades de IA generativa? Este enfoque puede suponer una ventaja competitiva, pero también requiere tiempo y esfuerzo.
¿O tendría más sentido aprovechar los proveedores de tecnología existentes que están integrando la IA generativa en sus plataformas? Por ejemplo, Salesforce ha lanzado Einstein GPT, que aporta capacidades de IA generativa a la plataforma CRM de Salesforce, así como a la aplicación Slack.
Por supuesto, al igual que las organizaciones han adoptado arquitecturas de nube híbrida, es probable que las empresas adopten un modelo mixto que abarque tanto la nube como los despliegues locales. Una opción sería crear nuevas aplicaciones de IA generativa en la nube de AWS, utilizando la infraestructura, los grandes modelos lingüísticos y los conjuntos de herramientas de AWS. Otra sería crear una funcionalidad de IA generativa personalizada sobre las plataformas CRM o ERP de los proveedores.
Qué ofrecen algunos de los principales proveedores.
Estos son algunos ejemplos de cómo los principales proveedores están aumentando sus capacidades de IA generativa:
Microsoft: Microsoft, el principal inversor en OpenAI y su socio tecnológico, está integrando la tecnología ChatGPT en toda su cartera. Microsoft ha presentado Microsoft 365 Copilot, que integra la IA generativa en aplicaciones de productividad de Office como Word, Excel, Outlook y Teams. Una función llamada Business Chat combina el calendario, los correos electrónicos, los chats, los documentos, los contactos, etc. de un usuario en una base de conocimientos que puede consultarse en lenguaje natural. Microsoft ha anunciado Dynamics 365 Copilot, que aporta IA generativa a CRM y ERP. Y Microsoft ha integrado la funcionalidad ChatGPT en su motor de búsqueda Bing.
En un desarrollo relacionado, OpenAI se ha asociado con GitHub para ofrecer un producto comercial llamado GitHub Copilot, un chatbot de escritura de código que puede hablar más de una docena de lenguajes de programación.
Google: Google ha anunciado Duet AI para Google Workspace, que incorpora su IA Generativa (el gran modelo lingüístico de Google se llama PaLM) en la suite de productividad de Google (Gmail, Google Docs, Sheets, Slides y Meet). Google está incorporando funciones de IA Generativa a su navegador Chrome. Cuenta con una plataforma llamada Vertex AI que permite a las empresas y a los proveedores de SaaS crear sus propias aplicaciones; un servicio para ayudar a las empresas a crear aplicaciones de chat y búsqueda basadas en IA a partir de los modelos básicos de Google; y una respuesta a Copilot de GitHub llamada Duet, diseñada para ayudar a los desarrolladores a escribir código.
Cisco: Cisco ha creado su propia IA generativa y recientemente ha anunciado planes para comprar la empresa de IA, Armorblox. Cisco afirma que integrará las capacidades de IA generativa en toda su cartera, empezando por su servicio Security Cloud y la herramienta de colaboración Webex.
Cisco afirma que a finales de año un asistente de políticas basado en IA generativa podrá interactuar con los administradores de red para ayudarles a optimizar la gestión de políticas. Los administradores de seguridad y TI podrán describir políticas de seguridad granulares para tareas como la gestión de firewalls, y el asistente evaluará la mejor manera de aplicar las políticas en toda la infraestructura de seguridad.
Juniper: Juniper está integrando ChatGPT con su asistente de red virtual Marvis. Marvis, impulsado por la tecnología de IA que Juniper consiguió con la adquisición de Mist Systems, puede detectar y describir problemas de red en lenguaje natural. Al añadir las capacidades de ChatGPT, Juniper amplía el papel de Marvis, aumentando sus opciones de documentación y soporte para ayudar a los administradores de TI.
Los proveedores colaboran para ofrecer IA generativa en las instalaciones
Dell Technologies y Nvidia han puesto en marcha una iniciativa denominada Project Helix para ayudar a las empresas a crear y gestionar modelos de IA generativa in situ. El objetivo es apoyar el ciclo de vida completo de la IA generativa, incluyendo el aprovisionamiento de la infraestructura, el modelado, la formación, el ajuste, el desarrollo de aplicaciones y el despliegue. Dell aportará sus servidores PowerEdge, Nvidia proporcionará las GPU, la red y el paquete de software, que incluye su marco de modelos de lenguaje de gran tamaño NeMo y el software NeMo Guardrails para crear chatbots seguros.
Y, a medida que crezcan los ecosistemas de proveedores de IA generativa, sin duda veremos más colaboraciones como la anunciada recientemente entre Nvidia y ServiceNow, en la que las empresas trabajan juntas para crear aplicaciones para procesos de negocio y flujos de trabajo específicos. ServiceNow afirma que los primeros resultados de la colaboración se destinarán a crear aplicaciones de IA generativa para los departamentos de TI de las empresas, que incluirán el resumen, el enrutamiento y la resolución automáticos de las incidencias, la predicción de la gravedad de las mismas, la detección de intenciones, la búsqueda semántica y el análisis de la causa raíz.
Además, podemos esperar que los hiperescaladores, así como una nueva generación de startups SaaS, ofrezcan aplicaciones de IA generativa específicas para cada vertical. Por ejemplo, Google ha lanzado un conjunto de herramientas basadas en IA generativa para imágenes médicas. Y Gartner predice que, en dos años, "más del 30% de los nuevos medicamentos y materiales se descubrirán sistemáticamente mediante técnicas de IA generativa, frente al cero actual".
McKinsey afirma que "los directores ejecutivos deberían considerar la exploración de la IA generativa como un deber, no como un quizá. La IA generativa puede crear valor en una amplia gama de casos de uso. Los requisitos económicos y técnicos para empezar no son prohibitivos, mientras que la desventaja de la inacción podría ser quedar rápidamente por detrás de los competidores".
Lo que los responsables de TI de las empresas deberían hacer ahora
Establecer políticas: Según Gartner, "es probable que su personal ya esté utilizando IA generativa, ya sea de forma experimental o para apoyar sus tareas relacionadas con el trabajo". Para evitar el uso "en la sombra", Gartner recomienda elaborar una política de uso, en lugar de promulgar una prohibición rotunda. La política debería decir simplemente: No introduzca información personal identificable, información sensible o propiedad intelectual.
Y la empresa debería poner en marcha herramientas de supervisión. La comunidad de proveedores ya está tomando cartas en el asunto, con empresas como Zscaler, ExtraHop y LayerX que ofrecen formas de supervisar y controlar el uso de ChatGPT por parte de los empleados.
Establezca barandas: Mike Gualtieri, analista de Forrester, afirma que las organizaciones necesitan establecer políticas que permitan a los desarrolladores experimentar con la IA generativa, pero que establezcan barandas, como exigir que el código pase por una herramienta de escaneado de seguridad y que un humano lo compruebe dos veces. Si algo sale mal, "nunca puede culpar a GPT; es su responsabilidad", advierte Gualtieri.
Educar y formar: El revuelo en torno a ChatGPT ha generado entusiasmo, pero también cierto temor asociado a preocupaciones prácticas como los ataques a la ciberseguridad generados por estos sistemas, así como preocupaciones más emocionales como que las máquinas vengan a sustituirnos.
Planteamos esa misma pregunta a ChatGPT y obtuvimos lo siguiente: "Mi propósito es ayudar y aumentar las capacidades humanas, no sustituirlas. Aunque las tecnologías de IA como ChatGPT pueden automatizar ciertas tareas y proporcionar asistencia, no están diseñadas para sustituir la experiencia y la capacidad de toma de decisiones de los profesionales de TI".
Es importante que los responsables de TI de las empresas eduquen a los empleados de toda la compañía sobre el potencial de la IA Generativa para hacerles la vida más fácil. También es importante lanzar programas de formación para el personal de TI.
Reforzar la seguridad: McGillicuddy predice que "los actores maliciosos serán los usuarios más prolíficos de la IA generativa durante el próximo año más o menos". La preocupación es que la IA generativa sea capaz de escribir correos electrónicos de phishing convincentes y ayudar a los hackers a crear falsificaciones profundas. Los responsables de seguridad de las empresas deben mejorar sus defensas contra el phishing y sus herramientas de seguridad, como la protección contra la fuga de datos.
Crear equipos interdisciplinares: Las TI existen para apoyar a la empresa, por lo que los responsables de TI deben crear equipos interdisciplinares que puedan identificar y priorizar los procesos empresariales que pueden beneficiarse de la IA generativa.
Desarrollar una estrategia a largo plazo: Los responsables de TI de las empresas deben desarrollar una estrategia de IA generativa para toda la organización que responda a varias preguntas fundamentales. ¿Cómo puede ayudar a reducir costos? ¿Cómo puede aumentar la productividad de los empleados? ¿Cómo puede crear nuevas oportunidades de negocio? ¿Cuál es la mejor manera de adquirirla? ¿Cómo podemos implantarla de forma que evitemos los escollos?
Basado en el artículo de Neal Weinberg (Network World) y editado por CIO Perú
Puede ver también: