FotoReportaje - Galería de fotos

El mejor software de código abierto del 2021

Premios Bossie Awards 2021 de InfoWorld

  • Ganadores del premio Bossie Award de InfoWorld 2021

    ​Es posible que el dinero no crezca en los árboles, pero sí en los repositorios de GitHub. Los proyectos de código abierto producen el software más valioso y sofisticado del planeta, gratuito para su uso, lo que reduce drásticamente los costos de la tecnología de la información para todas las empresas. Si está buscando lo último en software, busque los proyectos de código abierto actuales.

    Encontrará 28 de esos proyectos vanguardistas aquí mismo, en los Best of Open Source Software Awards de InfoWorld. Nuestros ganadores del Premio Bossie 2021 representan el mejor y más innovador software -para desarrollo de software, DevOps, computación nativa de nube, aprendizaje automático y más- que el código abierto de hoy tiene para ofrecer.

    James R. Borck, Martin Heller, InfoWorld (EE.UU.) | 4/Noviembre/2021, Créditos foto: IDG

  • Svelte y SvelteKit

    ​En el área de marcos de trabajo de front end para JavaScript, de código abierto e innovadores, Svelte y su contraparte de stack completo, SvelteKit, son quizás los más ambiciosos y visionarios de todos. Svelte comenzó por alterar el statu quo al adoptar una estrategia de tiempo de compilación, y ha avanzado con un desempeño excelente, una evolución continua y una experiencia para desarrolladores superior. SvelteKit, que ahora se abre paso a través de la versión beta pública, continúa la tradición de Svelte de dar saltos adoptando las herramientas más recientes y haciendo que la implementación en ambientes sin servidor sea una característica incorporada.

    -Matthew Tyson

    James R. Borck, Martin Heller, InfoWorld (EE.UU.) | 4/Noviembre/2021, Créditos foto: IDG

  • Minikube

    ​Si Docker Desktop ha dejado de ser la primera opción debido a sus nuevos requerimientos de precios y licencias, tome en consideración Minikube. Como su nombre lo indica, Minikube es un clúster Kubernetes en miniatura que se ejecuta en el desktop. No se requiere una máquina virtual; Minikube funcionará en contenedores nativos o desde cero. Tampoco necesita una distribución de Linux en MacOS o Windows para que todo funcione; Minikube funciona en múltiples plataformas. También soporta varios tiempos de ejecución de contenedores (Docker, CRI-O o Containerd). Una gran cantidad de plataformas de integración continua funcionan de forma nativa con Minikube. La mejor parte es que, debido a que es Kubernetes, puede usar las herramientas y los componentes del propio Kubernetes si lo necesita.

    -Serdar Yegulalp

    James R. Borck, Martin Heller, InfoWorld (EE.UU.) | 4/Noviembre/2021, Créditos foto: IDG

  • Pixie

    Pixie es una herramienta de observabilidad para aplicaciones de Kubernetes, que puede ver el estado de alto nivel de sus clústeres, como mapas de servicio, recursos de clústeres y tráfico de aplicaciones, y también profundizar en vistas más detalladas, como el estado del pod, gráficos flame, y solicitudes individuales de aplicación de cuerpo completo. Pixie usa eBPF para recopilar automáticamente datos de telemetría; y recopila, almacena y consulta todos los datos de telemetría localmente en el clúster, utilizando menos del 5% de la CPU del clúster. Los casos de uso de Pixie incluyen la supervisión de la red dentro de un clúster, el estado de la infraestructura, el rendimiento del servicio y el perfil de consultas de la base de datos.

    -Martin Heller

    James R. Borck, Martin Heller, InfoWorld (EE.UU.) | 4/Noviembre/2021, Créditos foto: IDG

  • FastAPI

    ​Django y Flask han sido los marcos de trabajo web de Python líderes durante años. FastAPI ahora merece ser mencionado en el mismo grupo. FastAPI hace más que competir con esos marcos web en velocidad de desarrollo y ejecución -aunque definitivamente lo hace. FastAPI es un marco web Python verdaderamente moderno, escrito desde cero para usar componentes de sugerencia de tipo, asíncronos y de alta velocidad de forma predeterminada. Como su nombre lo indica, uno de los casos de uso común de FastAPI es establecer rápidamente APIs web potentes y que cumplan con los estándares. Pero FastAPI es igualmente adecuado para crear páginas web más convencionales.

    -Serdar Yegulalp

    James R. Borck, Martin Heller, InfoWorld (EE.UU.) | 4/Noviembre/2021, Créditos foto: IDG

  • Crystal

    Crystal, un proyecto para entregar un lenguaje de programación con la velocidad de C y la expresividad de Ruby, ha estado en desarrollo desde hace algunos años. Con el lanzamiento de Crystal 1.0 a principios de este año, el lenguaje ahora es lo suficientemente estable como para usarlo en cargas de trabajo generales. Crystal utiliza escritura estática y el compilador LLVM para lograr altas velocidades y evitar problemas comunes como referencias nulas en el tiempo de ejecución. Crystal puede interactuar con el código C existente para lograr mayor velocidad y conveniencia, y puede usar macros en el tiempo de compilación para extender la sintaxis del lenguaje base.

    -Serdar Yegulalp

    James R. Borck, Martin Heller, InfoWorld (EE.UU.) | 4/Noviembre/2021, Créditos foto: IDG

  • Windows Terminal

    ​Si existe alguna parte de Microsoft Windows que necesita urgentemente una actualización, es el host de consola lento, inflexible y anticuado -el componente que presenta las aplicaciones de línea de comandos en una ventana de texto. Ingrese a Windows Terminal, una aplicación de código abierto para terminales diseñada para brindar a los usuarios de Windows una experiencia de línea de comandos, similar a la que los usuarios de Mac y Linux han disfrutado durante mucho tiempo. La reproducción acelerada por GPU brinda un aumento de rendimiento de órdenes de magnitud en comparación con el host de la consola anterior, y las opciones de configuración le permiten personalizar la apariencia y el comportamiento del terminal de formas nunca posibles. Windows Terminal aún no ha reemplazado al antiguo host de la consola en Windows, pero dele tiempo.

    -Serdar Yegulalp

    James R. Borck, Martin Heller, InfoWorld (EE.UU.) | 4/Noviembre/2021, Créditos foto: IDG

  • OBS Studio

    ​La captura de video y la transmisión en vivo ya eran importantes antes de los años de la pandemia, y ahora son doblemente importantes. OBS Studio está muy por encima, incluso de las suites de captura de pantalla comercial y grabación de cámara. Los usuarios pueden crear múltiples definiciones de fuentes de captura (cámara en vivo, desktop completo, ventana específica), guardar capturas en archivos en el disco o transmitirlas en tiempo real a un proveedor. Los controles de teclas de acceso rápido le permiten realizar una transición sin problemas entre vistas, por lo que no tiene que capturar varias transmisiones y editarlas juntas. También se incluyen efectos de imagen en imagen, e incluso subtítulos en vivo (aunque eso todavía es experimental).

    -Serdar Yegulalp

    James R. Borck, Martin Heller, InfoWorld (EE.UU.) | 4/Noviembre/2021, Créditos foto: IDG

  • Shotcut

    Shotcut es una herramienta multiplataforma para la edición de videos que le está dando a Davinci Resolve una buena competencia. Shotcut permite hacer todas las correcciones estándar en pistas de audio y video, junto con la aplicación de efectos y capas. Shotcut tiene una comunidad realmente vibrante y ofrece muchos videos instructivos y orientación para ayudar tanto a los creadores de video principiantes como a los avanzados. Se ejecuta en Mac, Linux, BSD y Windows y, a pesar de ser multiplataforma, la interfaz es ágil y relativamente simple de usar en comparación con herramientas similares.

    -Andrew C. Oliver

    James R. Borck, Martin Heller, InfoWorld (EE.UU.) | 4/Noviembre/2021, Créditos foto: IDG

  • Weave GitOps Core

    Weave GitOps Core es una herramienta para hacer GitOps. GitOps le permite declarar su configuración en Git y hacer que un agente la aplique a su clústerde Kubernetes. La idea es tanto simplificar su flujo de trabajo de DevOps como hacer que su configuración sea más estable y segura al evitar cambios en la configuración. Un aspecto fundamental de este último es el "motor de reconciliación”, que detecta cambios en el estado declarado de Git y migra los cambios de configuración al ambiente de ejecución. Weave GitOps se basa en Flux, la implementación de referencia de GitOps de Cloud Native Computing Foundation.

    -Andrew C. Oliver

    James R. Borck, Martin Heller, InfoWorld (EE.UU.) | 4/Noviembre/2021, Créditos foto: IDG

  • Apache Solr

    Apache Solr es una plataforma de búsqueda de larga duración construida sobre Apache Lucene. Apache Lucene es la tecnología de búsqueda subyacente detrás de la funcionalidad de búsqueda del software que usted probablemente utiliza con más frecuencia, incluidos otros motores de búsqueda como Elasticsearch. A diferencia de Elasticsearch, que eliminó su licencia de código abierto, Solr sigue siendo gratuito. Solr se puede agrupar, se puede implementar en la nube y es lo suficientemente potente como para crear servicios de búsqueda de nivel de nube. Incluso incluye el algoritmo de aprendizaje de clasificación (LTR, por sus siglas en inglés) para ayudar a sintonizar y ponderar automáticamente los resultados.

    -Andrew C. Oliver

    James R. Borck, Martin Heller, InfoWorld (EE.UU.) | 4/Noviembre/2021, Créditos foto: IDG

  • MLflow

    ​Cuando un campo de la tecnología se vuelve lo suficientemente popular y complejo -con muchas partes móviles y muchas personas involucradas- termina teniendo una contraparte igualmente compleja de operaciones u "ops”. El aprendizaje automático no es diferente y, por lo tanto, tenemos "MLOps”. Creado por Databricks y alojado por Linux Foundation, MLflow es una plataforma MLOps que le permite a uno rastrear, administrar y mantener varios modelos de aprendizaje automático, experimentos y sus implementaciones. Le brinda herramientas para registrar y consultar experimentos (código, datos, configuración, resultados), empaquetar código de ciencia de datos en proyectos y encadenar estos proyectos en flujos de trabajo. Piense en DevOps y la gestión del ciclo de vida para el aprendizaje automático.

    -Andrew C. Oliver

    James R. Borck, Martin Heller, InfoWorld (EE.UU.) | 4/Noviembre/2021, Créditos foto: IDG

  • Orange

    Orange promete hacer que la minería de datos sea "fructífera y divertida”. Tiene un linaje que se remonta a casi un cuarto de siglo, pero todavía se usa ampliamente y se desarrolla activamente en la actualidad. Orange permite a los usuarios crear un flujo de trabajo de análisis de datos, y realizar todo tipo de funciones de análisis y aprendizaje automático, así como visualizaciones. A diferencia de las herramientas programáticas o textuales como R Studio y Jupyter, Orange es muy visual. Arrastra widgets a un lienzo para cargar un archivo, analizar datos con un modelo y visualizar los resultados. Los usuarios con una inclinación serpentina pueden usar el widget de secuencia de comandos de Python para manipular datos mediante programación.

    -Andrew C. Oliver

    James R. Borck, Martin Heller, InfoWorld (EE.UU.) | 4/Noviembre/2021, Créditos foto: IDG

  • Flutter

    Flutter es el conjunto de herramientas de interfaz de usuario de Google para crear aplicaciones compiladas de forma nativa para dispositivos móviles, web, desktop e integrados a partir de una única base de código. Se basa en el lenguaje Dart y en un amplio conjunto de widgets de Material Design y estilo Cupertino, totalmente personalizables, para crear interfaces nativas. Los widgets de Flutter incorporan todas las diferencias críticas de la plataforma, como el desplazamiento, la navegación, los íconos y las fuentes para proporcionar un rendimiento nativo completo, tanto en iOS como en Android.

    -Martin Heller

    James R. Borck, Martin Heller, InfoWorld (EE.UU.) | 4/Noviembre/2021, Créditos foto: IDG

  • Apache Superset

    Apache Superset es una aplicación web de inteligencia de negocios moderna y lista para su uso empresarial. Es rápida, liviana y fácil de usar, lo que permite a los usuarios de todos los conjuntos de habilidades explorar y visualizar sus datos, desde simples gráficos circulares hasta gráficos geoespaciales de deck.gl muy detallados. Superset proporciona una interfaz intuitiva para visualizar conjuntos de datos y crear paneles interactivos, una amplia gama de visualizaciones de datos, un generador de visualizaciones sin código y un IDE de SQL para preparar datos para su visualización. Asimismo, en el back end, usted encontrará soporte para la mayoría de las bases de datos que hablan SQL, consultas y almacenamiento en caché asincrónico en memoria, así como una arquitectura nativa de la nube, diseñada desde cero, para adaptar la escala.

    -Martin Heller

    James R. Borck, Martin Heller, InfoWorld (EE.UU.) | 4/Noviembre/2021, Créditos foto: IDG

  • Presto

    Presto es un motor SQL distribuido, de código abierto, para el procesamiento analítico en línea que se ejecuta en clústeres. Presto puede consultar una amplia variedad de fuentes de datos, desde archivos hasta bases de datos, y devolver resultados a muchos ambientes de análisis y BI. Además, Presto permite consultar datos donde estos residan, incluyendo a Hive, Cassandra, bases de datos relacionales y almacenes de datos propietarios. Una sola consulta de Presto puede combinar datos de múltiples fuentes. Facebook usa Presto para consultas interactivas en varios almacenes de datos internos, incluido su almacén de datos de 300 PB.

    La Fundación Presto es la organización que supervisa el desarrollo del proyecto de código abierto Presto. Facebook, Uber, Twitter y Alibaba fundaron la Fundación Presto. Los miembros adicionales ahora incluyen Alluxio, Ahana, Upsolver e Intel.

    -Martin Heller

    James R. Borck, Martin Heller, InfoWorld (EE.UU.) | 4/Noviembre/2021, Créditos foto: IDG

  • Apache Arrow

    Apache Arrow define un formato de memoria en columnas, independiente del lenguaje, para datos planos y jerárquicos, organizado para operaciones analíticas eficientes en CPUs y GPUs modernas. El formato de memoria Arrow también soporta lecturas de copia cero para un acceso a datos ultrarrápido, sin sobrecarga de serialización. El diseño de columnas contiguas permite la creación de vectores, utilizando las últimas operaciones SIMD (instrucción única, datos múltiples) incluidas en los procesadores modernos.

    Las bibliotecas de Arrow implementan el formato y proporcionan componentes básicos para una variedad de casos de uso, incluyendo la analítica de alto rendimiento. Muchos proyectos populares usan Arrow para enviar datos en columnas de manera eficiente o como base para motores analíticos. Las bibliotecas Arrow están disponibles para C, C++, C#, Go, Java, JavaScript, Julia, MATLAB, Python, R, Ruby y Rust.

    -Martin Heller

    James R. Borck, Martin Heller, InfoWorld (EE.UU.) | 4/Noviembre/2021, Créditos foto: IDG

  • InterpretML

    ​La IA explicable (XAI), también llamada IA interpretable, se refiere al aprendizaje automático y a los métodos de aprendizaje profundo que pueden explicar sus decisiones de una manera que los humanos puedan entender. La esperanza es que XAI eventualmente sea tan precisa como los modelos de caja negra. InterpretML es un paquete XAI de código abierto que incorpora varias técnicas de interpretación de aprendizaje automático de última generación. InterpretML le permite entrenar modelos interpretables y explicar los sistemas de caja negra. InterpretML le ayuda a comprender el comportamiento global de su modelo y las razones detrás de las predicciones individuales. Entre sus muchas características, InterpretML tiene un modelo de "caja de cristal” de Microsoft Research llamado Explainable Boosting Machine, y es compatible con Lime para explicaciones post-hoc mediante aproximaciones de modelos de caja negra.

    -Martin Heller

    James R. Borck, Martin Heller, InfoWorld (EE.UU.) | 4/Noviembre/2021, Créditos foto: IDG

  • Lime

    Lime (abreviatura de explicaciones agnósticas del modelo interpretable local) es una técnica post hoc para explicar las predicciones de cualquier clasificador de aprendizaje automático perturbando las características de una entrada y examinando las predicciones. La intuición clave detrás de Lime es que es mucho más fácil aproximar un modelo de caja negra mediante un modelo simple localmente (en el vecindario de la predicción que queremos explicar) que intentar aproximar un modelo globalmente. Lime se aplica tanto a los dominios de texto como a imágenes. El paquete Lime Python está disponible en PyPI con código fuente en GitHub, y también está incluido en InterpretML.

    -Martin Heller

    James R. Borck, Martin Heller, InfoWorld (EE.UU.) | 4/Noviembre/2021, Créditos foto: IDG

  • Dask

    Dask es una biblioteca de código abierto para computación paralela que puede hacer crecer los paquetes de Python a múltiples máquinas. Dask puede distribuir datos y cálculos a través de múltiples GPU, ya sea en el mismo sistema o en un clúster de múltiples nodos. Dask se integra con Rapids cuDF, XGBoost y Rapids cuML para analítica de datos acelerados por GPU y aprendizaje automático. También se integra con NumPy, Pandas y Scikit-learn para paralelizar sus flujos de trabajo.

    -Martin Heller

    James R. Borck, Martin Heller, InfoWorld (EE.UU.) | 4/Noviembre/2021, Créditos foto: IDG

  • BlazingSQL

    BlazingSQL es un motor SQL, acelerado por GPU, construido sobre el ecosistema Rapids. El código BlazingSQL es un proyecto de código abierto publicado bajo la licencia Apache 2.0. Blazing Notebooks es un servicio en la nube, creado en AWS, que combina BlazingSQL, Rapids y JupyterLab. Básicamente, BlazingSQL proporciona la parte ETL (extracción, transformación y carga) de un flujo de trabajo de ciencia de datos de GPU. Una vez que tenga GPU DataFrames en la memoria de GPU, puede usar Rapids cuML para el aprendizaje automático o convertir los DataFrames a DLPack o NVTabular para el aprendizaje profundo en GPU con PyTorch o TensorFlow.

    -Martin Heller

    James R. Borck, Martin Heller, InfoWorld (EE.UU.) | 4/Noviembre/2021, Créditos foto: IDG

  • Rapids

    Rapids, el conjunto de APIs y bibliotecas de software de código abierto de Nvidia, le brinda la capacidad de ejecutar canales de analítica y ciencia de datos de extremo a extremo por completo en GPUs. Rapids utiliza primitivas de Nvidia CUDA para la optimización de cómputo de bajo nivel y,a través de interfaces Python fáciles de usar, expone el paralelismo de la GPU y la velocidad de memoria de ancho de banda alto. Rapids depende del formato de memoria de columnas Apache Arrow e incluye cuDF, una biblioteca de manipulación de marcos de datos similar a Pandas; cuML, una colección de bibliotecas de aprendizaje automático que proporciona versiones GPU de la mayoría de los algoritmos disponibles en Scikit-learn; y cuGraph, una biblioteca similar a NetworkX para la analítica de gráficos acelerados.

    -Martin Heller

    James R. Borck, Martin Heller, InfoWorld (EE.UU.) | 4/Noviembre/2021, Créditos foto: IDG

  • PostHog

    PostHog es un marco de instrumentación fácil de usar para la analítica de productos, que ofrece un camino rápido para obtener información sobre el comportamiento del usuario de sus aplicaciones web y móviles. Simplemente agregue un pequeño fragmento de JavaScript a su código y estará listo. La captura automática de PostHog recopila la avalancha de eventos de interacción de front end que se activan durante la sesión de un usuario. Una interfaz de usuario, basada en menús de apuntar y hacer clic, facilita el trabajo de destilar esa avalancha de datos de eventos en métricas de acción significativas, gráficos de tendencias y paneles de control pequeños. Los embudos lo ayudan a refinar aún más los patrones de uso de compuestos para aislar los cuellos de botella y mejorar las tasas de rebote. Disponible para implementación on premises o en una oferta de SaaS, PostHog elimina el tedio y las conjeturas de optimizar la experiencia del usuario de sus productos de software.

    -James R. Borck

    James R. Borck, Martin Heller, InfoWorld (EE.UU.) | 4/Noviembre/2021, Créditos foto: IDG

  • LakeFS

    ​Al proporcionar una forma de "administrar su lago de datos de la misma manera que administra su código”, LakeFS agrega una capa de controles de versiones similares a Git al almacenamiento de objetos. Esta aplicación de la semántica de Git a los datos les permite a los usuarios crear sus propias ramas de datos aisladas y de copia cero en las que trabajar, experimentar y analizar modelos, sin el riesgo de corromper los objetos compartidos. LakeFS brinda útiles notas de confirmación, campos de metadatos y opciones de reversión a sus datos, junto con ganchos de validación para mantener la integridad y calidad de los datos: verificaciones de formato y esquema de ejecución antes de que una rama no comprometida se vuelva a fusionar accidentalmente con la producción. Con LakeFS, las técnicas familiares para administrar y proteger repositorios de código se pueden extender a repositorios de datos modernos como Amazon S3 y Azure Blob Storage.

    -James R. Borck

    James R. Borck, Martin Heller, InfoWorld (EE.UU.) | 4/Noviembre/2021, Créditos foto: IDG

  • Meltano

    ​Derivado de GitLab este año, Meltano es una alternativa gratuita, de código abierto, "DataOps” a la tradicional cadena de herramientas ELT (extraer, cargar, transformar). El marco de almacenamiento de datos de Meltano facilita el modelado, la extracción y la transformación de datos para su proyecto, y complementa el proceso de integración y transformación con herramientas de análisis y cuadros de mando incorporados que simplifican los informes. Al proporcionar una biblioteca sólida de extractores y cargadores, así como soporte para el estándar Singer para tomas de extracción de datos y objetivos de carga de datos, Meltano ya es una potencia para la orquestación de datos.

    -James R. Borck

    James R. Borck, Martin Heller, InfoWorld (EE.UU.) | 4/Noviembre/2021, Créditos foto: IDG

  • Trino

    Trino -anteriormente conocido como PrestoSQL- es un motor de análisis SQL distribuido, capaz de ejecutar consultas ultrarrápidas en grandes fuentes de datos distribuidas. Simultáneamente, Trino le permite ejecutar consultas en lagos de datos, almacenes relacionales o en varias fuentes diferentes, sin necesidad de copiar o mover datos para su procesamiento. Asimismo, Trino funciona bien con cualquier herramienta de análisis y BI que puedan estar usando sus científicos de datos, ya sean interactivos o ad hoc, minimizando la curva de aprendizaje. A medida que los ingenieros de datos se esfuerzan por soportar análisis cada vez más complejos en un número cada vez mayor de fuentes de datos, Trino proporciona una forma de optimizar la ejecución de consultas y acelerar los resultados de fuentes dispares.

    -James R. Borck

    James R. Borck, Martin Heller, InfoWorld (EE.UU.) | 4/Noviembre/2021, Créditos foto: IDG

  • StreamNative

    StreamNative es una plataforma de transmisión de eventos y mensajería con alta capacidad de crecimiento, que simplifica enormemente la instalación de canalizaciones de datos para herramientas de analítica e informes en tiempo real, así como para aplicaciones empresariales de transmisión. Combinando la poderosa arquitectura de procesamiento de flujo distribuido de Apache Pulsar con extras empresariales como Kubernetes y soporte de nube híbrida, una gran biblioteca de conectores de datos, autenticación y autorización sencillas, y herramientas dedicadas para el monitoreo de la salud y el rendimiento, StreamNative facilita el desarrollo deaplicacionesen tiempo real basadas en Pulsar y simplifica la implementación y administración de un backplane de mensajería a gran escala.

    -James R. Borck

    James R. Borck, Martin Heller, InfoWorld (EE.UU.) | 4/Noviembre/2021, Créditos foto: IDG

  • Hugging Face

    ​Sin ser un marco de aprendizaje profundo en sí mismo, Hugging Face ofrece el repositorio de aprendizaje profundo de código abierto más importante. El dominio total del proyecto del panorama basado en Transformers continúa aumentando, y se agregan nuevos modelos al repositorio pocos días después de la publicación de los artículos. El alojamiento de modelos va viento en popa, y un nuevo trabajo como Accelerate facilita el uso del entrenamiento distribuido de GPU. Ahora, las miras de Hugging Face están destinadas a expandirse mucho más allá del texto con soporte para imágenes, audio, video, detección de objetos y más. Los profesionales del aprendizaje profundo estarán atentos a este repositorio durante los próximos años.

    -Ian Pointer

    James R. Borck, Martin Heller, InfoWorld (EE.UU.) | 4/Noviembre/2021, Créditos foto: IDG

  • EleutherAI

    ​El modelo GPT-3 de OpenAI es un salto sorprendente en la generación de textos, capaz de alcanzar un rendimiento de nivel humano. Pero, aunque el acceso es limitado a través de la API, la versión entrenada de GPT-3 es totalmente accesible solo para OpenAI y Microsoft. Entra en escena EleutherAI, un grupo distribuido de investigadores de aprendizaje automático impulsado a llevar GPT-3 al resto de nosotros. Para empezar el año 2021, EleutherAI publicó The Pile, un enorme conjunto de datos de 825 gigabytes de texto diverso para el entrenamiento, y en junio el grupo dio a conocer GPT-J, un modelo de seis mil millones de parámetros aproximadamente equivalente a la variante Curie de GPT-3 de OpenAI. Con GPT-NeoX, EleutherAI planea llegar hasta los 175 mil millones de parámetros para competir con el modelo GPT-3 más amplio disponible en la actualidad. ¿Hackers enfrentándose a las mayores empresas del mundo? Ese es el poder del código abierto.

    -Ian Pointer

    James R. Borck, Martin Heller, InfoWorld (EE.UU.) | 4/Noviembre/2021, Créditos foto: IDG

  • Cuadernos Colab para el arte generativo

    ​Los ganadores de los Bossies han sido tradicionalmente las bibliotecas, los frameworks, las plataformas y los sistemas operativos, la columna vertebral del código abierto. Sin embargo, creo que los componentes de código abierto que han provocado la explosión del arte generativo de este año también merecen cierto reconocimiento. En primer lugar, está el modelo CLIP (Contrastive Language-Image Pre-training) de OpenAI, un modelo multimodal para generar incrustaciones vectoriales de texto e imágenes. Mientras que CLIP era de código abierto, la red neuronal generativa de OpenAI, DALL-E, no lo era. Para llenar ese vacío, Ryan Murdoch y Katherine Crowson desarrollaron cuadernos de Colab que combinaban CLIP con otros modelos de código abierto, como BigGAN y VQGAN, para hacer obras de arte generativas basadas en instrucciones. Y estos cuadernos, de uso libre bajo licencia MIT, se han extendido por Internet como los fanzines de hace décadas, siendo remezclados, alterados, traducidos y utilizados para producir asombrosas obras de arte. Consulta ai_curio en Twitter para ver un sinfín de ejemplos.

    -Ian Pointer

    James R. Borck, Martin Heller, InfoWorld (EE.UU.) | 4/Noviembre/2021, Créditos foto: IDG

Llegamos a ustedes gracias a: