Llegamos a ustedes gracias a:



Noticias

Oracle anuncia Oracle Cloud Data Science Platform

[14/02/2020] Oracle anunció la disponibilidad de Oracle Cloud Data Science Platform. En el centro se encuentra Oracle Cloud Infrastructure Data Science, que aseguran ayuda a las empresas a construir, formar, gestionar e implantar de forma colaborativa modelos de aprendizaje de máquina.

"A diferencia de otros productos de ciencia de datos que se centran en los científicos de datos individuales, Oracle Cloud Infrastructure Data Science ayuda a mejorar la eficacia de los equipos de ciencia de datos con capacidades como proyectos compartidos, catálogos de modelos, políticas de seguridad de equipos, reproducibilidad y auditabilidad. Oracle Cloud Infrastructure Data Science selecciona automáticamente los conjuntos de datos de formación más óptimos a través de la selección y ajuste de algoritmos AutoML, la evaluación de modelos y la explicación de los mismos, comentó Greg Pavlik, vicepresidente senior de desarrollo de productos de Oracle Data y Servicios de Inteligencia Artificial.

Hoy en día, añadió el ejecutivo, las organizaciones se dan cuenta solo de una fracción del enorme potencial de transformación de los datos, porque los equipos de ciencias de los datos no tienen un acceso fácil a los datos y las herramientas adecuadas para construir y desplegar modelos de aprendizaje automático eficaces. "El resultado neto es que los modelos tardan demasiado tiempo en desarrollarse, no siempre cumplen los requisitos de las empresas en cuanto a precisión y solidez y, con demasiada frecuencia, nunca llegan a la producción, indicó.

Pavlik sostuvo que Oracle Cloud Infrastructure Data Science incluye un flujo de trabajo automatizado de ciencia de datos, que ahorra tiempo y reduce los errores con las siguientes capacidades:

  • La selección y ajuste automatizados de algoritmos AutoML, automatiza el proceso de ejecución de pruebas contra múltiples algoritmos y configuraciones de hiperparámetros. Comprueba la exactitud de los resultados y confirma que se ha seleccionado el modelo y la configuración óptimos para su uso. "Esto ahorra un tiempo significativo a los científicos de datos y, lo que es más importante, está diseñado para permitir que cada científico de datos logre los mismos resultados que los profesionales más experimentados, explicó.
  • La selección de características predictivas automatizadas simplifica la ingeniería de las características, al identificar automáticamente las características predictivas clave de conjuntos de datos más grandes.
  • La evaluación del modelo genera un conjunto completo de métricas de evaluación y visualizaciones adecuadas para medir el rendimiento del modelo frente a nuevos datos, y puede clasificar los modelos a lo largo del tiempo para permitir un comportamiento óptimo en la producción. "La evaluación del modelo va más allá del rendimiento en bruto para tener en cuenta el comportamiento esperado de la línea de base y utiliza un modelo de costos para que los diferentes impactos de los falsos positivos y los falsos negativos puedan ser totalmente incorporados, señaló Pavlik.
  • Oracle Cloud Infrastructure Data Science proporciona una explicación automatizada de la ponderación relativa y la importancia de los factores que intervienen en la generación de una predicción. "Oracle Cloud Infrastructure Data Science ofrece la primera implementación comercial de la explicación agnóstica del modelo. Con un modelo de detección de fraude, por ejemplo, un científico de datos puede explicar qué factores son los mayores impulsores del fraude para que la empresa pueda modificar los procesos o implementar salvaguardas, aseguró el ejecutivo.

Servicios integrales de aprendizaje de datos y máquinas

La plataforma de ciencia de datos en nube de Oracle incluye siete nuevos servicios que, de acuerdo a Pavlik, ofrecen una experiencia integral de extremo a extremo diseñada para acelerar y mejorar los resultados de la ciencia de los datos:

  • Oracle Cloud Infrastructure Data Science: Permite a los usuarios construir, formar y gestionar nuevos modelos de aprendizaje de máquinas en Oracle Clou utilizando Python y otras herramientas y librerías de código abierto, como TensorFlow, Keras y Jupyter.
  • Nuevas capacidades de aprendizaje automático en la base de datos autónoma de Oracle: Los algoritmos de aprendizaje automático están integrados en la base de datos autónoma de Oracle con un nuevo soporte para Python y aprendizaje automático. La próxima integración con Oracle Cloud Infrastructure Data Science permitirá a los científicos de datos desarrollar modelos utilizando tanto algoritmos de código abierto como algoritmos escalables de base de datos. De manera única, el hecho de llevar los algoritmos a los datos en la base de datos Oracle acelera el tiempo de los resultados al reducir la preparación y el movimiento de los datos.
  • Oracle Cloud Infrastructure Data Catalog: Permite a los usuarios descubrir, encontrar, organizar, enriquecer y rastrear los activos de datos en Oracle Cloud. Oracle Cloud Infrastructure Data Catalog tiene un glosario de negocios incorporado que facilita el cotejo y el descubrimiento de los datos correctos y confiables.
  • Oracle Big Data Service: Ofrece una implementación completa de Cloudera Hadoop, con una gestión mucho más simple que otras ofertas de Hadoop, incluyendo un solo clic para hacer un clúster altamente disponible y para implementar la seguridad. Oracle Big Data Service también incluye aprendizaje de máquina para Spark, lo que permite a las organizaciones ejecutar el aprendizaje de máquina de Spark en memoria con un solo producto y con un mínimo movimiento de datos.
  • Oracle Cloud SQL: Permite consultas SQL sobre datos en HDFS, Hive, Kafka, NoSQL y Object Storage. Sólo CloudSQL permite que cualquier usuario, aplicación o herramienta de análisis que pueda hablar con las bases de datos de Oracle trabaje de forma transparente con los datos de otros almacenes de datos, con el beneficio de un proceso de empuje y escalado para minimizar el movimiento de datos.
  • Oracle Cloud Infrastructure Data Flow: Un servicio de Big Data completamente administrado que permite a los usuarios ejecutar aplicaciones Apache Spark sin ninguna infraestructura que desplegar o administrar. "Permite a las empresas ofrecer aplicaciones Big Data y de IA con mayor rapidez. A diferencia de los servicios Hadoop y Spark de la competencia, el flujo de datos de Oracle Cloud Infrastructure incluye una ventana para realizar un seguimiento de todos los trabajos de Spark, lo que facilita la identificación de tareas costosas o la resolución de problemas, anotó Pavlik.
  • Máquinas virtuales de Oracle Cloud Infrastructure para la ciencia de los datos: Entornos pre-configurados basados en GPU con IDEs, portátiles y marcos comunes que pueden estar en funcionamiento en menos de 15 minutos, por 30 dólares al día.