Llegamos a ustedes gracias a:



Noticias

Cloudera lanza Data Science Workbench

[04/04/2017] Cloudera acaba de anunciar Cloudera Data Science Workbench, una nueva herramienta de autoservicio para la gestión de data science en Cloudera Enterprise, que actualmente se encuentra en fase beta.

Fruto de la adquisición el año pasado de la startup especializada en data science Sense.io, Data Science Workbench permite a los especialistas en big data utilizar sus lenguajes de código abierto favoritos (incluyendo R, Python y Scala) y acceder a sus bibliotecas en una plataforma empresarial segura sobre la base de Apache Spark nativo y la integración de Apache Hadoop, para acelerar los proyectos de análisis desde la exploración a la producción.

"Los equipos de TI de nuestros clientes a menudo tienen que lidiar con dificultades para que los científicos de datos se unan a entornos compartidos, ya que sus necesidades son muy diversas, especialmente cuando están involucradas herramientas de código abierto. Como resultado se producen duplicaciones, silos analíticos y limitaciones de la seguridad y el control. Mientras tanto, los científicos de datos están constantemente buscando expandir su trabajo a conjuntos de datos más grandes y plataformas de computación más potentes", señaló Charles Zedlewski, vicepresidente de Productos de Cloudera. "Con Data Science Workbench, Cloudera ayuda a los departamentos de TI y a los científicos de datos a trabajar juntos, atrayendo a más usuarios a entornos compartidos en la nube de una forma correcta y flexible".

En este sentido, Zedlewski indicó que los beneficios de Data Science Workbench incluyen:

Para los científicos de datos:

  • Posibilidad de utilizar R, Python o Scala con sus bibliotecas y frameworks favoritos directamente desde el navegador web.
  • Acceso directo a datos en clusters seguros de Hadoop con Spark e Impala.
  • Compartir ideas con todo su equipo para una investigación reproducible y colaborativa.

Para los profesionales de TI:

  • Dar libertad al equipo de data science para trabajar como y cuando quieran.
  • Cumplir con el soporte "out-of-the-box de seguridad completa en Hadoop, especialmente en Kerberos.
  • Permitir el trabajo on premise o en la nube, de modo que el usuario pueda decidir en función de dónde gestione sus datos.

"A medida que la ciencia de datos abierta se expande más allá de los extensos ecosistemas Python y R para incluir marcos de aprendizaje profundo como Tensorflow, Microsoft Cognitive Toolkit, MXnet o BigDL, los equipos de data science siguen buscando nuevas formas de trasladar estas herramientas a sus datos almacenados en los entornos Hadoop. Cloudera Data Science Workbench ofrece un entorno seguro para combinar las últimas innovaciones en código abierto con la plataforma unificada en la que confían los clientes de Cloudera, finalizó Zedlewski.