
[24/06/2023] El análisis de datos es la savia de cualquier empresa de éxito. Disponer de la tecnología adecuada puede ser todo un reto, pero crear el equipo adecuado con las habilidades apropiadas para emprender iniciativas de datos puede ser aún más difícil.
Desplegar con éxito iniciativas de big data requiere algo más que científicos y analistas de datos. Requiere arquitectos de datos que diseñen el "anteproyecto" de su marco de gestión de datos empresariales, e ingenieros de datos que puedan construir ese marco y las canalizaciones de datos para introducir, procesar y crear valor empresarial a partir de los datos.
Funciones y responsabilidades de los arquitectos de datos
Los arquitectos de datos son visionarios de alto nivel que traducen los requisitos empresariales en requisitos tecnológicos y definen normas y principios de datos. Suelen tener años de experiencia en diseño, gestión y almacenamiento de datos.
Las responsabilidades típicas de un arquitecto de datos son
- Traducir los requisitos empresariales en especificaciones técnicas, incluidos flujos de datos, integraciones, transformaciones, bases de datos y almacenes de datos.
- Definir el marco, las normas y los principios de la arquitectura de datos, incluido el modelado, los metadatos, la seguridad, los datos de referencia como códigos de producto y categorías de clientes, y los datos maestros como clientes, proveedores, materiales y empleados.
- Definir la arquitectura de referencia, que es un patrón que otros pueden seguir para crear y mejorar los sistemas de datos.
- Definir los flujos de datos, es decir, qué partes de la organización generan datos, cuáles necesitan datos para funcionar, cómo se gestionan los flujos de datos y cómo cambian los datos en la transición.
- Colaborar y coordinarse con múltiples departamentos, partes interesadas, socios y proveedores externos.
Funciones y responsabilidades del ingeniero de datos
Los ingenieros de datos son responsables de gestionar y organizar los datos, al tiempo que se mantienen atentos a las tendencias o incoherencias que puedan afectar a los objetivos empresariales. Los ingenieros de datos diseñan, construyen y optimizan sistemas de recopilación, almacenamiento, acceso y análisis de datos a escala. Crean canalizaciones de datos que utilizan los científicos de datos, las aplicaciones centradas en datos y otros consumidores de datos. Los ingenieros de datos suelen ser expertos en tecnologías como Hadoop, Spark y otras herramientas del ecosistema de big data de código abierto, y en programación en Java, Scala o Python.
Las responsabilidades típicas de los ingenieros de datos incluyen
- Desarrollo, construcción, pruebas y mantenimiento de arquitecturas.
- Adquisición de datos.
- Desarrollo de procesos de conjuntos de datos.
- Identificar formas de mejorar la fiabilidad, eficiencia y calidad de los datos.
- Implementación de sofisticados programas de análisis, aprendizaje automático y métodos estadísticos.
- Preparación de datos para modelos predictivos y prescriptivos.
- Utilizar los datos para descubrir tareas que puedan automatizarse.
Ventajas de la certificación
Si está buscando una forma de obtener una ventaja para cualquiera de estas funciones de datos esenciales, la certificación es una gran opción. Las certificaciones miden sus conocimientos y habilidades con respecto a puntos de referencia específicos del sector y del proveedor para demostrar a los empleadores que posee el conjunto de habilidades adecuado para el trabajo.
A continuación, encontrará nuestra guía de las certificaciones de ingeniero de datos y arquitecto de datos más solicitadas para ayudarle a decidir qué certificación es la más adecuada para usted. Si no encuentra lo que busca, consulte nuestra lista de certificaciones de big data y análisis de datos.
AWS Certified Data Analytics - Specialty
La certificación AWS Certified Data Analytics - Specialty valida las habilidades técnicas y la experiencia en lagos de datos y servicios de análisis de AWS. Su objetivo es validar la capacidad de un candidato para definir los servicios de análisis de datos de AWS y comprender cómo se integran entre sí. También requiere que el candidato sepa cómo encajan los servicios de análisis de datos de AWS en el ciclo de vida de los datos de recopilación, almacenamiento, procesamiento y visualización. Anteriormente conocida como AWS Certified Big Data - Specialty, esta certificación está activa durante tres años a partir de la fecha de obtención.
Cloudera Data Platform (CDP) Generalist
Cloudera ha suspendido sus certificaciones CCP y CCA en favor de la nueva certificación Cloudera Data Platform (CDP) Generalist, que verifica el dominio de la plataforma. El nuevo examen evalúa el conocimiento general de la plataforma y se aplica a múltiples roles, incluyendo administrador, desarrollador, analista de datos, ingeniero de datos, científico de datos y arquitecto de sistemas. El examen consta de 60 preguntas y el candidato dispone de 90 minutos para completarlo. Otras certificaciones especializadas incluyen Administrador CDP - Base de Nube Privada, Desarrollador de Datos CDP, Analista de Datos CDP y Administrador CDP - Nube Pública.
- Organización: Cloudera
- Precio: 330 dólares
- Cómo prepararse: Cloudera recomienda a los candidatos realizar el curso Cloudera Data Analyst Training, que tiene los mismos objetivos que el examen.
Data Science Council of America (DASCA) Associate Big Data Engineer
La certificación DASCA Associate Big Data Engineer, independiente del proveedor, demuestra el conocimiento de las plataformas de big data más populares, incluidas Hadoop y Spark, y el conocimiento de las herramientas para desarrolladores de código abierto y patentadas (incluidas HBase, Hive, Pig y HiveQL). Requiere superar un examen en línea de 75 preguntas. Hay tres vías de candidatura que varían en función del nivel educativo y la experiencia laboral.
- Organización: Data Science Council of America
- Precio: 585 dólares por el examen, los recursos estándar de preparación del examen, el envío, la insignia digital y el kit de credenciales.
- Cómo prepararse: La inscripción en el programa incluye un kit completo de preparación para la certificación DASCA.
Data Science Council of America (DASCA) Senior Big Data Engineer
La certificación Senior Big Data Engineer de DASCA es un paso más allá de la credencial de asociado y está dirigida a profesionales con experiencia. Requiere superar un examen en línea de 85 preguntas. Hay cuatro vías de candidatura que varían en función del nivel de formación y la experiencia laboral.
- Organización: Data Science Council of America
- Precio: 650 dólares por el examen, los recursos estándar de preparación del examen, el envío, la insignia digital y el kit de credenciales.
- Cómo prepararse: La inscripción en el programa incluye un kit completo de preparación para la certificación DASCA.
Google Professional Data Engineer
La credencial Google Professional Data Engineer certifica la capacidad para diseñar, construir, poner en funcionamiento, proteger y supervisar sistemas de procesamiento de datos. Requiere la superación de un examen de certificación de dos horas de duración, de opción múltiple y respuesta múltiple. El examen no tiene requisitos previos, aunque Google recomienda que los candidatos tengan tres o más años de experiencia en el sector, incluido uno o más años diseñando y gestionando soluciones con Google Cloud Platform. El examen está disponible en inglés y japonés y se puede realizar en línea desde una ubicación remota o in situ en un centro de pruebas.
- Organización: Google
- Precio: 200 dólares de matrícula
- Cómo prepararse: Google ofrece una guía para el examen y formación a petición o impartida por un instructor.
IBM Certified Solution Architect - Cloud Pak for Data v4.x
La certificación IBM Certified Solution Architect - Cloud Pak for Data v4.x valida la capacidad de una persona para diseñar, planificar y crear una solución de datos e IA en un entorno de nube híbrida. Un arquitecto certificado puede liderar y guiar la implementación y operacionalización de una solución que puede incluir gobierno de datos, analítica, ciencia de datos, aprendizaje automático e IA. Requiere superar un examen que consta de seis secciones que contienen un total de 63 preguntas de opción múltiple.
IBM Certified Solution Architect - Data Warehouse V1
La certificación IBM Certified Solution Architect - Data Warehouse V1 valida la capacidad de una persona para diseñar, planificar y crear una solución de almacén de datos. Requiere conocimientos prácticos de gobernanza de datos, enfoques de procesamiento de datos, almacenes de datos y virtualización de datos, soluciones de procesamiento en tiempo real, etc. Requiere superar un examen que consta de siete secciones con un total de 62 preguntas de opción múltiple.
- Organización: IBM Professional Certification Program
- Precio: 200 dólares
- Cómo prepararse: IBM ofrece un examen de evaluación a través de Pearson VUE. Además, IBM sugiere cursos sobre topología de datos, almacenamiento de datos y privacidad de datos.
SAS Certified Data Integration Developer
El programa de certificación SAS Certified Data Integration Developer es para personas que buscan validar sus habilidades de desarrollo de integración de datos en el entorno SAS 9. El programa se centra en la definición de la arquitectura de integración de datos. El programa se centra en la definición de la arquitectura de la plataforma para SAS Business Analytics, la creación de metadatos para datos de origen y destino, el trabajo con transformaciones, etc. El programa requiere aprobar un examen de certificación administrado por SAS y Pearson Vue.
Basado en el artículo de Thor Olavsrud (CIO) y editado por CIO Perú