Curso de Administración de Hadoop
El curso está dedicado a especialistas en TI que buscan una solución para almacenar y procesar grandes conjuntos de datos en entornos de sistemas distribuidos
Objetivo del curso:
Obtención de conocimientos sobre la administración de clúster de Hadoop
Programa del Curso
Introducción a las soluciones Cloud Computing y Big Data
Evolución de Apache Hadoop: HDFS, MapReduce, YARN
Instalación y configuración de Hadoop en modo Pseudo-distribuido
Ejecución de trabajos de MapReduce en el clúster Hadoop
Hadoop Planificación, instalación y configuración de clústeres
Hadoop ecosistema: Cerdo, Hive, Sqoop, HBase
- Big Data futuro: Impala, Cassandra
Requerimientos
- Habilidades básicas de administración de Linux
- Habilidades básicas de programación
Los cursos de formación abiertos requieren más de 5 participantes.
Curso de Administración de Hadoop - Booking
Curso de Administración de Hadoop - Enquiry
Administración de Hadoop - Consultas
Consultas
Testimonios (4)
Preparación y organización del formador, y calidad de los materiales proporcionados en GitHub.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Curso - Impala for Business Intelligence
Traducción Automática
La máquina virtual que me gustó mucho El profesor era muy conocedor sobre el tema así como otros temas, fue muy amable y agradable Me gustó la instalación en Dubái.
Safar Alqahtani - Elm Information Security
Curso - Big Data Analytics in Health
Traducción Automática
Liked very much the interactive way of learning.
Luigi Loiacono
Curso - Data Analysis with Hive/HiveQL
Traducción Automática
I mostly liked the trainer giving real live Examples.
Simon Hahn
Curso - Administrator Training for Apache Hadoop
Traducción Automática
Próximos cursos
Cursos Relacionados
Capacitación de Administrador para Apache Hadoop
35 HorasAudiencia:
El curso está dirigido a especialistas en TI que buscan una solución para almacenar y procesar grandes conjuntos de datos en un entorno de sistema distribuido
Goal:
Conocimiento profundo en Hadoop administración de clústeres.
Big Data Analytics in Health
21 HorasEl análisis de Big Data implica el proceso de examinar grandes cantidades de conjuntos de datos variados para descubrir correlaciones, patrones ocultos y otras ideas útiles.
La industria de la salud tiene cantidades masivas de datos clínicos y médicos heterogéneos complejos. La aplicación de análisis de big data en datos de salud presenta un enorme potencial para obtener información para mejorar la prestación de servicios de salud. Sin embargo, la magnitud de estos conjuntos de datos plantea grandes desafíos en los análisis y aplicaciones prácticas en un entorno clínico.
En esta capacitación en vivo (remota) dirigida por un instructor, los participantes aprenderán cómo realizar análisis de big data en salud a medida que realizan una serie de ejercicios prácticos de laboratorio en vivo.
Al final de esta capacitación, los participantes podrán:
- Instale y configure herramientas de análisis de big data como Hadoop MapReduce y Spark
- Comprender las características de los datos médicos.
- Aplicar técnicas de big data para manejar datos médicos.
- Estudiar los sistemas y algoritmos de big data en el contexto de las aplicaciones de salud.
Audiencia
- Desarrolladores
- Científicos de datos
Formato del curso
- Conferencia en parte, discusión en parte, ejercicios y práctica práctica.
Nota
- Para solicitar una capacitación personalizada para este curso, contáctenos para organizarlo.
Hadoop para Administradores
21 HorasApache Hadoop es el marco más popular para el procesamiento Big Data en clústeres de servidores. En este curso de tres días (opcionalmente, cuatro), los asistentes aprenderán sobre los beneficios comerciales y los casos de uso de Hadoop y su ecosistema, cómo planificar la implementación y el crecimiento del clúster, cómo instalar, mantener, monitorear, solucionar problemas y optimizar Hadoop. También practicarán la carga masiva de datos en clústeres, se familiarizarán con varias Hadoop distribuciones y practicarán la instalación y administración de Hadoop herramientas del ecosistema. El curso finaliza con un análisis de la protección del clúster con Kerberos.
“… Los materiales estaban muy bien preparados y cubiertos a fondo. El laboratorio fue muy servicial y bien organizado"
— Andrew Nguyen, ingeniero principal de integración de DW, Microsoft En línea Advertising
Audiencia
Hadoop Administradores
Formato
Clases magistrales y laboratorios prácticos, saldo aproximado 60% conferencias, 40% laboratorios.
Hadoop para Desarrolladores (4 días)
28 HorasApache Hadoop es el marco más popular para procesar Big Data en clústeres de servidores. Este curso presentará un desarrollador a varios componentes (HDFS, MapReduce, Pig, Hive y HBase) Hadoop ecosistema.
Hadoop Avanzado para Desarrolladores
21 HorasApache Hadoop es uno de los frameworks más populares para el procesamiento Big Data en clústeres de servidores. Este curso profundiza en la gestión de datos en HDFS, Pig avanzado, Hive y HBase. Estas técnicas de programación avanzadas serán beneficiosas para los desarrolladores experimentados Hadoop.
Público: desarrolladores
Duración: tres días
Formato: clases magistrales (50%) y laboratorios prácticos (50%).
Hortonworks Data Platform (HDP) para Administradores
21 HorasEsta capacitación en vivo dirigida por un instructor en Guatemala (en línea o presencial) presenta Hortonworks Data Platform (HDP) y guía a los participantes a través de la implementación de la solución Spark + Hadoop.
Al final de esta formación, los participantes serán capaces de:
- Utilice Hortonworks para ejecutar Hadoop de forma fiable a gran escala.
- Unifique las capacidades de seguridad, gobernanza y operaciones de Hadoop con los flujos de trabajo analíticos ágiles de Spark.
- Utilice Hortonworks para investigar, validar, certificar y dar soporte a cada uno de los componentes de un proyecto de Spark.
- Procese diferentes tipos de datos, incluidos los estructurados, no estructurados, en movimiento y en reposo.
Análisis de Datos con Hive / HiveQL
7 HorasEste curso cubre cómo usar el lenguaje Hive SQL (AKA: Hive HQL, SQL en Hive, HiveQL) para personas que extraen datos de Hive
Impala para Inteligencia Empresarial
21 HorasCloudera Impala es un motor de consulta SQL de procesamiento masivo paralelo (MPP) de código abierto para clústeres Apache Hadoop.
Impala permite a los usuarios emitir consultas SQL de baja latencia a los datos almacenados en Hadoop Distributed File System y Apache Hbase sin necesidad de movimiento o transformación de datos.
Audiencia
Este curso está dirigido a analistas y científicos de datos que realizan análisis sobre datos almacenados en Hadoop a través de herramientas de Business Intelligence o SQL.
Después de este curso, los delegados podrán
- Extraer información significativa de los clústeres de Hadoop con Impala.
- Escriba programas específicos para facilitar la Inteligencia de Negocios en Impala SQL Dialect.
- Solucionar problemas de Impala.