×
Eventil - Find Tech Events
Official mobile app
FREE - In Google Play
View
×
Eventil
Official mobile app
FREE - In App Store
View

Taller Nivel 0: Ciencia de Datos, BigData, Hadoop, Spark, Jupyter con Python

Oct 17, 2019 · Mexico City, Mexico

Taller Nivel 0: Ciencia de Datos, BigData, Hadoop, Spark, Jupyter con Python

Jueves 17 de octubre 2019
De 5m 9pm

Este es un taller de fundamentos al desarrollo y creación de aplicaciones de BigData con herramientas y mejores practicas como uso de ambientes de almacenamiento distribuido Hadoop HDFS, del procesamiento tolerante a fallas Spark en un ambiente interactivo Jupyter con el lenguaje Python

Estos instrumentos son los pilares de cualquier otra rama como Aprendizaje Automatizado (Machine Learning), Redes Neuronales Convolutivas (CNN), Redes Neuronales Recurrentes (RNN, como LSTM), Aprendizaje Profundo (Deep Learning), Inteligencia Artificial (Artificial Intelligence) con herramientas como TensorFlow y Keras.

Se proporciona una máquina virtual, con una instalación de las herramientas y lecturas complementarias, que permiten a los participantes llevar a cabo prácticas en pseudo-clúster Big Data

INVERSIÓN: 2,000 + i.v.a.

Para CFDI, fvor de enviar datos fiscales

BBVA Bancomer
CLABE:[masked]

Atentamente
Dr Gabriel GUERRERO
[masked]
info cel (55)[masked]

TEMARIO

Introducción a Ciencia de Datos y Big Data
Introducción a Hadoop HDFS
Introduccion a Python
Introducción a Apache Spark con Python
Uso de cuadernos Jupyter Notebook con Python
Uso básico de Spark SQL
Uso de Datos Abiertos de INEGI y CDMX entre otras

Descripción

Práctica 1. El taller inicia instalando en cada equipo la máquina virtual con todos los sistemas (Hadoop HDFS, Spark, LivyServer, Anaconda, Python, Jupyter), asi como los ejercicios resueltos del taller, con el objetivo de NO TECLEAR nada, todo se ofrece al participante para que concentre su atención en los conceptos y metodologías.

Práctica 2. Enseguida se inician los servicios HDFS para realizar practicas: "Subir" archivos ajustando parámetros como talla de bloque y factor de replicación.

Práctica 3. Después se realizan practicas de "Bajar" archivos del sistema HDFS a la maquina linux"

Práctica 4. Se inician servicios Spark y se realizan prácticas de "Subir" archivos a Spark desde HDFS y desde la maquina Linux, para generar un RDD con los datos en RAM

Práctica 5. Una vez que se tiene el RDD en RAM en Spark se realiza un Análisis Exploratorio de Datos (EDA, Exploratory Data Analysis) utilizando Python y el concepto de DataFrame en un ambiente Jupyter. Se introduce la estructura de almacenamiento permanente PARQUET

Práctica 6. Se definen con enunciados SQL del mundo relacional estándar las transformaciones y acciones que se desean realizar, pero con una arquitectura distribuida utilizando SparkSQL

Práctica 7. Una vez terminada la ejecucion del enunciado SQL en RAM, se almacena en una estructura permanente en Hadoop HDFS y/o en el sistema de archivos Linux. El formato del almacenamiento en LINUX puede ser CSV, PARQUET

En todos los ejercicios se utilizan fuentes de información de datos abiertos como INEGI y de la CDMX entre otras

Se proporciona una máquina virtual por módulo, con una instalación de las herramientas y lecturas complementarias, que permiten a los participantes llevar a cabo prácticas en pseudo-clúster Big Data

Jueves 17 de octubre 2019
De 5m 9pm

INVERSIÓN: 2,000 + i.v.a.

Para CFDI, fvor de enviar datos fiscales

BBVA Bancomer
CLABE:[masked]

Atentamente
Dr Gabriel GUERRERO
[masked]
info cel (55)[masked]

Event organizers

Are you organizing Taller Nivel 0: Ciencia de Datos, BigData, Hadoop, Spark, Jupyter con Python?

Claim the event and start manage its content.

I am the organizer
Social
Rating

based on 0 reviews

Featured Events