×
Eventil - Find Tech Events
Official mobile app
FREE - In Google Play
View
×
Eventil
Official mobile app
FREE - In App Store
View

Taller Nivel 0: Ciencia de Datos, BigData, Hadoop, Spark, Jupyter con Python

Aug 28, 2019 · Mexico City, Mexico

Taller Nivel 0: Ciencia de Datos, BigData, Hadoop, Spark, Jupyter con Python

Martes 28 de agosto 2019
De 5pm 9 pm

Este es un taller de fundamentos al desarrollo y creación de aplicaciones de BigData con herramientas y mejores practicas como uso de ambientes de almacenamiento distribuido Hadoop HDFS, del procesamiento tolerante a fallas Spark en un ambiente interactivo Jupyter con el lenguaje Python

Estos instrumentos son los pilares de cualquier otra rama como Aprendizaje Automatizado (Machine Learning), Redes Neuronales Convolutivas (CNN), Redes Neuronales Recurrentes (RNN, como LSTM), Aprendizaje Profundo (Deep Learning), Inteligencia Artificial (Artificial Intelligence) con herramientas como TensorFlow y Keras.

Se proporciona una máquina virtual, con una instalación de las herramientas y lecturas complementarias, que permiten a los participantes llevar a cabo prácticas en pseudo-clúster Big Data

INVERSIÓN: 2,000 + i.v.a.

Para CFDI, fvor de enviar datos fiscales

BBVA Bancomer
CLABE:[masked]

Atentamente
Dr Gabriel GUERRERO
[masked]
info cel (55)[masked]

TEMARIO

Introducción a Ciencia de Datos y Big Data
Introducción a Hadoop HDFS
Introduccion a Python
Introducción a Apache Spark con Python
Uso de cuadernos Jupyter Notebook con Python
Uso básico de Spark SQL
Uso de Datos Abiertos de INEGI y CDMX entre otras

Descripción

Práctica 1. El taller inicia instalando en cada equipo la máquina virtual con todos los sistemas (Hadoop HDFS, Spark, LivyServer, Anaconda, Python, Jupyter), asi como los ejercicios resueltos del taller, con el objetivo de NO TECLEAR nada, todo se ofrece al participante para que concentre su atención en los conceptos y metodologías.

Práctica 2. Enseguida se inician los servicios HDFS para realizar practicas: "Subir" archivos ajustando parámetros como talla de bloque y factor de replicación.

Práctica 3. Después se realizan practicas de "Bajar" archivos del sistema HDFS a la maquina linux"

Práctica 4. Se inician servicios Spark y se realizan prácticas de "Subir" archivos a Spark desde HDFS y desde la maquina Linux, para generar un RDD con los datos en RAM

Práctica 5. Una vez que se tiene el RDD en RAM en Spark se realiza un Análisis Exploratorio de Datos (EDA, Exploratory Data Analysis) utilizando Python y el concepto de DataFrame en un ambiente Jupyter. Se introduce la estructura de almacenamiento permanente PARQUET

Práctica 6. Se definen con enunciados SQL del mundo relacional estándar las transformaciones y acciones que se desean realizar, pero con una arquitectura distribuida utilizando SparkSQL

Práctica 7. Una vez terminada la ejecucion del enunciado SQL en RAM, se almacena en una estructura permanente en Hadoop HDFS y/o en el sistema de archivos Linux. El formato del almacenamiento en LINUX puede ser CSV, PARQUET

En todos los ejercicios se utilizan fuentes de información de datos abiertos como INEGI y de la CDMX entre otras

Se proporciona una máquina virtual por módulo, con una instalación de las herramientas y lecturas complementarias, que permiten a los participantes llevar a cabo prácticas en pseudo-clúster Big Data

Martes 28 de agosto 2019
De 5pm 9 pm

INVERSIÓN: 2,000 + i.v.a.

Para CFDI, fvor de enviar datos fiscales

BBVA Bancomer
CLABE:[masked]

Atentamente
Dr Gabriel GUERRERO
[masked]
info cel (55)[masked]

Event organizers
  • Spark, Ciencia de Datos, BigData Analytics y Matematicas

    Grupo para compartir experiencias, exitos y mejores practicas y hacer sinergia en la conjuncion de aplicaciones de Apache Spark, Berkeley Data Analytics Stack (BDAS), uso de Aprendizaje Automatizado (Machine Learning, ML) utilizando Scala con mecanismos como Kafka y Akka. Es un lugar para convertirse en una Catapulta para la Promocion y Uso de las mejores practicas de las mejores practicas de la Ciencia de Datos Bienvenidos todos los entusiastas promotores de estas tecnicas del Mundo de la Ciencia de los G

    Recent Events
    More

Are you organizing Taller Nivel 0: Ciencia de Datos, BigData, Hadoop, Spark, Jupyter con Python?

Claim the event and start manage its content.

I am the organizer
Social
Rating

based on 0 reviews

Featured Events