Session

Computacion distribuida usando Python

La computación distribuída es un nuevo modelo de computación que surgió con el objetivo de resolver problemas de computación masiva donde diferentes máquinas trabajan en paralelo formando un clúster de computación.
En los últimos años han surgido diferentes frameworks como Apache Hadoop, Apache Spark y Apache Flink que permiten resolver este tipo de problemas donde tenemos datos masivos desde diferentes fuentes de datos.
Dentro del ecosistema de Python podemos destacar las librerías de Pyspark y Dask de código abierto que permiten la ejecución de tareas de forma paralela y distribuida en Python.

Entre los puntos a tratar podemos destacar:

-Introducción a la computacion distribuida
-Comparando tecnologías de computación distribuida
-Frameworks y módulos en Python para computacion distribuida
-Casos de uso en proyectos Big Data

Jose Manuel Ortega

Software engineer & Security Researcher

Actions

Please note that Sessionize is not responsible for the accuracy or validity of the data provided by speakers. If you suspect this profile to be fake or spam, please let us know.

Jump to top