;

Sistemas de Bases de Datos Masivos (Big Data)

Semestre I - 2020 Universidad Nacional de Colombia Sede Medellín

Las aplicaciones modernas a escala Web requieren de la gestión y procesamiento de grandes volúmenes de datos (big data). Estas aplicaciones requieren tiempos de respuesta rápidos (adecuados para las aplicaciones online) y gestionan datos estructurados (como las bases de datos relacionales) y datos no estructurados (como las páginas web, conversaciones en chats, datos de redes sociales, datos de blogs, entre otros). En todas estas aplicaciones hay una amplia posibilidad para explotar aspectos como el paralelismo mediante arquitecturas computacionales que lo habilitan (colección de procesadores y arreglos de discos conectados por redes). Estas arquitecturas y los requisitos computacionales han sido la base para a) desarrollar paradigmas de programación (por ejemplo, map-reduce) orientados a sacar provecho del paralelismo, b) habilitar la programación de las más conocidas técnicas de análisis de grandes volúmenes de datos pero en ambientes paralelos (support vector machines, LSH, frequent ítem sets, entre otros), c) facilitar el desarrollo de herramientas computacionales como las bases de datos No-SQL, d) mejorar el desempeño y la gestión de la información en las bodegas de datos y e) potenciar el desarrollo de disciplinas como el aprendizaje de maquinas, la minería de datos, la simulación, la bioinformática, entre muchas otras.

Objetivo del curso

Programación detallada

Evaluación

Otros Recursos