|
Máster Universitario en Ingeniería Informática |
TRABAJOS FIN DE MáSTER curso: 2022-23
Modelado y evaluación de un mecanismo de control de flujo basado en las fuentes para redes de interconexión de altas prestaciones |
Descripcion y Objetivos
Las redes de interconexión son un elemento fundamental en los computadores de alto rendimiento (HPCs, High-Performance Computers) y los centros de proceso de datos (CPDs o Data-centers), donde los requisitos de comunicación de las aplicaciones y servicios que soportan se multiplican constantemente. En efecto, en estos sistemas, la red de interconexión tiene que dar soporte a la comunicación entre la enorme cantidad de nodos de cómputo y almacenamiento (del orden de hasta cientos de miles de nodos) que son necesarios para ofrecer, entre otros, servicios on-line de uso intensivo de datos (OLDI services), supercomputación, deep learning, almacenamiento masivo, cloud computing, etc. Todos estos servicios manejan enormes volúmenes de datos y al mismo tiempo requieren unos tiempos de respuesta mínimos, por lo que la red de interconexión de estos sistemas debe ofrecer unas prestaciones mínimas bastante elevadas.
Entre los factores de diseño más importantes que determinan las prestaciones de la red destacan la topología, el algoritmo de encaminamiento, la arquitectura de los elementos de la red (conmutadores y enlaces), etc. Sin embargo, incluso redes diseñadas muy eficientemente en todos esos aspectos pueden acabar ofreciendo unas prestaciones muy por debajo de las esperadas debido a la aparición de situaciones de congestión, que además son bastante probables de suceder debido a las altas cargas de tráfico que pueden generar en la red los servicios soportados por sistemas HPC y CPD mencionados anteriormente. En efecto, la congestión y sus efectos negativos, como el bloqueo de cabeza de línea (head-of-line -HoL- blocking), degradan el rendimiento de la red y aumentan el tiempo de respuesta de las aplicaciones y servicios.
Por esta razón, contar con alguna solución para estas situaciones de congestión es habitual, y casi obligatorio, en los estándares de las tecnologías de red de altas prestaciones que existen en el mercado. En ese sentido, una estrategia empleada habitualmente es la conocida como control de flujo extremo a extremo (end-to-end flow control) entre nodos finales fuente y destino, que puede en la práctica dar lugar a implementaciones como los distintos protocolos de ventana deslizante (sliding window). Estos protocolos están en cierta manera emparentados con otras estrategias de control de congestión como las basadas en inhibición de inyección, que habitualmente también implican una comunicación extremo a extremo. a tecnología de red Ethernet es una de las más populares, y cuenta con varias soluciones posibles para el control de la congestión. Todas estas estrategias están implementadas de una forma u otra en los estándares que definen al tecnología de red Ethernet, una de las más populares. Con el objetivo de acelerar la reacción de estos mecanismos frente a los problemas de la congestión, recientemente se ha propuesto la alternativa de control de flujo basado en la fuente (source flow control, SFC), en la que las notificaciones a la fuente se generan desde el conmutador donde se detecta congestión en lugar de desde el nodo final destino, lo que permite que la fuente sea consciente más rápidamente de la situación que si esta es comunicada desde el destino.
Por otra parte, es habitual que las mejoras que se proponen para las redes de interconexión se evalúen en simuladores antes de su implementación en productos comerciales, obviamente de cara a reducir el coste y el esfuerzo que acarrearían sucesivas implementaciones de técnicas fallidas y las correspondientes pruebas en sistemas reales. Al respecto, el grupo RAAP de la UCLM ha desarrollado varios simuladores de redes de interconexión, como por ejemplo INASim, que ha sido profusamente validado y ampliamente usado en numerosos estudios. Sin embargo, dicho simulador aún no modela SFC, a pesar de ser un mecanismo de gran interés para las redes de interconexión con tecnología Ethernet.
El objetivo de este TFG es modelar e implementar SFC en el simulador INASim. Este modelado será el paso previo a la evaluación, mediante la ejecución de experimentos de simulación, de las prestaciones de SFC en situaciones de congestión, en comparación con otras técnicas de control de congestión ya disponibles en el simulador. De los resultados obtenidos se espera poder realizar en el futuro un análisis de las posibles mejoras que se pueden proponer para SFC, así como de las posibles combinaciones de SFC con otros mecanismos de control de congestión que pudieran ser complementarios.
Metodología y Competencias
Para alcanzar los objetivos del TFM, las actividades principales a realizar son las siguientes. Se indica también el tiempo estimado de realización en meses, asumiendo una dedicación total de 225 horas (180 horas de trabajo autónomo y 45 horas de relación con los tutores) a lo largo de 4 meses, y una dedicación de 56,25 horas/mes:
1) Análisis de las funcionalidades de SFC (0,5 meses).
2) Modelado de SFC en el simulador de redes de interconexión INASim (1,5 meses).
3) Evaluación mediante simulación de las prestaciones de SFC, en comparación con otras estrategias de control de congestión como Sliding Window, DCQCN, HOMA, etc (1 mes).
4) Documentación de los resultados (1 mes).
Competencias:
CE1 - Capacidad para la integración de tecnologías, aplicaciones, servicios y sistemas propios de la Ingeniería Informática, con carácter generalista, y en contextos más amplios y multidisciplinares.
CE4 - Capacidad para modelar, diseñar, definir la arquitectura, implantar, gestionar, operar, administrar y mantener aplicaciones, redes, sistemas, servicios y contenidos informáticos.
CE5 - Capacidad de comprender y saber aplicar el funcionamiento y organización de Internet, las tecnologías y protocolos de redes de nueva generación, los modelos de componentes, software intermediario y servicios.
CE16 - Realización, presentación y defensa, una vez obtenidos todos los créditos del plan de estudios, de un ejercicio original realizado individualmente ante un tribunal universitario, consistente en un proyecto integral de Ingeniería en Informática de naturaleza profesional en el que se sinteticen las competencias adquiridas en las enseñanzas.
Medios a utilizar
Los medios a utilizar para el desarrollo del TFG son los siguientes:
- Simulador INASim, disponible para el grupo RAAP.
- Servidor de GIT y GitLab disponible en el grupo RAAP.
- Clústeres de cómputo GALGO y CELLIA, disponibles en el I3A.
- Ordenador tipo PC.
Bibliografía
La bibliografía básica para el desarrollo del TFG es la siguiente:
- Diversos libros y artículos sobre redes de interconexión, modelado y simulación, principalmente "Interconnection Networks: An Engineering Approach", J. Duato, S. Yalamanchili, and L. M. Ni, Morgan Kaufmann Publishers, 2003.
- Documentación de los simuladores y librerías asociadas.
- Manuales de C++.
Toda la bibliografía está disponible.
Tutores GARCÍA GARCÍA, PEDRO JAVIER QUILES FLOR, FRANCISCO JOSE | Alumno MERINO RISUEÑO, ALBERTO
|
| |