i clusters bajo linux
play

I. Clusters bajo Linux Isabel Campos Plasencia Responsable de - PowerPoint PPT Presentation

INSTITUTO DE BIOCOMPUTACIN Y FSICA DE SISTEMAS COMPLEJOS CURSO CLUSTERS & GRID COMPUTING EN ENTORNOS DE SOFTWARE LIBRE I. Clusters bajo Linux Isabel Campos Plasencia Responsable de Proyectos de Computacin 28, 29 y 30 de Noviembre


  1. INSTITUTO DE BIOCOMPUTACIÓN Y FÍSICA DE SISTEMAS COMPLEJOS CURSO CLUSTERS & GRID COMPUTING EN ENTORNOS DE SOFTWARE LIBRE I. Clusters bajo Linux Isabel Campos Plasencia Responsable de Proyectos de Computación 28, 29 y 30 de Noviembre 2005 http://bifi.unizar.es/clustersygrid

  2. Estrategia de Administración: ¿Qué conlleva? ● Mantenimiento Físico de las máquinas  Conexiones eléctricas, consolas,...  BIOS ● Sistema Operativo  Mecanismo de Booting  Instalación y Configuración de las máquinas  Integridad del sistema: detección de intrusiones ● Monitorización del cluster  Chequeo del estado del cluster  Gestión de los mensajes de error ● Seguridad Clusters & Grid computing en entornos de software libre INSTITUTO DE BIOCOMPUTACIÓN Y INSTITUTO DE BIOCOMPUTACIÓN Y Clusters & Grid computing en entornos de software libre FÍSICA DE SISTEMAS COMPLEJOS FÍSICA DE SISTEMAS COMPLEJOS

  3. Administración de clusters MONITORIZACIÓN SEGURIDAD Instalación Instalación Mantenimiento Mantenimiento Físico Físico ADMINISTRACIÓN DEL SISTEMA Usuarios Usuarios Software Software Clusters & Grid computing en entornos de software libre INSTITUTO DE BIOCOMPUTACIÓN Y INSTITUTO DE BIOCOMPUTACIÓN Y Clusters & Grid computing en entornos de software libre FÍSICA DE SISTEMAS COMPLEJOS FÍSICA DE SISTEMAS COMPLEJOS

  4. Estrategia de Administración: ¿Qué conlleva? ● Uso del cluster  Setup de usuarios y login  Envío de trabajos  Law enforcement ● Aplicaciones de usuario  Instalación  Setting-up y mantenimiento de las variables de entorno $ENV. ► Para cada punto debe haber una estrategia bien definida!! Para cada punto debe haber una estrategia bien definida!! Clusters & Grid computing en entornos de software libre INSTITUTO DE BIOCOMPUTACIÓN Y INSTITUTO DE BIOCOMPUTACIÓN Y Clusters & Grid computing en entornos de software libre FÍSICA DE SISTEMAS COMPLEJOS FÍSICA DE SISTEMAS COMPLEJOS

  5. INSTITUTO DE BIOCOMPUTACIÓN Y FÍSICA DE SISTEMAS COMPLEJOS CURSO CLUSTERS & GRID COMPUTING EN ENTORNOS DE SOFTWARE LIBRE Administración del Sistema Booting e Instalación del Sistema Operativo 28, 29 y 30 de Noviembre 2005 http://bifi.unizar.es/clustersygrid

  6. Instalación del Sistema Operativo: Mecanismo de Booting ► Booting en los nodos del cluster ● Boot via NFS – El sistema operativo está almacenado en el servidor y se exporta con NFS – Los nodos hacen el boot mediante DHCP/BOOTP y TFTP – Los discos duros locales se usan para almacenamiento provisional de datos (/tmp) – Otra opción: el booting a través de la red es particularmente fácil de mantener porque todo el software está en el servidor. ● Boot desde disco local – Más costoso desde el punto de vista del mantenimiento – Mucho más tolerante a errores de red, por ejemplo. Clusters & Grid computing en entornos de software libre INSTITUTO DE BIOCOMPUTACIÓN Y INSTITUTO DE BIOCOMPUTACIÓN Y Clusters & Grid computing en entornos de software libre FÍSICA DE SISTEMAS COMPLEJOS FÍSICA DE SISTEMAS COMPLEJOS

  7. Instalación del Sistema Operativo: DHCPD y PXE booting dhcpd IP: 192.168.1.1 Hostname: nodo1 Servidor Ethernet El fichero /etc/dhcpd.conf: HW address: host nodo1 { 00:28:20:4F:C3:80 hardware Ethernet 00:28:20:4F:C3:80; fixed-address 192.168.1.1; } Clusters & Grid computing en entornos de software libre INSTITUTO DE BIOCOMPUTACIÓN Y INSTITUTO DE BIOCOMPUTACIÓN Y Clusters & Grid computing en entornos de software libre FÍSICA DE SISTEMAS COMPLEJOS FÍSICA DE SISTEMAS COMPLEJOS

  8. Instalación del Sistema Operativo: DHCPD y PXE booting PXE tftp protocol protocol Servidor Ethernet El fichero /tftpboot/pxelinux.cfg/nodo1 ….. Install=nfs://192.168.1.250/nfs/SuSE9 Instalación del El fichero /nfs/SuSE9/xml/nodo1.xml Sistema Operativo Contiene los detalles del software a instalar Clusters & Grid computing en entornos de software libre INSTITUTO DE BIOCOMPUTACIÓN Y INSTITUTO DE BIOCOMPUTACIÓN Y Clusters & Grid computing en entornos de software libre FÍSICA DE SISTEMAS COMPLEJOS FÍSICA DE SISTEMAS COMPLEJOS

  9. Instalación del sistema operativo Maquina de Instalación (aislada del exterior) /boot /etc Network /lib exterior /usr/etc /usr/bin Red lxinst Complejo del cluster Clusters & Grid computing en entornos de software libre INSTITUTO DE BIOCOMPUTACIÓN Y INSTITUTO DE BIOCOMPUTACIÓN Y Clusters & Grid computing en entornos de software libre FÍSICA DE SISTEMAS COMPLEJOS FÍSICA DE SISTEMAS COMPLEJOS

  10. Instalación del sistema operativo Tiempo de instalación por nodo (via NFS) t/N [min] 20:00 17:30 15:00 10:15 10:00 06:09 04:33 05:00 03:24 00:00 1 3 5 7 9 11 13 15 N NFS server : Pentium 200MHz, 64MB RAM, 40 GB Hdisk NIC 3Com 3c905 100BaseTX (Boomerang) 100 Mbit full duplex Clusters & Grid computing en entornos de software libre INSTITUTO DE BIOCOMPUTACIÓN Y INSTITUTO DE BIOCOMPUTACIÓN Y Clusters & Grid computing en entornos de software libre FÍSICA DE SISTEMAS COMPLEJOS FÍSICA DE SISTEMAS COMPLEJOS

  11. INSTITUTO DE BIOCOMPUTACIÓN Y FÍSICA DE SISTEMAS COMPLEJOS CURSO CLUSTERS & GRID COMPUTING EN ENTORNOS DE SOFTWARE LIBRE Monitorización del Cluster 28, 29 y 30 de Noviembre 2005 http://bifi.unizar.es/clustersygrid

  12. Monitorización del Cluster ► Parámetros a monitorizar ● Hardware: Discos, conexión a la red, Temperatura, Memoria,... ● Software: integridad del OS, versión kernel, updates del sistema,... ● Otros: ¿Está el directorio /data/protein montado en lxdata0 ? ► Características del sistema de monitor ● Aplicable a todas las plataformas Linux ● Dar una visión global rápida del estado de las máquinas ● Proveer de un mecanismo de corrección de errores y alerta ● No interferir en la operación de las máquinas ► Diseño de un monitor „ a la carta “ ● A partir de herramientas UNIX standard ( shell scripts , HTML) ● Se instala como un programa en shell que se ejecuta periodicamente ( cron job ) Clusters & Grid computing en entornos de software libre INSTITUTO DE BIOCOMPUTACIÓN Y INSTITUTO DE BIOCOMPUTACIÓN Y Clusters & Grid computing en entornos de software libre FÍSICA DE SISTEMAS COMPLEJOS FÍSICA DE SISTEMAS COMPLEJOS

  13. Monitorización del Cluster: Algunas herramientas ► Estado del Hardware http://www.lm-sensors.nu ● Voltaje, T, Ventiladores, chasis,... ► Estado Operacional ● Filesystems (¿montados? Scripts en shell ¿Llenos?) Usar ganglia toolkit ● Mensajes del disco (¿errores?) http://ganglia.sourceforge.net ● Usuarios ( usuarios ilegales) ● Uptime ● Daemons (cron,nfs) ► Rendimiento ● Uso del Sistema ● Contando Mflop/s, Mref/s http://perfctr.sourceforge.net (desarrollo de programas) Clusters & Grid computing en entornos de software libre INSTITUTO DE BIOCOMPUTACIÓN Y INSTITUTO DE BIOCOMPUTACIÓN Y Clusters & Grid computing en entornos de software libre FÍSICA DE SISTEMAS COMPLEJOS FÍSICA DE SISTEMAS COMPLEJOS

  14. Monitorización del Cluster: Algunas herramientas Librería de Sensores: ►  Implementado como un módulo del kernel que se carga al hacer el boot ► Ganglia Toolkit  Multicast (TCP/IP transporte): muy rápido *  Monitorización completa en tiempo real (Opensource)  Versiones para Linux, Solaris, Tru64, IRIX, Windows  Mantiene una tabla dinámica de máquinas: es decir, no se cuelga al tratar de conectar a un nodo que esta caído. ► Performance Counters  Kernel patch (cuidado!!) (mikpe@csd.uu.se)  Basado en la información leída en registros del CPU de propósito especial * Nota: sshd es muy lento para clusters grandes (>100 nodos) Clusters & Grid computing en entornos de software libre INSTITUTO DE BIOCOMPUTACIÓN Y INSTITUTO DE BIOCOMPUTACIÓN Y Clusters & Grid computing en entornos de software libre FÍSICA DE SISTEMAS COMPLEJOS FÍSICA DE SISTEMAS COMPLEJOS

  15. Ejemplo: Instalación de Sensores  ¿Qué son los sensores? Chips incluídos en la placa base de los PCs (desde 1998) para controlar el estado del Hardware. Su estado se lee a través del bus ISA o del bus SM (System Management) mediante I/O normal.  ¿Qué parámetros de hardware controlan?  Temperatura de la CPU y del chasis  Voltaje de entrada a la placa base  Velocidad de los ventiladores,…  ¿Cómo se lee el estado de esos chips en Linux? Un módulo del kernel de Linux se encarga de leer el estado del chip correspondiente. Hay un módulo para cada parámetro del hardware a controlar. http://www.lm-sensors.nu Clusters & Grid computing en entornos de software libre INSTITUTO DE BIOCOMPUTACIÓN Y INSTITUTO DE BIOCOMPUTACIÓN Y Clusters & Grid computing en entornos de software libre FÍSICA DE SISTEMAS COMPLEJOS FÍSICA DE SISTEMAS COMPLEJOS

  16. Intermedio: kernel y modulos ► Kernel : En Linux, es el “software” a través del cual el usuario interacciona con el hardware Proceso System calls signals & faults Linux Kernel Hardware Clusters & Grid computing en entornos de software libre INSTITUTO DE BIOCOMPUTACIÓN Y INSTITUTO DE BIOCOMPUTACIÓN Y Clusters & Grid computing en entornos de software libre FÍSICA DE SISTEMAS COMPLEJOS FÍSICA DE SISTEMAS COMPLEJOS

Recommend


More recommend