Trabajando en el cluster¶
Subiendo y descargando archivos y datos¶
Debemos usar SCP (Secure copy protocol) ó SFTP (Secure file transfer protocol) para transferir datos y archivos entre su máquina local y el cluster lamb. Usuarios con Unix/Linux y Cygwin pueden usar el comando scp
. Usuarios de Windows pueden usar MobaXTerm, Putty y Filezilla para SFTP.
Manejando tareas¶
Hay múltiples comandos disponibles que son bastante útiles para monitorear el estado de las tareas, verificar el estado del cluster y para solucionar problemas.
showq
$ showq
qstat
# Muestra el estado de todas las tareas
$ qstat -a
# Muestra todas las tareas que están corriendo.
$ qstat -r
# Muestra información detallada del JodID 12345
$ qstat -f 12345
# Mostrar información sobre todas las colas del cluster
$ qstat -q
# Mostrar las tareas en el cluster de un usuario en específico
$ qstat -u <usuario>
showstart
$ showstart 12345
checkjob
$ checkjob 123345
# Mostrar aun mas información sobre la tarea
$ checkjob -v 12345
tracejob
# Muestra información sobre la tarea 12345. (Solo muestra información hasta 24 horas atras)
$ tracejob 12345
# Este comando mostrara la bitacora de 2 dias atras.
$ tracejob -n 2 12345
qdel
# Elimina la tarea 12345
$ qdel 12345
pbsnodes
# Este comando genera mucha información se recomienda usar la pipa y less para navegar por la salida.
$ pbsnodes | less
Sistema de archivos LUSTRE¶
¿Qué es LUSTRE?¶
Lustre es un sistema de archivos compartidos de alto desempeño para clusters Linux manejado por el software de Lustre. Es altamente escalable y puede soportar miles de nodos cliente, petabytes de almacenamiento, y un rendimiento de cientos de gigabytes por segundo. La carpeta que que contiene este sistema de archivos se encuentra montado en /LUSTRE
.
Cada sistema de archivos Lustre es en realidad un conjunto de varios mini sistemas de archivos, a los que se les llama “Object Storage Targets” (OSTs). El software de Lustre presenta los OSTs como un solo sistema de archivos unificado.