SDumont - Sistema Brasileiro de Computação Petaflópica

Supercomputador Santos Dumont (SDumont)

Características
Informações sobre acesso
Módulos de Ambiente
1. Módulos para as filas sequana_*
Compiladores e Implementações MPI
Gerenciador de Filas
Submeter Jobs
Verificar status
Remover jobs da fila ou em execução
Comentários Finais
1. Variáveis de ambiente do Slurm

1. Características

A primeira versão do SDumont, chamada de "SDumont Base", possuía um total de 18.424 núcleos de CPU, distribuídos em 758 nós computacionais utilizando a tecnologia BullX B700

No quarto trimestre de 2019 o SDumont recebeu uma expansão computacional, composta da tecnologia BullSequana X, que aumentou o poder computacional de 1,1 Petaflops para 5,1 Petaflops. Após essa expansão o SDumont passou a contar com um total de 36.472 núcleos de CPU, distribuídos em 1.134 nós computacionais.

Fila	Wall-clock máximo (em horas)	Número mínimo de nós (núcleos+ dispositivos)	Número máximo de nós (núcleos+ dispositivos)	Número máximo de tarefas em execução por usuário	Número máximo de tarefas em fila por usuário	Custo em Unidade de Alocação (UA)
cpu (Nós B710)	96	21 (504)	50 (1200)	4	24	1,0
nvidia (Nós B715)	48	21 (504+42)	50 (1200+100)	4	24	1,5
gdl⁶ (Nós Sequana IA)	48	1 (40+8)	1 (40+8)	1	6	2,0
mesca2 ⁵	48	1 (240)	1 (240)	1	6	2,0
cpu_small	72	1 (24)	20 (480)	16	96	1,0
nvidia_small	1	1 (24+2)	20 (480+40)	4	24	1,5
cpu_dev ¹	0:20	1 (24)	4 (96)	1	1	1,0
nvidia_dev ¹	0:20	1 (24+2)	4 (96+8)	1	1	1,5
cpu_scal ²	18	51 (1224)	128 (3072)	1	8	1,0
nvidia_scal ²	18	51 (1224+102)	128 (3072+256)	1	8	1,5
cpu_long ³	744 (31 dias)	1 (24)	10 (240)	3	18	1,0
nvidia_long ³	744 (31 dias)	1 (24+2)	10 (240+20)	2	4	1,5
cpu_shared ⁷	72	1 (1)	10 (240)	16	96	1
het_scal ⁹	18	16 (384)	128 (3072)	1	8	1,5
Requisições especiais ⁴	-	-	-	-	-	-
Todos os thin nodes ⁴	-	-	-	-	-	-
Filas da expansão
sequana_cpu	96	1 (48)	50 (2400)	4	24	1,0
sequana_cpu_dev ¹	0:20	1 (48)	4 (192)	1	1	1,0
sequana_cpu_long ³	744 (31 dias)	1 (48)	10 (480)	3	18	1,0
sequana_cpu_shared ⁸	96 (4 dias)	1 (1)	50 (2400)	4	24	1,0
sequana_cpu_bigmem ¹⁰	96	1 (48)	18 (864)	4	24	1,0
sequana_cpu_bigmem_long ¹⁰	744 (31 dias)	1 (48)	5 (240)	3	18	1,5
sequana_gpu	96	1 (48+4)	21 (1008+84)	4	24	1,5
sequana_gpu_dev ¹	0:20	1 (48+4)	4 (192+16)	1	1	1,5
sequana_gpu_long ³	744 (31 dias)	1 (48+4)	10 (480+40)	3	18	1,5
sequana_gpu_shared ¹¹	96	1 (48+4)	15 (720+60)	4	24	1,5

Supercomputador Santos Dumont (SDumont)

1. Características

1.1 Nós SDumont Base (B700)

1.2 Nós SDumont Expansão (BullSequana X)

1.3. Filesystem e Armazenamento

1.4. Utilização do Scratch com Striping

1.4.1 Considerações ao utilizar o striping

1.4.2 Considerações ao definir o stripe_size

1.4.3 Configurando o striping para arquivos e diretórios

1.4.4 Outros comandos do Lustre

2. Informações sobre acesso e submissão

3. Módulos de Ambiente

Comandos

3.1. Módulos para as filas sequana_*

4. Compiladores e Implementações MPI

Compiladores disponíveis

Implementações MPI disponíveis

Intel MPI

5. Gerenciador de filas

6. Submeter Jobs

6.1. Jobs paralelos (MPI)

6.2. Jobs paralelos (MPI-multithreaded)

6.3. Jobs paralelos (threads/OpenMP)

6.4. Múltiplas tarefas simultâneas em um único job

6.5. Jobs Interativos (salloc)

6.6. Jobs para a fila de IA (gdl)

6.7. Jobs para a fila cpu_shared

6.8. Jobs para as filas sequana

6.9. Jobs para a fila sequana_cpu_shared

6.10. Jobs para a fila heterogênea het_scal

7. Verificando status

7.1. Status/Reason do job

7.2. Informações sobre a Utilização

7.3. Visualizando o consumo dos recursos das filas _shared

8. Remover jobs da fila ou em execução

9. Comentários Finais

9.1. Variáveis de ambiente do Slurm