Programas de Alocação

Para fins de alocação e contabilização de uso, pesquisadores que ganham acesso aos recursos do SDumont recebem uma cota de Unidades de Alocação (UA). Cada UA corresponde ao uso de um núcleo (core) de um nó de computação B710 por uma hora. Em princípio (casos particulares podem ser avaliados excepcionalmente) a alocação de um nó de computação não é compartilhada por mais de uma tarefa simultaneamente. No contexto deste documento, uma tarefa se refere a um job do sistema de gerenciamento de filas.

Disso decorre que a alocação de um único nó de computação implica no bloqueio, e portanto na contabilização de uso, de todos os núcleos daquele nó. Como isso implica também, no caso dos nós B715, no bloqueio de dispositivos (GPUs e co-processadores MIC), os diferentes nós estão segmentados logicamente em diferentes filas de submissão de tarefas. As filas associadas aos nós B715 tem um custo de alocação maior que os nós B710. O mesmo vale para as filas associadas ao nó MESCA2 (do tipo fat node). Mais detalhes sobre as filas do SDumont são apresentados aqui.

O SDumont atende diferentes tipos de projetos, por meio de diferentes programas de alocação. Projetos são submetidos por pesquisadores e avaliados pelos Comitês Gestor e de Assessoramento Técnico-Científico do SDumont em resposta a chamadas abertas regularmente para cada um desses programas de alocação. Tais chamadas são divulgadas nas listas das principais sociedades científicas bem como no site e nas mídias sociais do SINAPAD. São 3 (três) os programas de alocação:

  • Premium : provê alocações a projetos de pesquisa que solicitam mais de 5.000.000 UAs.

  • Standard : provê alocações a projetos de pesquisa que solicitam um mínimo de 500.000 UAs e um máximo de 4.999.999 UAs.

  • Fins Educacionais : provê alocações de no máximo 100.000 UAs, para realização de cursos de treinamento para usuários do SDumont. Os cursos deverão ter como conteúdo tópicos tais como uso do sistema de submissão de tarefas, ferramentas de avaliação de desempenho da aplicação, e noções de boas práticas de programação em arquiteturas paralelas, a fim de estimular o uso dos diferentes recursos computacionais disponíveis, da melhor maneira possível.

Os projetos Premium e Standard têm duração máxima de 6 meses, renováveis por mais 6 meses no caso de projetos Standard (totalizando 12 meses), ou por mais 12 meses no caso de projetos Premium (totalizando 18 meses), mediante apresentação de relatório intermediário a ser avaliado pelos Comitês Gestor e de Assessoramento. A duração dos projetos Educacionais depende da duração dos cursos propostos.

Critérios de alocação

Para cada projeto alocado em um dos programas de alocação — Premium, Standard, ou Educacional — é dada uma cota de UAs, cujo tamanho é definido a partir da demanda apresentada na proposta do projeto, da quantidade de propostas aprovadas, do tempo estimado de execução do projeto, e dos recursos computacionais disponíveis no sistema.

Cada projeto pode criar a quantidade de contas de usuários individuais que forem necessárias para sua execução. Todas as submissões desses usuários nas filas do SDumont debitarão da cota do projeto.

Para fins de referência, supondo o uso ininterrupto por 365 dias, o número total de UAs é dado pela fórmula:

  • Total de UAs = #nós x #núcleos/nó x #horas/dia x #dias x custo da UA

    • Nós B710 : 504 x 24 x 24 x 365 x 1,0 = 105 960 960 UAs

    • Nós B715+GPU : 198 x 24 x 24 x 365 x 1,5 = 62 441 280 UAs

    • Nós B715+MIC : 54 x 24 x 24 x 365 x 1,5 = 17 029 440 UAs

    • Nó MESCA2 : 1 x 240 x 24 x 365 x 2,0 = 3 153 600 UAs

Portanto, para um ano de operação, o SDumont tem capacidade máxima de disponibilizar um total de 188 585 280 UAs.

Importante ressaltar que, no entanto, este é um valor nominal do total de UAs. O total de UAs a serem efetivamente oferecidas está sujeito às condições de operação do sistema, tais como, por exemplo, o percentual de tempo que máquina estará em funcionamento, e a eficiência do escalonador de tarefas.

Critérios de armazenamento

Os critérios de armazenamento reservado para os projetos do SDumont são definidos para duas classes de sistema de arquivos/partição diferentes: Scratch e Home .

  • Scratch : armazenamento de arquivos que contém os dados de entrada da aplicação, além dos dados de saída gerados pela aplicação.

  • Home : partição onde se localizam os códigos-fonte, os binários executáveis, e as bibliotecas.

TABELA 2: Cotas máximas de armazenamento das partições do SDumont, para os projetos dos programas de alocação Premium (P) e Standard (S).
Partição Cota máxima por projeto
Scratch 50 TB (P) / 25 TB(S)
Home 5TB (P/S)

Critérios de elegibilidade

Os pesquisadores interessados em utilizar os recursos computacionais do SDumont devem observar a adequação da sua proposta aos seguintes critérios de elegibilidade:

  • O pesquisador principal da proposta deve possuir título de doutor e ter vínculo (seja empregatício ou temporário, como por exemplo pesquisador visitante ou bolsista de pós-doutorado) com instituição de ensino ou de pesquisa no Brasil.

  • O uso do SDumont via programas de alocação Standard, Premium e Educacional é destinado exclusivamente ao ensino e à pesquisa científica e tecnológica.

  • Aplicações inseridas em algum projeto já financiado por agência de fomento à pesquisa, nacionais ou internacionais, terão maior prioridade de atendimento.

Informações para Projetos em Andamento

Citações

Resultados de projetos que tenham utilizado os recursos computacionais do SDumont devem citar adequadamente o sistema. Por exemplo, para publicações sugere-se o seguinte texto de agradecimento/acknowledgement, que pode ser adaptado/traduzido de acordo com a circustância:

"The authors acknowledge the National Laboratory for Scientific Computing (LNCC/MCTI, Brazil) for providing HPC resources of the SDumont supercomputer, which have contributed to the research results reported within this paper. URL: http://sdumont.lncc.br"