SSCAD 2024

XXV Simpósio em Sistemas Computacionais de Alto Desempenho

23 a 25 de outubro, 2024 — São Carlos, SP, Brasil



Programação Geral



Horário/Local:
Auditório 1 (BCo)
Auditório 2 (BCo)
Auditório 3 (BCo)
LE6 (DC)
Espaço Maker (DC)
Bento Prado

7:00 - 8:00

Credenciamento



9:45 - 10:15

Coffee Break



12:00 - 13:30

Almoço




16:15 - 16:45

Coffee Break




18:15 - 18:30


18:30 -

Coquetel




Detalhes


Minicurso 1: Multi-GPU Multi-Node Programming

Autores: Pedro Mário Cruz e Silva, Senior Solutions Architect - NVIDIA

Sala: Auditório 2 (BCo)

Horário: 8:00 - 9:45 e 10:15 - 12:00

Resumo: Scaling applications to multiple GPUs across multiple nodes requires one to be adept at not just the programming models and optimization techniques but also at performing root-cause analysis using in-depth profiling to identify and minimize bottlenecks. In this boot camp, participants will learn to improve the performance of an application step-by-step, taking cues from profilers along the way. Moreover, understanding the underlying technologies and communication topology will help us utilize high-performance NVIDIA libraries to extract more performance out of the system.


Minicurso 2: Introdução à Computação Quântica com IBM/Qiskit

Autores: Calebe Bianchini, Giancarlo P. Gamberi, Ryan M. A. Santos, Universidade Presbiteriana Mackenzie

Sala: LE6 (DC)

Horário: 8:00 - 9:45

Resumo: O objetivo deste minicurso é mostrar como desenvolver algoritmos para a arquitetura de um Computador Quântico usando o kit de desenvolvimento IBM/Qiskit. Consequentemente, pretendemos resolver problemas clássicos da computação tradicional nesse nova arquitetura. Sabemos que escrever algoritmos e programas nesse novo paradigma é um desafio e, por isso, serão definidos e apresentados assuntos importantes da Computação Quântica como sua arquitetura, o emaranhamento, as portas lógicas, os circuitos utilizados e como eles se comportam diferentemente de uma arquitetura tradicional. Por meio de demonstrações, será apresentado como essa tecnologia emergente fornece um grau interessante de paralelismo e aceleração computacional significativos em relação às arquitetura clássicas, e permitirá que o leitor se prepare melhor para programar para um computador quântico.


Maratona

Sala: Espaço Maker (DC)

Horários: 8:00 - 9:45, 10:15 - 12:00 e 14:30 - 16:15


SSCAD (S1) : Aprendizado de Máquina

Chair: Philippe Olivier Alexandre Navaux (UFRGS)

Sala: Bento Prado - Apresentações: 15 m e Perguntas: 5 m (ao todo 20 m por trabalho)

Horário: 8:00 - 9:45

Avaliação das Técnicas Gulosa e Probabilística no Desempenho do Algoritmo de Otimização de Colônia de Formigas

Ana Carolina Gonçalves (PUC Minas), Maria Eduarda Oliveira de Brito (PUC Minas), Henrique Cota de Freitas (PUC Minas), Cristiane Nobre (PUC Minas)

Análise de Redes Neurais para CRISPR: Uma Abordagem com Computação Quântica

Marcus Gabrich (PUC Minas), Henrique Cota de Freitas (PUC Minas), Matheus Souza (PUC Minas)

Modelos de Predição do Tempo de Jobs Aplicados a um Ambiente de Produção de Alto Desempenho

Miguel de Lima (UFF), Bernardo Gallo (UFF), Luciano Andrade (UFF), Felipe A. Portella (PETROBRAS), Paulo J. B. Estrela (PETROBRAS), Renzo Q. Malini (PETROBRAS), Alan Nunes (UFF), José Viterbo (UFF), Lúcia Drummond (UFF)

Implementação Paralela de Múltiplos K-Means em GPU

Walter Bueno (UFV), Olavo Silva (UFV), José A. Nacif (UFV), Ricardo Ferreira (UFV)

Implementações Eficientes de Random Forest em FPGA de Baixo Custo para Internet das Coisas e Computação de Borda

Alysson Silva (UFV), Olavo Silva (UFV), Icaro Moreira (UFV), José A. Nacif (UFV), Ricardo Ferreira (UFV)


CTD mestrado

Chair: Cristiana Bentes (UERJ) e Ricardo Ferreira (UFV)

Sala: Auditório 1 (BCo)

Horário: 10:15 - 12:00

Improving Direct Convolution through Tensor Slicing, Vectorized Packing and ISA Extensions

Victor Ferrari (Unicamp)

HPC@Cloud: A Provider-Agnostic Toolkit to Enable the Execution of HPC Applications on Public Clouds

Vanderlei Pereira Filho (UFSC)

Uma estratégia de rebalanceamento de estados para checkpoints particionados

Henrique Dos Santos Goulart (UFSC)


Minicurso 3: Perfilamento e Visualização da Escalabilidade de Aplicações Paralelas como Parallel Scalability Suite

Autores: Felipe Hidequel Santos da Silva, Samuel Xavier-de-Souza, UFRN

Sala: LE6 (DC)

Horário: 10:15 - 12:00

Resumo: Supercomputadores são ferramentas essenciais para o avanço científico e tecnológico, mas sua capacidade de processamento nem sempre é totalmente utilizada. Programas práticos costumam ter dificuldade em aproveitar mais de 2% da capacidade total das máquinas, tornando-as ineficientes. Ferramentas tradicionais de apoio ao desenvolvimento de software para supercomputadores focam na aceleração em configurações específicas, sem prever o comportamento em outras máquinas.Visando otimizar o uso de supercomputadores, o Laboratório de Arquiteturas Paralelas para Processamento de Sinais da UFRN desenvolveu o Parallel Scalability (PaScal) Suite. Esse conjunto de ferramentas inovadoras se diferencia por avaliar a escalabilidade dos programas, ao invés de apenas o desempenho. Através do PaScal Suite, é possível prever como o programa se comporta em diferentes configurações e máquinas, otimizando o uso de recursos e aumentando a eficiência geral. O PaScal Suite é uma ferramenta brasileira com grande potencial para melhorar a eficiência do uso de supercomputadores. Integra duas ferramentas, o PaScal Analyzer e o PaScal Viewer, simplificando a execução, medição e comparação de execuções de programas paralelos. Ele permite a análise de tendências de escalabilidade em diferentes configurações de processamento e cargas de trabalho, com elementos visuais que ajudam a identificar gargalos de escalabilidade. Esse conjunto de ferramentas é essencial para o desenvolvimento de programas paralelos em nós computacionais de memória compartilhada. O minicurso aborda a importância e os métodos de avaliação da escalabilidade em programas paralelos. Demonstrará como o PaScal Suite pode auxiliar desenvolvedores na realização de perfilamento e análises de escalabilidade, ensinando na prática a identificar pontos críticos e gargalos.


SSCAD (S2) : Arquitetura e Simulação

Chair: Ricardo Menotti (UFSCar)

Sala: Bento Prado - Apresentações: 15 m e Perguntas: 5 m (ao todo 20 m por trabalho)

Horário: 10:15 - 12:00

HybriD-GM: Um Modelo Paralelo para Computação Quântica direcionado às Arquiteturas Híbridas

Anderson Avila (UFPel), Rafael Bastos (UFPel), Bruno Moura (UNIPAMPA), Helida Santos (FURG), Giancarlo Lucca (UCPEL), Anderson Cruz (UFRN), Samuel Xavier-de-Souza (UFRN), Adenauer Yamin (UFPel), Renata Reiser (UFPel)

A Thorough Analysis of Page Fault Handling in Persistent Memory Systems

André Libório (UNESP), Alexandro Baldassin (UNESP), Daniel Castro (INESC-ID), Paolo Romano (INESC-ID), João Barreto (INESC-ID)

Avaliação de Desempenho e Escalabilidade do Algoritmo de Otimização de Colônia de Formigas em C++ e Python

João Marcos de Oliveira Magalhães (PUC Minas), Ana Carolina Gonçalves (PUC Minas), Cristiane Nobre (PUC Minas), Henrique Cota de Freitas (PUC Minas)

Uma Revisão Sistemática sobre Estruturas de Dados em Dispositivos Persistentes Contemporâneos

Lucas Spagnol (UNESP), Bruno Honorio (UNESP), Alexandro Baldassin (UNESP), Emilio Francesquini (UFABC)


O Supercomputador Santos Dumont no cenário nacional e internacional das pesquisas de HPC e IA

Palestrante: Carla Osthoff (Laboratório Nacional de Computação Científica)

Sala: Bento Prado

Horário: 13:30 - 14:30

Biografia Resumida: Possui graduação em Engenharia Elétrica pela PUC/RJ, mestrado e doutorado em Engenharia de Sistemas e Computação COPPE/UFRJ. Atua na área de processamento de alto desempenho desde 1985, inicialmente em projetos de desenvolvimento de hardware de multiprocessadores paralelos distribuídos. Atualmente, é pesquisadora na área de Computação de Alto Desempenho do Laboratório Nacional de Computação Científica (LNCC), professora do Programa Multidisciplinar de Pós-Graduação do LNCC, coordena o Centro Nacional de Processamento de Alto Desempenho do LNCC(CENAPAD/LNCC), é membro do corpo Técnico-Científico do Comitê Consultivo do Supercomputador Santos Dumont, coordena o Setor de Processamento de Alto Desempenho do LNCC e diversos projetos de colaboração na área de Computação de Alto Desempenho.

Resumo: O supercomputador SDumont, hospedado no LNCC /MCTIC, na cidade de Petrópolis-RJ, financiado pelo MCTIC para atender a comunidade acadêmica brasileira, de forma gratuita, atende atualmente a cerca de 240 projetos de pesquisa de 20 áreas de conhecimento, coordenados por instituições de ensino e pesquisa distribuídas em 12 estados brasileiros além de colaborações com instituições de pesquisas internacionais. Nesta palestra serão apresentadas as características da nova arquitetura do supercomputador de cerca de 23 PetaFlops e do futuro Supercomputador para IA, como parte do Plano Nacional de Inteligencia Artificial (PBIA). Em seguida, serão apresentadas as pesquisas e as colaborações desenvolvidas pelo setor de Processamento de Alto Desempenho do LNCC.


CTD doutorado

Chair: Cristiana Bentes (UERJ) e Ricardo Ferreira (UFV)

Sala: Auditório 1 (BCo)

Horário: 14:30 - 16:15

Accelerating FHE for arbitrary computation

Antonio Guimarães (Unicamp)

Mobility-aware Resource Management for Vehicular Edge Computing

Joahannes Costa (Unicamp)

Strategies for efficient subgraph enumeration on GPUs

Samuel Ferraz (UFMS - UFMG)


WIC (S1) : Arquitetura de Computadores

Chair: Henrique Cota de Freitas (PUC Minas)

Sala: Auditório 2 (BCo)

Horário: 14:30 - 16:15

ProcessorCI: Integração Contínua para processadores RISC-V em FPGAs

Julio Avelar (UNICAMP), Victor Lago (UNICAMP), Ângelo Malaguti (UNICAMP), Rodolfo Azevedo (UNICAMP)

Análise de técnicas de predição de desvio sob a arquitetura RISC-V

Lucas Mendes (UFSCar), Mauricio Figueiredo (UFSCar), Ricardo Menotti (UFSCar)

Evaluation of the Impact of Coherence Protocols and Cache Sizes on Parallel Algorithms Through Simulations

Guilherme Fagundes (PUC Minas), Matheus Souza (PUC Minas)

Exploração do Espaço de Projetos de Sistemas GPGPUs ciente de Dark-Silicon

Laura Ludgero (UFMS), Gislayne Damasceno (UFMS), Samuel Rodrigues (UFMS), Ricardo Santos (UFMS), Liana Duenha (UFMS)

Extensão da Ferramenta MultiExplorer para Exploração de Projetos de GPUs e Máquinas Virtuais

Samuel Rodrigues (UFMS), Ricardo Santos (UFMS)


Palestra: A nossa visão da história da Computação de Alto Desempenho

Autores: Alfredo Goldman (IME-USP) e Lucas de Sousa Rosa (IME-USP)

Sala: Auditório 3 (BCo)

Horário: 14:30 - 16:15

Biografia Resumida:
Professor da Universidade de São Paulo e bolsista de produtividade do CNPq. Atualmente é conselheiro da Sociedade Brasileira de Computação e coordenador da comunidade de processamento paralelo na IEEE Computer Society (TCPP). Possui doutorado em Informática e Sistemas pelo Instituto Nacional Politécnico de Grenoble. Trabalha com programação paralela e distribuída e desenvolvimento ágil de software. Coordena um projeto temático da FAPESP.
Doutorando Direto no Programa de Pós-Graduação em Ciência da Computação do Instituto de Matemática e Estatística da Universidade de São Paulo (IME-USP), com experiência em pesquisa científica consolidada por mais de quatro anos como bolsista FAPESP em programas de treinamento técnico, iniciação científica e estágio de pesquisa no exterior. Interesses direcionados a problemas matemático-computacionais, com ênfase em computação de alto desempenho, aprendizado de máquina e escalonamentos.

Resumo: Esta palestra explora a evolução da computação de alto desempenho (HPC) desde seus primórdios até os atuais sistemas exascale. Aborda o desenvolvimento de hardware, software e aplicações em supercomputação. Analisa tendências do ranking TOP500 e destaca figuras importantes como Seymour Cray, conhecido como o 'pai da supercomputação', e Jack Dongarra, notável por suas contribuições em software. A palestra aborda acontecimentos na história da HPC, incluindo o surgimento e declínio do processamento vetorial e seu subsequente renascimento. Traçando o caminho dos primeiros supercomputadores aos sistemas exascale, a apresentação oferece uma visão geral do desenvolvimento histórico da HPC e seu impacto na ciência e tecnologia.


SSCAD (S3) : Avaliação e Medição de Desempenho

Chair: Denise Stringhini (UNIFESP)

Sala: Bento Prado - Apresentações: 15 m e Perguntas: 5 m (ao todo 20 m por trabalho)

Horário: 14:30 - 16:15

Análise de Escalabilidade em um Código de Inversão de Forma de Onda Completa

Felipe H. Santos-da-Silva (UFERSA), João B. Fernandes (UFRN), Samuel Xavier-de-Souza (UFRN), Italo Assis (UFERSA)

Fortran DO CONCURRENT Evaluation in Multi-core for NAS-PB Conjugate Gradient and a Porous Media Application

Gabriel Dineck Tremarin (UNIPAMPA), Anna Victória Gonçalves Marciano (UNIPAMPA), Claudio Schepke (UNIPAMPA), Adriano Vogel (JKU, SETREM)

An Empirical Study of OpenMP Directive Usage in Open-Source Projects on GitHub

Cristian Carvalho Quevedo (UFPel), Simone Cavalheiro (UFPel), Marcos Oliveira Junior (IFFar), Andre Du Bois (UFPel), Gerson Geraldo H. Cavalheiro (UFPel)

Improving performance visualization of OpenMP task-based applications

Vinicius Garcia Pinto (FURG), Christian Einhardt Sousa Filho (FURG)

Sobreposição de computação e escrita do método Fletcher com MPI

Rodrigo Machado (UFRGS), Arthur Lorenzon (UFRGS), Philippe Olivier Alexandre Navaux (UFRGS)


HPC & AI supercomputing

Palestrante: Mônica A. Costa (Hewlett Packard Enterprise)

Sala: Bento Prado

Horário: 16:45 - 17:15

Resumo: Vamos explorar a liderança mundial da HPE em Computação de Alto Desempenho e Inteligência Artificial reforçando o posicionamento da HPE com no. 1 no Top500 (https://www.top500.org/) e apresentar demais casos de sucesso para os Supercomputadores HPE CRAY EX como referência mundial em performance, sustentabilidade e escalabilidade. Vamos apresentar o Portifólio de HPC/AI CRAY XD, com suas diversas arquiteturas e infraestrutura de rede de alta performance, CPUs e Aceleradores, bem como as opções de refrigeração Air Cooled, ARCS e DLC, conforme a disponibilidade de cada ambiente.


Modelagem e Análise do Comportamento de Usuários e Sistemas de Supercomputação: o caso do LNCC

Palestrante: Antônio Tadeu A. Gomes (Laboratório Nacional de Computação Científica)

Sala: Bento Prado

Horário: 17:15 - 18:15

Biografia Resumida: Antônio Tadeu A. Gomes possui graduação em Informática - Magna Cum-Laude - pela UFRJ (1995), mestrado e doutorado em Informática pela PUC-Rio (1999 e 2005). Atualmente é pesquisador do LNCC/MCTI. Também é secretário executivo do SINAPAD (Sistema Nacional de Processamento de Alto Desempenho - http://www.lncc.br/sinapad) e coordenador do Comitê Gestor do supercomputador Santos Dumont (http://sdumont.lncc.br). É vice-coordenador e leciona na Pós-graduação em Modelagem Computacional do LNCC. Seus principais interesses são na ampla área de modelagem de sistemas, englobando sistemas em rede, sistemas distribuídos, sistemas de simulação numérica, sistemas de computação de alto desempenho e sistemas de aprendizado de máquina. É membro da Sociedade Brasileira de Computação (SBC) e da Association for Computing Machinery (ACM). Foi Bolsista de Produtividade em Pesquisa do CNPq (PQ-2) entre 2010 e 2018.

Resumo: Nesta palestra discorro sobre a diversidade de projetos que executam no supercomputador SDumont hospedado no Laboratório Nacional de Computação Científica (LNCC), em Petrópolis-RJ. Tal diversidade -- que abarca diferentes perfis de usuários e de aplicações -- combinada à alta rotatividade de projetos traz desafios relacionados à continua revisão das políticas de escalonamento no supercomputador. Nesse sentido, apresento algumas estratégias sendo estudadas e avaliadas nas áreas de modelagem, análise e simulação discreta do comportamento de usuários e de sistemas de HPC, utilizando os dados de accounting do SDumont como estudo de caso.


Abertura

Sala: Bento Prado

Horário: 18:15 - 18:30


Horário/Local:
Auditório 1 (BCo)
Auditório 2 (BCo)
Auditório 3 (BCo)
LE6 (DC)
Espaço Maker (DC)
Bento Prado

7:00 - 8:00

Credenciamento



9:45 - 10:15

Coffee Break



12:00 - 13:30

Almoço




16:45 - 17:15

Coffee Break




20:30 -

Jantar




Detalhes


Minicurso 4: Técnicas para análise e otimização de programas

Autores: Aleardo Manacero, DCCE/UNESP

Sala: Auditório 1 (BCo)

Horário: 8:00 - 9:45

Resumo: Minicurso proposto abordando problemas relacionados à medição e otimização de desempenho. Ao longo do minicurso serão apresentados os conceitos relacionados à definição de métricas para desempenho (especialmente de programas paralelos), como speedup e escalabilidade. Serão também apresentadas as técnicas para medir o desempenho de sistemas de software, juntamente com ferramentas disponíveis para essa atividade. Conclui-se o minicurso com a apresentação de técnicas para otimizar o desempenho de um programa a partir da identificação de seus gargalos na fase de medição.


Minicurso 1: Multi-GPU Multi-Node Programming (continuação)

Autores: Pedro Mário Cruz e Silva, Senior Solutions Architect - NVIDIA

Sala: Auditório 1 (BCo)

Horário: 8:00 - 9:45 e 17:45 - 19:30


WEAC (S1)

Chair: Rodolfo Azevedo

Sala: Auditório 3 (BCo)

Horário: 8:00 - 9:45

WIMS : A Modern Web-Based MIPS Simulator for Improved Learning in Computer Architecture and Operating Systems

Reinaldo Assis (Universidade Federal de Alagoas), Bruno Costa e Silva Nogueira (Universidade Federal de Alagoas)

Processador MIPS Implementado em Simulador Visual para uso na Educação

Christofer Daniel Rodrigues Santos (Universidade Tecnológica Federal do Paraná), Rogério Gonçalves (Universidade Tecnológica Federal do Paraná), João Fabrício Filho (Universidade Tecnológica Federal do Paraná)

Celestial Suite: uma Ferramenta para a Tradução e Execução de Código de Três Endereços

Guilherme Galante (Universidade Estadual do Oeste do Paraná), Daniel Boll (Universidade Estadual do Oeste do Paraná)

Livros da Comunidade CE-ACPAD


Minicurso 5: Processamento e análise de Big Data para aplicação de algoritmos deMachine Learning com interface Myriad através da utilização da plataforma HPCC Systems

Autores: Mauro Marques, Senior Technical Support Engineer with LexisNexis Risk Solutions

Sala: LE6 (DC)

Horário: 8:00 - 9:45 e 17:45 - 19:30

Resumo: Ao longo do minicurso, os participantes terão a oportunidade de conhecer os conceitos essenciais de processamento e análise de volumes massivos de dados (Big Data) e o processo de desenvolvimento de um serviço de consulta através da utilização da plataforma open-source composta por um Cluster Computacional de Alto Desempenho (HPCC Systems) e, também, a aplicação de algoritmos de Aprendizado de Máquina com interface Myriad, bem como terão a possibilidade de aplicar os conhecimentos adquiridos em um ambiente de treinamento disponibilizado em sala de aula.


Maratona

Sala: Espaço Maker (DC)

Horários: 8:00 - 9:45, 10:15 - 12:00 e 14:30 - 16:15


SSCAD (S4) : Algoritmos Paralelos e Distribuídos

Chair: Ítalo Augusto Souza de Assis (UFERSA)

Sala: Bento Prado - Apresentações: 15 m e Perguntas: 5 m (ao todo 20 m por trabalho)

Horário: 8:00 - 9:45

Efficient Agent-Based Simulations Using the Sender Asynchronous Progamming Model

Pablo Alessandro Santos Hugen (UNIOESTE), Guilherme Galante (UNIOESTE)

Redução Paralela Otimizada para Segmentos Regulares e Irregulares em GPU

Michel Brasil Cordeiro (UFPR), Wagner Zola (UFPR)

Lightweight Asynchronous Repartitioning for Local State Partitioned Systems

Douglas Luiz (UFSC), Odorico Mendizabal (UFSC)

Escolha do Ladrilhamento para um Simulador de Ondas Acústicas em GPUs por meio de Aprendizado de Máquina

Tiago da Silva (UFSCar), Edson Gomi (USP), Hermes Senger (UFSCar)

A job shaping strategy to accomodate workload traces under varying resource management policie

João Pedro M. N. dos Santos (LNCC), Antonio Tadeu Gomes (LNCC)


Reunião CRAD-SP

Sala: Auditório 1 (BCo)

Horário: 10:15 - 12:00


WIC (S2) : Computação de Alto Desempenho

Chair: Márcio Castro (UFSC)

Sala: Auditório 2 (BCo)

Horário: 10:15 - 12:00

Avaliação do Desempenho de Aplicações CUDA em um Ambiente com a Tecnologia Multi-Instance GPU

Pablo Silva de Faria (UFJF), Marcelo Lobosco (UFJF)

Proposta e Avaliação de um Cluster de Banana Pi Single Boards com NAS Parallel Benchmarks

Marcos Silva (PUC Minas), Henrique Freitas (PUC Minas)

Benchmark da linguagem Bend em comparativo com Python e OpenMP

Arthur Passos (Mackenzie), Calebe Bianchini (Mackenzie), Natan Passos (Mackenzie)

Avaliação de Desempenho dos Algoritmos de Números Primos e Monte Carlo em Ambientes HPC

Gabriella Osório Ribeiro (IFRO), Lucas Sêmeler (IFRO), Wanderson Roger Azevedo Dias (IFRO)

Análise de Desempenho do BEAST 1.10 em ambientes de HPC: Explorando CPU, GPU, Multi-GPU

Guilherme Freire (LNCC), Micaella Paula (LNCC), Kary Ocaña (LNCC), Carla Osthoff (LNCC)


WEAC (S2)

Chair: Guilherme Galante

Sala: Auditório 3 (BCo)

Horário: 10:15 - 12:00

Um Relato de Experiência do Uso de Metodologias Ativas na Construção do Pensamento Computacional Paralelo

Josivaldo de Araujo (Universidade Federal do Pará),Helder Dias (Universidade Federal do Pará)

Integrating Continuous Assessment into Undergraduate Computer Architecture using Automated Grading

Lucas Wanner (Universidade Estadual de Campinas)

Desenvolvendo Ferramentas para Ensino de RiscV com Python, Verilog, Matplotlib, SVG e ChatGPT

Guilherme Figueiredo (Universidade Federal de Viçosa),Erick Souza (Universidade Federal de Viçosa),Julio Rodrigues (Universidade Federal de Viçosa), José Augusto Nacif (Universidade Federal de Viçosa), Ricardo Ferreira (Universidade Federal de Viçosa)

Aprimorando a Aprendizagem de Arquitetura de Computadores com um Currículo em Espiral

Leonardo Pinho (Universidade Federal do Pampa), Julio Saraçol Domingues Júnior (Universidade Federal do Pampa)

Livros da Comunidade CE-ACPAD


SSCAD (S5) : Computação Sustentável

Chair: Cesar Augusto Fonticielha de Rose (PUCRS)

Sala: Bento Prado - Apresentações: 15 m e Perguntas: 5 m (ao todo 20 m por trabalho)

Horário: 10:15 - 12:00

Performance and Energy Prediction of OpenMP and CUDA Applications using Machine Learning and Pre-execution Features

Fellipe Queiroz (UFPA), Luan Siqueira (UFPA), Erick Damasceno (UFPA), Thiago Rodrigues (UFPA), Marcos Amaris (UFPA)

Estudo de desempenho e de eficiência energética de simulação dinâmica de fluidos multifásicos nas arquiteturas NVIDIA Volta V100 e Grace Hopper GH200

Thiago Teixeira (LNCC), Frederico Cabral (LNCC), Micaella Coelho (LNCC), Luciano Leite (COPPE), Rodrigo Surmas (CENPES), Marcio Borges (LNCC), Carla Osthoff (LNCC)

Comparative Analysis of Compiler Efficiency: Energy Consumption Metrics in High-Performance Computing Domains

Erick Damasceno (UFPA), Fellipe Queiroz (UFPA), Luan Siqueira (UFPA), Thiago Rodrigues (UFPA), Marcos Amaris (UFPA)

Explorando Modelos GPT na Geração de Código Paralelo para Aplicações de Computação Stencil

João Vitor Dias (UFRGS), Antonio Carlos Schneider Beck (UFRGS), Arthur Lorenzon (UFRGS)


Technological challenges in HPC for weather and climate prediction

Palestrante: Pedro Leite da Silva Dias (IAG/USP)

Sala: Bento Prado

Horário: 13:30 - 14:30

Biografia Resumida: Bacharel em Matemática Aplicada-IME-USP/1974, PhD em Ciências Atmosféricas na Colorado State University-1979. Professor Titular no IAG/USP desde 1975. Diretor do IAG/USP (2017-2021), Diretor do LNCC/MCTI (2007-2015) e Chefe do CPTEC/INPE (1988-1990). Membro titular da Academia Brasileira de Ciências e recebeu a Ordem do Mérito Científico do MCTI. Orientou cerca de 70 alunos de pós-graduação. Ampla experiência em desenvolvimento de modelos computacionais eficientes aplicados à previsão de tempo e clima.

Resumo: A short history of numerical weather prediction will be presented, beginning with Richardson's (1922) pioneering experiments, the birth of computational predictions in the late 40's with the ENIAC computer, the introduction of more complex models in the 60's and early 70's, and the impact of the vector machines (Cray, Cyber) in the operational centers. New challenges were brought in the late 80's and 90's in the operational forecasting centers by the parallel computers and the demand for computational power needed to accomplish the goals of the Intergovernmental Panel for Climate Change. Massive parallelization since the early 2000's led to a major improvement in the quality of the weather forecasts, driven by data assimilation systems and GPU's. Current challenges will be discussed at the end.


II Painel sobre Infraestruturas de HPC no Brasil

Sala: Bento Prado

Horário: 14:30 - 16:45

Resumo: Infraestruturas de HPC são elementos estratégicos para a pesquisa e o desenvolvimento científico e tecnológico em diversas áreas como Inteligência Artificial, Energia, Estudos Climáticos, entre outros. Este painel abordará as principais infraestruturas de HPC existentes no Brasil, bem como projetos e iniciativas em andamento. Também serão abordados aspectos sobre políticas de investimento no setor e perspectivas futuras.

Participante: Philippe O. A. Navaux (moderador)

Biografia Resumida: Philippe O. A. Navaux, é professor emérito do Instituto de Informática da UFRGS, Doutorado em Computação, INPG, 1979. Pesquisador nível 1 do CNPq nas áreas de Arquitetura de Computadores e HPC. Orientou mais de 100 estudantes de doutorado e mestrado e publicou mais de 400 artigos em periódicos e conferências. Sócio da SBC, SBPC, ACM e IEEE. Foi coordenador do Comitê da Computação da Capes, CNPq e Fapergs. Foi conselheiro da UFRGS, da Fapergs, do CATI/ MCTI, do LNCC. Atualmente membro do conselho do CIEE-RS e presidente do Conselho do SCALAC.

Participante: Antonio Tadeu Gomes (LNCC)

Biografia Resumida: Antônio Tadeu A. Gomes é doutor em Informática pela PUC-Rio e pesquisador do LNCC/MCTI. Também é secretário executivo do SINAPAD e coordenador do Comitê Gestor do supercomputador Santos Dumont. É vice-coordenador e leciona na Pós-graduação em Modelagem Computacional do LNCC. Seus principais interesses são na ampla área de modelagem de sistemas, englobando sistemas em rede, sistemas distribuídos, sistemas de simulação numérica, sistemas de computação de alto desempenho e sistemas de aprendizado de máquina.

Participante: Carlos Pavarina (Sidi)

Biografia Resumida: Carlos E Pavarina é o responsável pela maior infraestrutura de HPC em IA da América Latina, no SIDI. Com formação em Análise de Sistemas e especialização em gestão em telecomunicações pela FGV, liderou a criação e o desenvolvimento desse supercomputador chamado IARA e atualmente listado no TOP500. O IARA vem impulsionando a pesquisa e a inovação na área de inteligência artificial no Brasil.

Participante: Guilherme de Paula Corrêa (MCTI)

Biografia Resumida: Engenheiro eletrônico formado pelo Instituto Militar de Engenharia (IME), Mestre em Engenharia Elétrica pela Universidade de Brasília (UnB) e pós-graduado em Administração Pública. Tem atuado no mercado de eletrônica/tecnologia/telecomunicações nos últimos 27 anos, sendo 16 deles na iniciativa privada e os últimos 11 anos como servidor público federal, em exercício desde 2013, no Ministério da Ciência, Tecnologia e Inovações (MCTI). Trabalhou de 2014 a 2018 com a elaboração do Plano Nacional de Internet das Coisas e a partir de 2019, até os dias atuais, com políticas públicas para o setor de Tecnologias da Informação e Comunicação (TICs), incluindo a Lei de TICs (ou Lei de Informática) e o Programa de Apoio ao Desenvolvimento Tecnológico da Indústria de Semicondutores (PADIS). Mais recentemente tem se dedicado aos temas de HPC (high performance computing) e IA, com foco no Plano Brasileiro de Inteligência Artificial (PBIA). Atualmente exerce o cargo de Coordenador-Geral de Tecnologias Digitais na Secretaria de Ciência e Tecnologia para Transformação Digital (SETAD) do MCTI.

Participante: Guilherme S. Vilela (Petrobras)

Biografia Resumida: Mestrado em Engenharia de Sistemas e Ciência da Computação, trabalha como consultor de HPC na Petrobras, cujas responsabilidades incluem projetar e definir especificações técnicas de soluções HPC, bem como solucionar problemas de desempenho relacionados a clusters Linux. Participou de vários projetos de supercomputadores, incluindo os cinco maiores e mais eficientes supercomputadores da América Latina, de acordo com o TOP500 e o Green500.

Participante: Pedro Leite da Silva Dias (IAG/USP)

Biografia Resumida: Bacharel em Matemática Aplicada-IME-USP/1974, PhD em Ciências Atmosféricas na Colorado State University-1979. Professor Titular no IAG/USP desde 1975. Diretor do IAG/USP (2017-2021), Diretor do LNCC/MCTI (2007-2015) e Chefe do CPTEC/INPE (1988-1990). Membro titular da Academia Brasileira de Ciências e recebeu a Ordem do Mérito Científico do MCTI. Orientou cerca de 70 alunos de pós-graduação. Ampla experiência em desenvolvimento de modelos computacionais eficientes aplicados à previsão de tempo e clima.


Dell & NVIDIA soluções para HPC/IA

Palestrante: Evaldo Costa e Pedro Mario

Sala: Bento Prado

Horário: 17:15 - 17:45

Biografia Resumida:
Evaldo Costa Engenheiro sênior responsável pelo desenvolvimento de projetos com soluções Dell & NVIDIA. Possui mais de vinte anos de experiência na área de Tecnologia da Informação em planejamento e implementação de ambientes de missão crítica, arquitetura de soluções para Data Center, HPC/IA. Graduado em engenharia elétrica, mestre e doutor em informática pela UFRJ.
Pedro Mário Cruz e Silva fez sua graduação (1995) e mestrado (1998) na Universidade Federal de Pernambuco (UFPE), fez seu doutorado em 2004 na PUC-Rio. Criou o Grupo de Geofísica Computacional na PUC-Rio onde trabalhou por 15 anos como Gerente, durante este período foi responsável por vários projetos de Desenvolvimento de Software e P&D para Geofísica com forte foco em inovação. Concluiu o MBA em 2015 na Fundação Getúlio Vargas (FGV/RJ). Atualmente é o Arquiteto de Soluções para Ensino Superior e Pesquisa na Região da América Latina.


Reunião CE-ACPAD

Sala: Bento Prado

Horário: 17:45 - 19:30


Horário/Local:
Auditório 1 (BCo)
Auditório 2 (BCo)
Auditório 3 (BCo)
LE6 (DC)
Espaço Maker (DC)
Bento Prado

7:00 - 8:00



9:45 - 10:15

Coffee Break



11:30 - 13:00

Almoço




15:45 - 16:00


16:00 -

Coffee Break




Detalhes


WIC (S3) : Energia, Sustentabilidade e Sistemas Distribuídos

Chair: João Fabrício Filho (UTFPR)

Sala: Auditório 2 (BCo)

Horário: 8:00 - 9:45

Evolução histórica do desempenho energético de tarefas cotidianas em uma distribuição Linux

Artur Cupelli (USP), Fabio Nakano (USP), Flávio Coutinho (USP), Daniel Cordeiro (USP)

Tomatinho: Uso de IoT para Aumentar a Produtividade Utilizando a Técnica Pomodoro

Fernanda Gomes (PUC Minas), Pedro Alves (PUC Minas), Fabrizio Mello (PUC Minas), Camila Hollerbach Pimenta Macedo (PUC Minas), Gabriel Pinto Azevedo (PUC Minas), Pedro Ramos (PUC Minas), Ricardo Carlini Sperandio (PUC Minas), Matheus Souza (PUC Minas), Felipe Domingos da Cunha (PUC Minas)

Desempenho de Workflows Científicos de Transcriptômica em Arquiteturas de Memória Distribuída e Compartilhada do Santos Dumont

Reiglan Di Lourenço (FAETERJ), Albert Emidio (FAETERJ), Lucas Cruz (LNCC), Micaella Paula (LNCC), Kary Ocaña (LNCC), Carla Osthoff (LNCC)

Tucano: A Service Scheduler and Load Balancer in a Distributed System

Luiz Felipe Gonçalves (PUC Minas), Eduardo Paschoalini (PUC Minas), Gustavo Aguiar (PUC Minas), Yuri Rousseff (PUC Minas), Pedro Ramos (PUC Minas), Ricardo Carlini Sperandio (PUC Minas), Matheus Souza (PUC Minas), Felipe Domingos da Cunha (PUC Minas)

Implantação e Avaliação de um Sistema de Monitoramento de Recursos Computacionais de Cluster: um enfoque em desenvolvimento sustentável

Vitor Emerique (UFOPA), Fabio Lobato (UFOPA), Marcelino Silva (UFOPA)


Minicurso 6: Programação Paralela Híbrida: MPI + OpenMP Offloading

Autores: Calebe P. Bianchini - Mackenzie , Evaldo B. Costa, Gabriel P. Silva - UFRJ

Sala: LE6 (DC)

Horário: 8:00 - 9:45

Resumo: Este minicurso tem como objetivo apresentar técnicas de programação paralela híbridas utilizando MPI e diretivas de Offloading do OpenMP, com ênfase nos modelos de paralelismo em aceleradores. Serão abordadas as modificações necessárias no código-fonte para implementar esses modelos, e os resultados obtidos serão avaliados por meio de métricas de desempenho, como aceleração e eficiência.


SSCAD (S6) : Computação em Nuvem

Chair: Wellington Santos Martins (UFG)

Sala: Bento Prado - Apresentações: 15 m e Perguntas: 5 m (ao todo 20 m por trabalho)

Horário: 8:00 - 9:45

Towards multicluster computations with Julia

Francisco H. de Carvalho Junior (UFC), Tiago Carneiro (IMEC)

A Modular Architecture and a Cost-Model to Estimate the Overhead of Implementing Confidentiality in Cloud Computing Environments

Mauro Storch (PUCRS), Vinícius Meyer (UNIVATES), Avelino Zorzo (PUCRS), Cesar De Rose (PUCRS)

Performance Evaluation of Dense Linear Algebra Kernels using Chameleon and StarPU on AWS

Vinicius Garcia Pinto (FURG), João Vicente Ferreira Lima (UFSM), Vanderlei Munhoz (UFSC), Daniel Cordeiro (USP), Emilio Francesquini (UFABC), Márcio Castro (UFSC)

An Analysis of Performance Variability in AWS Virtual Machines

Miguel de Lima (UFF), Luan Teylo (INRIA), Lucia Drummond (UFF)

Uma Análise Multicamadas do Consumo de Energia em Cargas Big Data

Nestor D. O. Volpini (CEFET-MG, UFMG), Vinicius Dias (UFLA), Dorgival Guedes (UFMG)


The Price Performance of Performance Models

Palestrante: Felix Wolf (Technical University of Darmstadt)

Sala: Bento Prado

Horário: 10:15 - 11:15

Biografia Resumida: Felix Wolf is a full professor at the Department of Computer Science of the Technical University of Darmstadt in Germany, where he leads the Laboratory for Parallel Programming. He works on methods, tools, and algorithms that support developing and deploying parallel software systems in various life-cycle stages. Wolf received his Ph.D. degree from RWTH Aachen University in 2003. After working more than two years as a postdoc at the Innovative Computing Laboratory of the University of Tennessee, he was appointed research group leader at Juelich Supercomputing Centre. Between 2009 and 2015, he was head of the Laboratory for Parallel Programming at the German Research School for Simulation Sciences in Aachen and a full professor at RWTH Aachen University. Wolf has made major contributions to several open-source performance tools for parallel programs, including Scalasca, Score-P, and Extra-P. Moreover, he has initiated the Virtual Institute – High Productivity Supercomputing, an international initiative of HPC programming-tool builders aimed at enhancing, integrating, and deploying their products. He has published over 150 refereed articles on parallel computing, several of which have received awards.

Resumo: To understand the scaling behavior of HPC applications, developers often use performance models. A performance model is a formula that expresses a critical performance metric, such as runtime, as a function of one or more execution parameters, such as core count and input size. Performance models offer quick insights on a very high level of abstraction, including predictions of future behavior. Given the complexity of today’s applications, which often combine several sophisticated algorithms, creating performance models manually is extremely laborious. Empirical performance modeling, the process of learning such models from performance data, offers a convenient alternative but comes with its own set of challenges.  The two most prominent ones are noise and the cost of the experiments needed to generate the underlying data. In this talk, we will review the state of the art in empirical performance modeling and investigate how we can employ machine learning and other strategies to improve the quality and lower the cost of the resulting models.


Is There Room for HPC in Developing Countries?

Palestrante: Jairo Panetta (ITA/IEC)

Sala: Bento Prado

Horário: 13:00 - 14:00

Biografia Resumida: Jairo Panetta teaches and develops HPC scientific software at Brazil. He has worked on oil and gas, weather forecasting, and financial industries since 1986, both creating and educating HPC groups as well as developing HPC software. He teaches Parallel Processing graduate classes at ITA as a volunteer, after retirement. He holds a PhD in Computer Science from Purdue University.

Resumo: This talk summarizes policies, actors and institutions that contributed for the development of HPC in Brazil during the last 40 years. It visits activities at academia, professional societies, industries, federal and state governments related to such purpose. It emphasizes actions that could be useful for other development countries that are willing to invest in HPC


Minicurso 7: Architectural Simulation with gem5

Autores: Iago Caran Aquino, Lucas Wanner e Sandro Rigo, UNICAMP

Sala: Auditório 1 (BCo)

Horário: 14:00 - 15:45

Resumo: In this mini-course, we will introduce the gem5 simulator, with a focus on its RISC-VISA models. We will show how to configure and run the simulator, how to extract performance statistics, and how to extend the simulator with new custom instructions, using a matrix multiplication workload as an example.


WIC (S4) : Arquitetura e Aprendizado de Máquina

Chair: Matheus Alcântara Souza (PUC Minas)

Sala: Auditório 2 (BCo)

Horário: 14:00 - 15:45

Estudo de Redes Multiestágios em presença de Multicast

Caio Morais (UFV), Ricardo Ferreira (UFV), José Augusto Nacif (UFV)

Predição de Consumo Energético de Aplicações OpenMP em Máquinas Multi-core com Aprendizado de Máquina

Fellipe Queiroz (UFPA), Erick Vinicius Silva (UFPA), Thiago Rodrigues (UFPA), Marcos Amaris (UFPA), Luan Siqueira (UFPA)

Otimização de Hiperparâmetros de Redes Neurais guiadas pela Física em Problema Convectivo-Difusivo.

Ricardo Silva (UFJF), Jose Camata (UFJF)

Redução de Dimensionalidade para Árvores Aleatórias

Walter Bueno de Brito Neto (UFV), Olavo Silva (UFV), José Augusto Nacif (UFV), Ricardo Ferreira (UFV)


SSCAD (S7) : Linguagens, Compiladores e Ferramentas

Chair: Gerson Geraldo H. Cavalheiro (UFPel)

Sala: Bento Prado - Apresentações: 15 m e Perguntas: 5 m (ao todo 20 m por trabalho)

Horário: 14:00 - 15:45

Um estudo sobre bugs de concorrência em aplicações Go open-source

Alonso Fritz (UNIOESTE), Guilherme Galante (UNIOESTE), Marcio Oyamada (UNIOESTE)

Towards Just-In-Time Software Approximations

Lucas Reis (UNICAMP), Lucas Wanner (UNICAMP), Sandro Rigo (UNICAMP)

Multithread Approximation: A new OpenMP construct

João B. Oliveira (UTFPR), Rogério Gonçalves (UTFPR), João Fabrício Filho (UTFPR)

Análise de Desempenho e Consumo Energético de Aplicações Recursivas em Ambientes OpenMP, CUDA e CUDA-DP

Angelo Nogueira (UNIPAMPA), Arthur Lorenzon (UFRGS), Claudio Schepke (UNIPAMPA), Diego Kreutz (UNIPAMPA)


Encerramento

Sala: Bento Prado

Horário: 15:45 - 16:00