CUG2022 Proceedings

CUG2022 Proceedings

Overview | By Event Type | Author Index

Birds of a Feathers

CUG Program Committee

Networking/Social Event

Birds of a Feathers

Birds of a Feather

BoF 1A

Programming Environments, Applications, and Documentation (PEAD) Special Interest Group meeting

Chris Fuson (Oak Ridge National Laboratory), Ryan Ward and Bill Sparks (Hewlett Packard), Bilel Hadri (King Abdullah University of Science and Technology), Guilherme Peretti-Pezzi (Swiss National Supercomputing Centre), and Stephen Leak (Lawrence Berkeley National Laboratory/National Energy Research Scientific Computing Center)

Birds of a Feather

BoF 2A

Future Directions for HPE’s Cray Programming Environment

Barbara Chapman and Nicolas Dube (HPE)

HPC Support Documentation Management and Best Practices

Chris Fuson (Oak Ridge National Laboratory), Victor Holanda (Swiss National Supercomputing Centre), Bilel Hadri (King Abdullah University of Science and Technology), Sanchez Peggy (Hewlett Packard), and Stephen Leak (Lawrence Berkeley National Laboratory/National Energy Research Scientific Computing Center)

Birds of a Feather

BoF 3A

HPE Performance Cluster Manager (HPCM) Update

Jeff Hanson (Hewlett Packard)

Birds of a Feather

BoF 3B

OpenACC Users Experience

Jeff Larkin (NVIDIA); Barbara Chapman (HPE, Stonybrook University); Will Sawyer (CSCS); and Jack Wells (NVIDIA)

Birds of a Feather

BoF 3C

The future of HPC: Data Movement and Workflows Orchestration

Sharda Krishna (Hewlett Packard Enterprise)

Birds of a Feather

BoF 4C

Future of Containers on Compute Nodes

Ron Neyland (Hewlett Packard Enterprise)

Board

Board

CUG Board Meeting (closed)

Breaks

Break

Coffee Break

Break

Coffee Break (sponsored by DDN)

Break

Coffee Break (sponsored by SchedMD)

Break

Coffee Break (sponsored by Altair)

Break

Coffee Break (sponsored by Spectra)

Break

Coffee Break (sponsored by Arm)

Break

Coffee Break

Break

Coffee Break (sponsored by OpenACC)

Break

Coffee Break

CUG Business

CUG Business

XTreme (Approved NDA Members Only)

CUG Business, CUG Program Committee

CUG Advisory Council Meeting

New Site, Vendor, CUG Business, CUG Program Committee

Plenary: CUG Business, new sites

Chair: Kevin Stroup (Sandia National Laboratories); Trey Breckenridge (Mississippi State University); Jim Rogers (Oak Ridge National Laboratory); Scott Michael (Indiana University)

CUG Business

CINES, French national supercomuting center

Gabriel Hautreux (CINES)

Achieving Energy Efficiency in Long-Term Storage

Matt Ninesling (Spectra Logic)

CSC Finland re-enters CUG with LUMI

Pekka Manninen (CSC - IT Center for Science Ltd.)

Altair: Multi-dimensional HPC for Breakthrough Results

Branden Bauer (Altair Engineering, Inc.)

GDIT’s High Performance Computing in Support of NOAA

Alan Powers (General Dynamics Information Technology)

Supercomputing at Microsoft

Mike Kiernan (Microsoft)

Update on Arm in HPC

Brent Gorda (Arm)

New CUG Site: Engineering Research Development Center DoD Supercomputing Resource Center

George Moncrief (ERDC DSRC)

New Site: AFW & ORNL HPC collaboration

David Hladky (AF LCMC, STI Tech)

Nvidia

Timothy Costa (NVIDIA)

CUG Business, Vendor, Invited Talk

Plenary: CUG Elections, Keynote

CUG Elections

Machine Learning for Fundamental Physics

Benjamin Nachman (Lawrence Berkeley National Laboratory)

AMD advantage for advancing HPC performance

Siddhartha Karkare (AMD)

CUG Business, CUG Program Committee

CUG Advisory Council Debrief

CUG Business

CUG 2022 Conference close

CUG Close

CUG Program Committee

CUG Business, CUG Program Committee

CUG Advisory Council Meeting

New Site, Vendor, CUG Business, CUG Program Committee

Plenary: CUG Business, new sites

Chair: Kevin Stroup (Sandia National Laboratories); Trey Breckenridge (Mississippi State University); Jim Rogers (Oak Ridge National Laboratory); Scott Michael (Indiana University)

CUG Business

CINES, French national supercomuting center

Gabriel Hautreux (CINES)

Achieving Energy Efficiency in Long-Term Storage

Matt Ninesling (Spectra Logic)

CSC Finland re-enters CUG with LUMI

Pekka Manninen (CSC - IT Center for Science Ltd.)

Altair: Multi-dimensional HPC for Breakthrough Results

Branden Bauer (Altair Engineering, Inc.)

GDIT’s High Performance Computing in Support of NOAA

Alan Powers (General Dynamics Information Technology)

Supercomputing at Microsoft

Mike Kiernan (Microsoft)

Update on Arm in HPC

Brent Gorda (Arm)

New CUG Site: Engineering Research Development Center DoD Supercomputing Resource Center

George Moncrief (ERDC DSRC)

New Site: AFW & ORNL HPC collaboration

David Hladky (AF LCMC, STI Tech)

Nvidia

Timothy Costa (NVIDIA)

CUG Business, CUG Program Committee

CUG Advisory Council Debrief

Invited Talks

Vendor, Invited Talk

Plenary: Welcome, Keynote

Chair: Kevin Stroup (Sandia National Laboratories); Jim Rogers (Oak Ridge National Laboratory); Trey Breckenridge (Mississippi State University)

CUG Welcome

The Landscape of Stellar Death

Anna Ho (UC Berkeley, LBNL)

The Path to Zetta Scale

Wilfred Gomes and Thomas Krueger (Intel Corporation)

CUG Business, Vendor, Invited Talk

Plenary: CUG Elections, Keynote

CUG Elections

Machine Learning for Fundamental Physics

Benjamin Nachman (Lawrence Berkeley National Laboratory)

AMD advantage for advancing HPC performance

Siddhartha Karkare (AMD)

Vendor, Invited Talk

Plenary: HPE Update

Vendor, Presentation, Invited Talk

Plenary: Best Paper

Storage Optimizations for the Research Data Lifecycle

Greg Mason (DDN)

Slurm

Danny Auble (SchedMD)

From Planning to Performance: OpenACC Roadmap

Jack Wells (NVIDIA, OpenACC)

BAE Systems New Site Talk

Scott Grabow (BAE Systems)

Lunches

Lunch

CUG board/ New Sites lunch (closed)

Lunch

Lunch (sponsored by NVIDIA)

Lunch

Allyship in HPC presented by Women in HPC (open to all)

Lunch

Lunch (sponsored by NVIDIA)

Lunch

HPE/ CUG Exec (closed)

Lunch

Lunch (sponsored by AMD)

Lunch

CUG board transition (closed)

Lunch

Lunch (sponsored by Intel)

Networking/Social Event

Networking/Social Event

HPE/ Cray Networking Event

New Sites

New Site, Vendor, CUG Business, CUG Program Committee

Plenary: CUG Business, new sites

Chair: Kevin Stroup (Sandia National Laboratories); Trey Breckenridge (Mississippi State University); Jim Rogers (Oak Ridge National Laboratory); Scott Michael (Indiana University)

CUG Business

CINES, French national supercomuting center

Gabriel Hautreux (CINES)

Achieving Energy Efficiency in Long-Term Storage

Matt Ninesling (Spectra Logic)

CSC Finland re-enters CUG with LUMI

Pekka Manninen (CSC - IT Center for Science Ltd.)

Altair: Multi-dimensional HPC for Breakthrough Results

Branden Bauer (Altair Engineering, Inc.)

GDIT’s High Performance Computing in Support of NOAA

Alan Powers (General Dynamics Information Technology)

Supercomputing at Microsoft

Mike Kiernan (Microsoft)

Update on Arm in HPC

Brent Gorda (Arm)

New CUG Site: Engineering Research Development Center DoD Supercomputing Resource Center

George Moncrief (ERDC DSRC)

New Site: AFW & ORNL HPC collaboration

David Hladky (AF LCMC, STI Tech)

Nvidia

Timothy Costa (NVIDIA)

Presentations

Presentation

Technical Session 0A

NVIDIA HPC SDK Update

Jeff Larkin (NVIDIA)

Presentation

Technical Session 1A

Chair: Jim Williams (Los Alamos National Laboratory)

HPE Cray EX Shasta 22.03 Cray System Management Overview

Harold Longley (Hewlett Packard Enterprise)

Augmenting HPCM System Management with Phoenix

Matthew Ezell (Oak Ridge National Laboratory)

UAIs Come of Age: Hosting Multiple Custom Interactive Login Experiences Without Dedicated Hardware

Best Paper

Eric Lund (Hewlett Packard Enterprise)

Presentation

Technical Session 1B

Chair: G. Todd Gamblin (Lawrence Livermore National Laboratory, LLNL)

Parallel Programming with Standard C++ and Fortran

Jeff Larkin (NVIDIA)

Open Approaches to Heterogeneous Programming are Key for Surviving the New Golden Age of Computer Architecture

James Reinders, James Brodman, and John Pennycook (Intel Corporation)

Presentation

Technical Session 1C

Chair: Tina Declerck (National Energy Research Scientific Computing Center/Lawrence Berkeley National Laboratory)

Slingshot Launched into Network Space

Gregory Faanes and Marten Terpstra (HPE); Jesse Treger (HPE, HPC); and Duncan Roweth (HPE)

Software Changes to Enable Slingshot Support on HPE Systems

Michael Raymond (Hewlett Packard)

Slingshot Fabric Manager Monitor

John Stile (Lawrence Berkeley National Laboratory/National Energy Research Scientific Computing Center)

Presentation

Technical Session 2A

Chair: Chris Fuson (ORNL, Oak Ridge National Laboratory)

Adopting Standardized Container Runtimes in HPC

Aditi Gaur, Richard Shane Canon, Laurie Stephey, Douglas Jacobsen, and Daniel Fulton (Lawrence Berkeley National Laboratory/National Energy Research Scientific Computing Center)

Performance-Aware Build System for HPC and AI Containers

Paulo Souza, Gallig Renaud, Jonathan Sparks, and Maxim Alt (HPE)

Evaluating Integration and Performance of Containerized Climate Applications on a HPE Cray System

Subil Abraham and Ryan Prout (Oak Ridge National Laboratory); Thomas Robinson, Christopher Blanton, and Luis Sal-bey (National Oceanic and Atmospheric Administration); and Matthew Davis (Oak Ridge National Laboratory)

Presentation

Technical Session 2B

Chair: Stephen Leak (National Energy Research Scientific Computing Center/Lawrence Berkeley National Laboratory, Lawrence Berkeley National Laboratory)

OpenFAM: Programming Disaggregated Memory

Singhal Sharad, Clarete Riana Crasta, Mashood K. Abdulla, Faizan Barmawer, Gautham Bhat, Ahobala Ramya Rao, Soumya P N, and Rishikesh Rajak (Hewlett Packard Enterprise)

Extending Chapel to Support Fabric Attached Memory

Amitha C, Bradford Chamberlain, Sharad Singhal, and Clarete Riana Crasta (Hewlett Packard Enterprise)

Improving a High Productivity Data Analytics Chapel Framework

Prashanth Pai (Rice University), Andrej Jakovljević (University of Belgrade), Zoran Budimlić (Rice University), and Costin Iancu (Lawrence Berkeley National Laboratory)

Presentation

Technical Session 2C

Chair: Bilel Hadri (KAUST Supercomputing Lab)

Crossroads - NNSA's Third Advanced Technology System

James W. Lujan (Los Alamos National Laboratory), James H. Laros III and Simond D. Hammond (Sandia National Laboratories), and Howard P. Pritchard Jr. (Los Alamos National Laboratory)

Ookami – an Apollo 80 testbed system

Eva Siegmann and Robert Harrison (Stony Brook University)

Liquid Cooling for HPC, Enterprise and Beyond: How HPE Thinks of Energy Efficiency Across the Portfolio

Wade Vinson, Jason Zeiler, and Matt Slaby (HPE)

Vendor, Presentation, Invited Talk

Plenary: Best Paper

Storage Optimizations for the Research Data Lifecycle

Greg Mason (DDN)

Slurm

Danny Auble (SchedMD)

From Planning to Performance: OpenACC Roadmap

Jack Wells (NVIDIA, OpenACC)

BAE Systems New Site Talk

Scott Grabow (BAE Systems)

Presentation

Technical Session 3A

Chair: Tina Declerck (National Energy Research Scientific Computing Center/Lawrence Berkeley National Laboratory)

Deploying Cray EX Systems with CSM at LANL

Alden Stradling, Steven Johnson, and Graham Van Heule (Los Alamos National Laboratory)

Configuring and Managing The Perlmutter Supercomputer: Lessons Learned and Best Practices Developed During Deployment and Operations

Douglas Jacobsen, Aditi Gaur, Brian Friesen, Chris Samuel, David Fox, Eric Roman, James Botts, and John Stile (Lawrence Berkeley National Laboratory/National Energy Research Scientific Computing Center) and Harold Longley (HPE)

Presentation

Technical Session 3B

Chair: Stephen Leak (National Energy Research Scientific Computing Center/Lawrence Berkeley National Laboratory, Lawrence Berkeley National Laboratory)

HPC Molecular Simulation Tries Out a New GPU: Experiences on Early AMD Test Systems for the Frontier Supercomputer

Ada Sedova and Russell Davidson (Oak Ridge National Laboratory), Mathieu Taillefumier (Swiss National Supercomputing Centre), and Wael Elwasif (Oak Ridge National Laboratory)

Presentation

Technical Session 3C

Chair: Chris Fuson (ORNL, Oak Ridge National Laboratory)

Using Loki for Simplifying the Usage of Shasta Logs

Siqi Deng (Lawrence Berkeley National Laboratory/National Energy Research Scientific Computing Center)

Presentation

Technical Session 4A

Chair: Ashley Barker (Oak Ridge National Laboratory)

Fallout: System Stand-up Monitoring and Analysis Package

Jim Brandt (Sandia National Laboratories), Mike Showerman (National Center for Supercomputing Applications/University of Illinois), Eric Roman (Lawrence Berkeley National Laboratory/National Energy Research Scientific Computing Center), Tom Tucker (Open Grid Computing), Joe Greenseid (Hewlett Packard Enterprise), and Ann Gentile (Sandia National Laboratories)

Crossroads: Status on Design, Deployment, Acceptance, and Operation

Anthony Agelastos and Kevin Stroup (Sandia National Laboratories) and Jennifer Green (Los Alamos National Laboratory)

Approaching the Final Frontier: Lessons Learned from the Deployment of HPE/Cray EX Spock and Crusher supercomputers

Veronica G. Vergara Larrea, Reuben Budiardja, Matt Davis, Matt Ezell, Jesse Hanley, Christopher Zimmer, Michael Brim, and Wael Elwasif (Oak Ridge National Laboratory)

Presentation

Technical Session 4B

Chair: Bilel Hadri (KAUST Supercomputing Lab)

Accelerating X-Ray Tracing for Exascale Systems using Kokkos

Felix Wittwer (Lawrence Berkeley National Laboratory/National Energy Research Scientific Computing Center); Nicholaus Sauter, Derek Mendez, Billy Poon, Aaron Brewster, and James Holton (Lawrence Berkeley National Laboratory); Michael Wall (Los Alamos National Laboratory); William Hart (Sandia National Laboratories); and Deborah Bard and Johannes Blaschke (Lawrence Berkeley National Laboratory/National Energy Research Scientific Computing Center)

Performance Analysis and Tuning on A64FX

Alan Calder, Tony Curtis, Catherine Feldman, Robert Harrison, and Eva Siegmann (Stony Brook University)

Presentation

Technical Session 4C

Chair: Stephen Leak (National Energy Research Scientific Computing Center/Lawrence Berkeley National Laboratory, Lawrence Berkeley National Laboratory)

Performance of Parallel IO on the 5860-node HPE Cray EX System ARCHER2

David Henty (EPCC, The University of Edinburgh)

Expanding data management services beyond traditional parallel file systems with HPE Data Management Framework

Kirill Malkin (HPE)

HPE Cray ClusterStor E1000 Performance Improvements and Results for Various Protocols

John Fragalla (Hewlett Packard)

Presentation

Technical Session 5A

Chair: Tina Declerck (National Energy Research Scientific Computing Center/Lawrence Berkeley National Laboratory)

Cluster Health Check Diagnostics Suite

Prasanth Kurian and Amarnath Chilumukuru (Hewlett Packard Enterprise)

Crayport to HPE DCE Migration: Bidirectional Incident Management for ServiceNow and HPE DCE

Daniel Gens, John Gann, and Elizabeth Bautista (Lawrence Berkeley National Laboratory/National Energy Research Scientific Computing Center)

Presentation

Technical Session 5B

Chair: Juan F R Herrera (EPCC, The University of Edinburgh)

Early experiences in supporting OpenSHMEM on HPE Slingshot NIC (Slingshot 11)

Naveen Namashivayam Ravichandrasekaran (HPE)

Performance of different routing protocols on HPE Cray EX: OpenFabrics and UCX

Michael Bareford, David Henty, William Lucas, and Andrew Turner (EPCC, The University of Edinburgh)

Effective use of MPI+OpenMP on an HPE Cray EX supercomputer

Holly Judge (EPCC, The University of Edinburgh)

Presentation

Technical Session 6A

Chair: Chris Fuson (ORNL, Oak Ridge National Laboratory)

Enabling Scientific AI at Scale on the Perlmutter System at NERSC

Wahid Bhimji, Steven Farrell, and Peter Harrington (Lawrence Berkeley National Laboratory)

Predicting batch queue job wait times for informed scheduling of urgent HPC workloads

Nick Brown (EPCC)

Presentation

Technical Session 6B

Chair: Tina Declerck (National Energy Research Scientific Computing Center/Lawrence Berkeley National Laboratory)

Network Integration of Perlmutter at NERSC

Ershaad A. Basheer, Eric Roman, and Tavia Stone Gibbins (Lawrence Berkeley National Laboratory/National Energy Research Scientific Computing Center); Christopher Samuel and Lisa Gerhardt (Lawrence Berkeley National Laboratory); Douglas M. Jacobsen (Lawrence Berkeley National Laboratory/National Energy Research Scientific Computing Center); and Ashwin Selvarajan, Damian Hazen, and Ronal Kumar (Lawrence Berkeley National Laboratory)

Automated service monitoring in the deployment of ARCHER2

Kieran Leach, Philip Cass, Steven Robson, and Eimantas Kazakevicius (EPCC/University of Edinburgh); Martin Lafferty (HPE); and Andrew Turner and Alan Simpson (EPCC/University of Edinburgh)

Tutorials

Tutorial

Tutorial 1A

Debugging and Performance Profiling on HPE Cray Supercomputers with AMD GPUs

Stephen Abbott, Constantinos Makrides, and Trey White (Hewlett Packard Enterprise)

Tutorial

Tutorial 1B

Cray System Management for HPE Cray EX Systems

Harold Longley (Hewlett Packard Enterprise)

Vendors

Vendor, Invited Talk

Plenary: Welcome, Keynote

Chair: Kevin Stroup (Sandia National Laboratories); Jim Rogers (Oak Ridge National Laboratory); Trey Breckenridge (Mississippi State University)

CUG Welcome

The Landscape of Stellar Death

Anna Ho (UC Berkeley, LBNL)

The Path to Zetta Scale

Wilfred Gomes and Thomas Krueger (Intel Corporation)

New Site, Vendor, CUG Business, CUG Program Committee

Plenary: CUG Business, new sites

Chair: Kevin Stroup (Sandia National Laboratories); Trey Breckenridge (Mississippi State University); Jim Rogers (Oak Ridge National Laboratory); Scott Michael (Indiana University)

CUG Business

CINES, French national supercomuting center

Gabriel Hautreux (CINES)

Achieving Energy Efficiency in Long-Term Storage

Matt Ninesling (Spectra Logic)

CSC Finland re-enters CUG with LUMI

Pekka Manninen (CSC - IT Center for Science Ltd.)

Altair: Multi-dimensional HPC for Breakthrough Results

Branden Bauer (Altair Engineering, Inc.)

GDIT’s High Performance Computing in Support of NOAA

Alan Powers (General Dynamics Information Technology)

Supercomputing at Microsoft

Mike Kiernan (Microsoft)

Update on Arm in HPC

Brent Gorda (Arm)

New CUG Site: Engineering Research Development Center DoD Supercomputing Resource Center

George Moncrief (ERDC DSRC)

New Site: AFW & ORNL HPC collaboration

David Hladky (AF LCMC, STI Tech)

Nvidia

Timothy Costa (NVIDIA)

CUG Business, Vendor, Invited Talk

Plenary: CUG Elections, Keynote

CUG Elections

Machine Learning for Fundamental Physics

Benjamin Nachman (Lawrence Berkeley National Laboratory)

AMD advantage for advancing HPC performance

Siddhartha Karkare (AMD)

Vendor, Invited Talk

Plenary: HPE Update

Vendor, Presentation, Invited Talk

Plenary: Best Paper

Storage Optimizations for the Research Data Lifecycle

Greg Mason (DDN)

Slurm

Danny Auble (SchedMD)

From Planning to Performance: OpenACC Roadmap

Jack Wells (NVIDIA, OpenACC)

BAE Systems New Site Talk

Scott Grabow (BAE Systems)

Created 2022-5-20 19:14