ワークショップ「アプリ開発者のためのアクセラレータプログラミング最新情報」

開催情報

開催形式：現地とZoomによるオンラインのハイブリッド開催
開催日付：2026年3月11日（水） 10:00–17:15
現地会場：東京大学柏キャンパス第2総合研究棟 3階 315会議室
共催：東京大学情報基盤センター
現地定員：70名
参加費：無料（要参加登録：こちらから）
懇親会：有料（開催後、「お魚倶楽部はま」にて、費用実費6000円程度予定）

開催主旨

富岳NEXTのアクセラレータがNVIDIA社製GPUに決まりましたが、HPC関連のアクセラレータを取り巻くプログラミング環境についてはどうでしょうか？本ワークショップでは最新のアクセラレータ向けプログラミング環境について専門家の方々にご登壇いただき、各プログラミング環境の現状と課題を事例を含めて語っていただきます。
WSに参加して議論していただくことにより、アクセラレータ向けのプログラミング環境やアクセラレータへのアプリケーション移行について、最新の状況や課題について理解が進むことが期待できます。

プログラム

10:00 - 10:15 Opening
10:15 - 11:15 Julia & Kokkosによるプログラミング環境
- 10:15 - 10:45 永井佑紀（東京大学）「Juliaによる4次元格子量子色力学：JuliaQCDプロジェクト」配付資料
  - JuliaQCDは、Julia言語を用いて開発された格子量子色力学（Lattice QCD）のための高性能計算フレームワークである。本フレームワークは、高水準言語による記述性とネイティブに近い実行性能の両立を目的とし、CPU上でのMPI並列計算に加え、JACCを介したGPUアクセラレーションにも対応する。移植性を重視した設計により、多様な計算機アーキテクチャ上での大規模シミュレーションを可能とする。ベンチマーク結果からは、CPUにおける高い並列効率とGPUによる顕著な高速化が確認されており、JuliaQCDは次世代の格子QCD計算基盤として有望である。
- 10:45 - 11:15 似鳥啓吾（R-CCS）「並列計算フレームワークKokkosによるマルチプラットフォームGPU開発」配付資料
  - Kokkosは米国エネルギー省（DOE）系列の国立研究所に発祥を持つ、性能移植性（performance portability）を目的としたオープンソースのC++ライブラリ群である。ユーザーは単一のベンダングートラルHPCソースコードから、OpenMPやAMD/NVIDIA GPUっといった複数プラットフォームのGPUに対応した実行ファイルを生成できる。本公演ではKokkosの導入にあたって特に苦労したCMAKEの話を中心に、格子QCDベンチマーク移植の体験を紹介する。
11:15 - 12:30 昼休憩（学内の食堂などをご利用ください）
12:30 - 15:30 標準言語・変換ライブラリによるプログラミング環境
- 12:30 - 13:00 五十木秀一（NVIDIA）「NVIDIA GPU開発環境におけるアクセラレータプログラミング」配付資料
  - NVIDIA GPUを用いたHPC向けアクセラレータプログラミングに焦点を当てプログラミング手法を解説します。GPUの基本概念を踏まえた上で、標準C++並列アルゴリズム（stdpar）やOpenACCによる高レベルGPUプログラミングを中心に、既存CPUコードを活かしたGPUオフロード手法を具体例とともに紹介します。
- 13:00 - 13:30 野村昴太郎（PFN）「MN-Core HPCSDKのご紹介」配付資料
  - Preferred Networksが開発しているAIアクセラレータMN-Core上でAI以外のHPCアプリケーションを動かすための開発環境MN-Core HPCSDKについて解説します。最初にMN-Coreアーキテクチャの概要について述べ、HPCSDKに含まれるOpenCLライクにC++でカーネルを記述することができるMNCLとOpenACCのようにディレクティブベースでカーネルを記述できるMNACCを紹介します。また、開発中の数値計算ライブラリなどについても一部紹介します。
- 13:30 - 14:00 JongJye Sheen（AMD）「AMD Instinct GPU solution for AI and HPC」
  - A briefing to share AMD Instinct GPU product which has been adopted by WW CSP and Large HPC Center for both AI and HPC workload. The AMD software development environment "ROCm" running on Instinct GPU will be shared, and the recently addon Enterprise AI stack will be presented which provide management and monitoring features to manage GPU Cluster.
- 14:00 - 14:30 藤田典久（筑波大学）「可搬性を重視したアクセラレータプログラミング」
  - 筑波大学計算科学研究センターでは，NVIDIA GPUを搭載したスパコン「Pegasus」「Miyabi-G」およびAMD GPUを搭載したスパコン「Sirius（PACS 12.0）」の運用を行っている．これら異なるGPUアーキテクチャが混在する環境においては，NVIDIAおよびAMDの双方で実行可能な，高い性能可搬性を備えたアプリケーションの実現が強く求められている．本発表では，NVIDIA GH200およびAMD MI300Aを対象に，CUDA，HIP，OpenACC，OpenMP，Kokkosに基づく実装の性能および可搬性を評価した結果を示す．さらに，同センターにおいて研究開発を進めている，複数の演算加速装置を統一的に扱うことを可能とする開発環境「UniSYCL」について紹介する．
- 14:30 - 15:00 三木洋平（東京大学）「GPU向け指示文統合マクロライブラリSolomon 」配付資料
  - GPUプログラミングにおいて，OpenACCやOpenMP targetといった指示文ベースのアプローチは広く用いられている．一方で両者には機能や資料の充実度合い，対応しているGPUベンダーにトレードオフがあり，ユーザーは実装開始時にどちらを採用するか決断を迫られる．本講演では，用いる指示文をコンパイル時のバックエンド選択として簡易に切り替えられるマクロライブラリSolomonを紹介する．NVIDIA GH200およびAMD MI300A上でのN体計算を例題とし，CUDA/HIP/SYCL/Kokkosとの性能比較，および指示文選択を「後出しじゃんけん」化できることの恩恵についても触れる．
15:00 - 15:15 休憩
15:15 - 17:00 パネルディスカッション
- モデレータ：村井均（R-CCS）
- パネリスト：講演者
- テーマ：アプリケーション開発言語(FORTRAN,C, C++ )からのアクセラレータ移行時のPros, Consと移行時のポイントは？書きやすさ、得意分野、ポータビリティー(異種間、性能)、汎用性、性能を対象に議論いただきます。
17:00 - 17:15 Closing
17:15 - Miyabi見学（希望者のみ）
18:00 - 懇親会