最近两周进展: 1. 完善了rocBLAS-4.1 的 ebuild,修复了若干问题,包括取消生成多余 GPU ISA 的 ASM code object、解决了 cmake-3.21 支持 HIP 语言导致的问题、规范 ebuild 书写,并将 rocBLAS-4.1 推入 science overlay,并打下了进入 ::gentoo 的基础。 2. review 了来自 fuga15 的 PR,在本地将 MIOpen bump 到 4.2,根据 fuga15 的提示去除了对 boost 的版本限制(上游仍仅支持 1.72) 3. 结合 fuga15 的 PR,将 pytorch 依赖的各个组件升级到 4.2 并修复了若干 bug,使之适应 gcc-11 与 glibc-2.33 4. 修复目前 broken 的 pytorch-1.9.0::science,并在本地测试了 pytorch-1.9.0 against rocm-4.2,表现良好。 5. 使 rocBLAS 支持 test 与 benchmark,并将 rocblas-test 链接到系统的 blas 库上。test 的原理是将 rocBLAS 在 GPU 上的运算结果与其它 BLAS 库进行比较,结果一致则 PASS。将 rocBLAS 链接到系统库上,可以使用 eselect 来切换不同的 BLAS 库进行比对。RadeonVII 测试结果:对比 sci-libs/blis-0.6.0,11 项 nightly 测试集 FAIL,对比 sci-libs/openblas-0.3.17 8 项 pre_checkin FAIL;总共有 1513020 被执行,另有 5232 多设备测试集被跳过。另外,还测试了 rocBLAS-4.2,新引入含 79004 项的 known_bug 测试集, 56052 FAIL。
在中期之前(本周末),计划将 rocm-4.2 与 pytorch-1.9.0的 ebuild 提交 PR 到上游。 中期之后,按计划展开 TensorFlow、cupy 等软件的部署。 -- 您收到此邮件是因为您订阅了 Google 网上论坛的“TUNA 主邮件列表”群组。 要退订此群组并停止接收此群组的电子邮件,请发送电子邮件到tuna-general+unsubscr...@googlegroups.com。 要在网络上查看此讨论,请访问 https://groups.google.com/d/msgid/tuna-general/CALxt-nTo3OELjF4QoONPkKKLwYh6A-4Bf_qnRuVu%2BRVGKC3ZrA%40mail.gmail.com。