[tuna-general] OSPP2021 双周周报

2021-07-15 文章 yiy wu
项目名称:完善 Gentoo ROCm GPGPU 框架 两周以来项目进度: 1. 测试安装 gentoo portage 中 rocm-4.1 核心组件。 2. 安装过程中发现 rocr-runtime 在 gentoo prefix 下构建失败,报 bug ,提 PR 修复,目前正在等待审核。 3. 验证了 ROCm 文档中 4.1 版本以上与 GCN-7nm 卡的不兼容性

[tuna-general] [OSPP2021 -729 双周报] 完善 Gentoo ROCm GPGPU 框架

2021-07-29 文章 yiy wu
本周进展 1. 完成了 rocBLAS-4.1 的 ebuild,踩到了三个坑(cmake 版本问题 ,cmake 生成的 build.ninja 语法问题,TensileCreateLibrary 在 src_configure 阶段读取 LibraryLogic 生成 TensileManifest 后在编译阶段又花费大量 CPU 重新读取 LibraryLogic);完成了 rocBLAS bundle Tensile at build time. 还未推到上游。 2. 重新检查了 hip-4.2 中的 patch,去除了

[tuna-general] [OSPP2021 -812 双周报] 完善 Gentoo ROCm GPGPU 框架

2021-08-12 文章 yiy wu
最近两周进展: 1. 完善了rocBLAS-4.1 的 ebuild,修复了若干问题,包括取消生成多余 GPU ISA 的 ASM code object、解决了 cmake-3.21 支持 HIP 语言导致的问题、规范 ebuild 书写,并将 rocBLAS-4.1 推入 science overlay,并打下了进入 ::gentoo 的基础。 2. review 了来自 fuga15 的 PR,在本地将 MIOpen bump 到 4.2,根据 fuga15 的提示去除了对 boost 的版本限制(上游仍仅支持 1.72) 3. 结合 fuga15 的 PR,将 pytorch 依赖的

[tuna-general] [OSPP2021 -826 双周报] 完善 Gentoo ROCm GPGPU 框架

2021-08-28 文章 yiy wu
最近两周进展: 1. bump 了 ROCm 核心组件至 4.3(device library, runtime, llvm-roc, hip),并修复了 llvm-roc 的一个 bug 2. bump 了ROCm 大部分数学库的 4.3,并增加了测试与 benchmark USE flag 3. 向 Tensile 提交的 feature request 得到了实现,将其 commit 拉取为 patch 替代自己先前写的 hack 3. 在自己的机器(Radeon VII)上进行了 test,并将 FAIL 的测例开 issue 反应给上游。rocBLAS 表示是测例问题,将在未来修

[tuna-general] [OSPP2021 -916 双周报] 完善 Gentoo ROCm GPGPU 框架

2021-09-18 文章 yiy wu
最近一段时间由于暑期课程的缘故(both 我与 mentor),精力不足,没有太多进展。 1. 考察了 TensorFlow-rocm 编译,发现相关文档匮乏,且构建过程充斥魔法(比如将配置 rocm 的 python 脚本使用 zlib 压缩成一个文本文件,bazel 运行时生成一个 python 脚本,文本文件解压成另一个 python 脚本运行),由于精力有限,计划暂时搁置制作 tensorflow-rocm ebuild 的计划 2. 收到了上游对于 sci-libs/roc* 的 反馈,并进行了若干修改 3. 整到了一块 Radeon RX 6700XT (暂未在 sci-l