This is an automated email from the ASF dual-hosted git repository. weixiang pushed a commit to branch master in repository https://gitbox.apache.org/repos/asf/doris.git
The following commit(s) were added to refs/heads/master by this push: new 43dade0f68 [fix](doc): fix some spelling mistaks (#16097) 43dade0f68 is described below commit 43dade0f68399de14104d75530a2450eab70402f Author: ElvinWei <zhengte....@outlook.com> AuthorDate: Thu Jan 19 23:31:45 2023 +0800 [fix](doc): fix some spelling mistaks (#16097) --- .../docs/advanced/join-optimization/doris-join-optimization.md | 6 +++--- 1 file changed, 3 insertions(+), 3 deletions(-) diff --git a/docs/zh-CN/docs/advanced/join-optimization/doris-join-optimization.md b/docs/zh-CN/docs/advanced/join-optimization/doris-join-optimization.md index d454879bae..cf0755894c 100644 --- a/docs/zh-CN/docs/advanced/join-optimization/doris-join-optimization.md +++ b/docs/zh-CN/docs/advanced/join-optimization/doris-join-optimization.md @@ -86,7 +86,7 @@ Doris 支持 4 种 Shuffle 方式 | BroadCast | N * T(R) | Hash Join / Nest Loop Join | 通用 | | Shuffle | T(S) + T(R) | Hash Join | 通用 | | Bucket Shuffle | T(R) | Hash Join | Join条件中存在左表的分布式列,且左表执行时为单分区 | -| Colocate | 0 | Hash Join | Join条件中存在左表的分布式列,切左右表同属于一个Colocate Group | +| Colocate | 0 | Hash Join | Join条件中存在左表的分布式列,且左右表同属于一个Colocate Group | N : 参与 Join 计算的 Instance 个数 @@ -96,14 +96,14 @@ T(关系) : 关系的 Tuple 数目 ## Runtime Filter Join 优化 -Doris 在进行 Hash Join 计算时会在右表构建一个哈希表,左表流式的通过右表的哈希表从而得出 Join 结果。而 RuntimeFilter 就是充分利用了右表的 Hash 表,在右表生成哈希表的时,同时生成一个基于哈希表数据的一个过滤条件,然后下推到左表的数据扫描节点。通过这样的方式,Doris 可以在运行时进行数据过滤。 +Doris 在进行 Hash Join 计算时会在右表构建一个哈希表,左表流式的通过右表的哈希表从而得出 Join 结果。而 RuntimeFilter 就是充分利用了右表的 Hash 表,在右表生成哈希表的时候,同时生成一个基于哈希表数据的一个过滤条件,然后下推到左表的数据扫描节点。通过这样的方式,Doris 可以在运行时进行数据过滤。 假如左表是一张大表,右表是一张小表,那么利用右表生成的过滤条件就可以把绝大多数在 Join 层要过滤的数据在数据读取时就提前过滤,这样就能大幅度的提升 Join 查询的性能。 当前 Doris 支持三种类型 RuntimeFilter - 一种是 IN,很好理解,将一个 hashset 下推到数据扫描节点。 -- 第二种就是 BloomFilter,就是利用哈希表的数据构造一个 BloomFilter,然后把这个 BloomFilter 下推到查询数据的扫描节点。。 +- 第二种就是 BloomFilter,就是利用哈希表的数据构造一个 BloomFilter,然后把这个 BloomFilter 下推到查询数据的扫描节点。 - 最后一种就是 MinMax,就是个 Range 范围,通过右表数据确定 Range 范围之后,下推给数据扫描节点。 Runtime Filter 适用的场景有两个要求: --------------------------------------------------------------------- To unsubscribe, e-mail: commits-unsubscr...@doris.apache.org For additional commands, e-mail: commits-h...@doris.apache.org