github

Messages by Date

2026/07/20 Re: [PR] feat: Range Partitioning FFI [datafusion] via GitHub
2026/07/20 Re: [PR] Add DataSource/FileSource proto hooks and FileScanConfig serde [datafusion] via GitHub
2026/07/20 Re: [PR] feat: Range Partitioning FFI [datafusion] via GitHub
2026/07/20 Re: [PR] feat: complete range repartition physical planning [datafusion] via GitHub
2026/07/20 Re: [I] Proto: migrate leaf plans EmptyExec + PlaceholderRowExec [datafusion] via GitHub
2026/07/20 Re: [I] [DISCUSSION] Future of Dynamic Filters Sync [datafusion] via GitHub
2026/07/20 Re: [PR] docs: refresh SF1000 benchmark results on 2x16-core AQE-on reference cluster [datafusion-ballista] via GitHub
2026/07/20 Re: [PR] docs: refresh SF1000 benchmark results on 2x16-core AQE-on reference cluster [datafusion-ballista] via GitHub
2026/07/20 Re: [PR] feat(physical-plan): `GroupColumn` support for `List` / `LargeList` [datafusion] via GitHub
2026/07/20 [PR] perf: improve splitting of the offset vector in `GroupColumn::take_n` implementations, adding a new helper fn [datafusion] via GitHub
2026/07/20 Re: [I] [DISCUSSION] Future of Dynamic Filters Sync [datafusion] via GitHub
2026/07/20 Re: [PR] perf: dedupe Iceberg residuals and delete files in native scan serde [datafusion-comet] via GitHub
2026/07/20 Re: [PR] fix: Capture global ORDER BY requirement under ScalarSubqueryExec root [datafusion] via GitHub
2026/07/20 Re: [PR] fix: Capture global ORDER BY requirement under ScalarSubqueryExec root [datafusion] via GitHub
2026/07/20 Re: [PR] perf: dedupe Iceberg residuals and delete files in native scan serde [datafusion-comet] via GitHub
2026/07/20 Re: [PR] fix: Capture global ORDER BY requirement under ScalarSubqueryExec root [datafusion] via GitHub
2026/07/20 Re: [PR] perf: dedupe Iceberg residuals and delete files in native scan serde [datafusion-comet] via GitHub
2026/07/20 Re: [PR] Preimage date trunc [datafusion] via GitHub
2026/07/20 [PR] docs: refresh SF1000 benchmark results on 2x16-core AQE-on reference cluster [datafusion-ballista] via GitHub
2026/07/20 [PR] refactor: unify shuffle configs under `spark.comet.shuffle.*` prefix [datafusion-comet] via GitHub
2026/07/20 Re: [PR] fix: Preserve metadata when a cross-join is swapped [datafusion] via GitHub
2026/07/20 Re: [PR] Preimage date trunc [datafusion] via GitHub
2026/07/20 Re: [PR] feat: add withAlternative alias mechanism for CometConf [datafusion-comet] via GitHub
2026/07/20 Re: [I] [DISCUSSION] Future of Dynamic Filters Sync [datafusion] via GitHub
2026/07/20 Re: [PR] chore: simplify SortPreservingMergeStream to be as textbook-like as possible [datafusion] via GitHub
2026/07/20 Re: [PR] chore: simplify SortPreservingMergeStream to be as textbook-like as possible [datafusion] via GitHub
2026/07/20 Re: [PR] Cap SortPreservingMerge statistics by fetch [datafusion] via GitHub
2026/07/20 Re: [PR] fix: Preserve metadata when a cross-join is swapped [datafusion] via GitHub
2026/07/20 Re: [I] [DISCUSSION] Future of Dynamic Filters Sync [datafusion] via GitHub
2026/07/20 Re: [PR] chore: simplify SortPreservingMergeStream to be as textbook-like as possible [datafusion] via GitHub
2026/07/20 Re: [PR] chore: simplify SortPreservingMergeStream to be as textbook-like as possible [datafusion] via GitHub
2026/07/20 Re: [PR] chore: simplify SortPreservingMergeStream to be as textbook-like as possible [datafusion] via GitHub
2026/07/20 Re: [PR] Cap SortPreservingMerge statistics by fetch [datafusion] via GitHub
2026/07/20 Re: [PR] fix: Preserve metadata when a cross-join is swapped [datafusion] via GitHub
2026/07/20 Re: [PR] IN LIST: add branchless filter for small primitive lists [datafusion] via GitHub
2026/07/20 Re: [PR] refactor: remove untested async columnar shuffle [datafusion-comet] via GitHub
2026/07/20 Re: [PR] perf: dedupe Iceberg delete files by index in native scan serde [datafusion-comet] via GitHub
2026/07/20 Re: [PR] feat(substrait): add extension table consumer hook [datafusion] via GitHub
2026/07/20 Re: [I] [DISCUSSION] Future of Dynamic Filters Sync [datafusion] via GitHub
2026/07/20 [I] PostgreSQL 18 generated virtual columns require STORED [datafusion-sqlparser-rs] via GitHub
2026/07/20 Re: [I] [DISCUSSION] Future of Dynamic Filters Sync [datafusion] via GitHub
2026/07/20 [PR] refactor: remove untested async columnar shuffle [datafusion-comet] via GitHub
2026/07/20 Re: [PR] Unwrap widening Date32 -> Date64 casts in comparison predicates [datafusion] via GitHub
2026/07/20 Re: [PR] feat: removed all instances of deprecated virtualtable values field [datafusion] via GitHub
2026/07/20 Re: [PR] bench: parquet scan with a table schema narrower than a nested column [datafusion] via GitHub
2026/07/20 Re: [I] [DISCUSSION] Future of Dynamic Filters Sync [datafusion] via GitHub
2026/07/20 Re: [I] [DISCUSSION] Future of Dynamic Filters Sync [datafusion] via GitHub
2026/07/20 Re: [PR] feat: add withAlternative alias mechanism for CometConf [datafusion-comet] via GitHub
2026/07/20 Re: [PR] Add blog: Optimizing for Almost Sorted Data: Sort Pushdown in Apache DataFusion [datafusion-site] via GitHub
2026/07/20 Re: [PR] TEST: check performance with sparse masks [datafusion] via GitHub
2026/07/20 Re: [PR] TEST: check performance with sparse masks [datafusion] via GitHub
2026/07/20 Re: [PR] bench: parquet scan with a table schema narrower than a nested column [datafusion] via GitHub
2026/07/20 Re: [PR] feat: add withAlternative alias mechanism for CometConf [datafusion-comet] via GitHub
2026/07/20 [I] Upstream Spark-compatible approx_count_distinct (HyperLogLogPlusPlus) to the datafusion-spark crate [datafusion-comet] via GitHub
2026/07/20 Re: [PR] perf: dedupe Iceberg delete files by index in native scan serde [datafusion-comet] via GitHub
2026/07/20 Re: [PR] Unwrap Date32 <-> Date64 casts in comparison predicates [datafusion] via GitHub
2026/07/20 Re: [PR] feat: complete range repartition physical planning [datafusion] via GitHub
2026/07/20 Re: [PR] fix: executor hanging on ctrl+c [datafusion-ballista] via GitHub
2026/07/20 Re: [I] executor hangs on `ctrl+c` [datafusion-ballista] via GitHub
2026/07/20 [PR] feat: spilling hash join operator (opt-in, inner joins) [datafusion-ballista] via GitHub
2026/07/20 Re: [PR] feat: make StatisticsRegistry the default operator-statistics path [datafusion] via GitHub
2026/07/20 Re: [PR] feat: make StatisticsRegistry the default operator-statistics path [datafusion] via GitHub
2026/07/20 Re: [PR] feat: complete range repartition physical planning [datafusion] via GitHub
2026/07/20 Re: [PR] feat: support co-partitioned range right-side equi hash joins [datafusion] via GitHub
2026/07/20 Re: [PR] TEST: check performance with sparse masks [datafusion] via GitHub
2026/07/20 Re: [PR] TEST: check performance with sparse masks [datafusion] via GitHub
2026/07/20 Re: [PR] perf: dedupe Iceberg delete files by index in native scan serde [datafusion-comet] via GitHub
2026/07/20 Re: [PR] TEST: check performance with sparse masks [datafusion] via GitHub
2026/07/20 Re: [PR] TEST: check performance with sparse masks [datafusion] via GitHub
2026/07/20 Re: [PR] fix: unwrap identity Date cast in comparison unwrapping [datafusion] via GitHub
2026/07/20 Re: [PR] perf: dedupe Iceberg delete files by index in native scan serde [datafusion-comet] via GitHub
2026/07/20 Re: [PR] Remove the hash-partitioning shuffle writer [datafusion-ballista] via GitHub
2026/07/20 [PR] Unwrap Date32 <-> Date64 casts in comparison predicates [datafusion] via GitHub
2026/07/20 Re: [PR] perf: reuse quantile summary buffers during merge [datafusion-comet] via GitHub
2026/07/20 Re: [PR] TEST: check performance with sparse masks [datafusion] via GitHub
2026/07/20 Re: [PR] TEST: check performance with sparse masks [datafusion] via GitHub
2026/07/20 Re: [PR] TEST: check performance with sparse masks [datafusion] via GitHub
2026/07/20 Re: [PR] TEST: check performance with sparse masks [datafusion] via GitHub
2026/07/20 Re: [PR] TEST: check performance with sparse masks [datafusion] via GitHub
2026/07/20 Re: [PR] TEST: check performance with sparse masks [datafusion] via GitHub
2026/07/20 [PR] TEST: check performance with sparse masks [datafusion] via GitHub
2026/07/20 Re: [PR] chore: remove dead Parquet parallel-IO configs [datafusion-comet] via GitHub
2026/07/20 Re: [PR] chore: remove dead Parquet parallel-IO configs [datafusion-comet] via GitHub
2026/07/20 Re: [PR] chore: remove dead Parquet parallel-IO configs [datafusion-comet] via GitHub
2026/07/20 Re: [I] Register CometArrowAllocator as a Spark MemoryConsumer for JVM-UDF dispatch [datafusion-comet] via GitHub
2026/07/20 Re: [PR] feat: support co-partitioned range right-side equi hash joins [datafusion] via GitHub
2026/07/20 [PR] fix: unwrap identity Date cast in comparison unwrapping [datafusion] via GitHub
2026/07/20 Re: [I] Support dynamic filters for range co-partitioned joins [datafusion] via GitHub
2026/07/20 Re: [PR] perf: dedupe Iceberg delete files by index in native scan serde [datafusion-comet] via GitHub
2026/07/20 Re: [PR] feat: support co-partitioned range right-side equi hash joins [datafusion] via GitHub
2026/07/20 Re: [PR] feat: support pushdown-aware dynamic filter [datafusion] via GitHub
2026/07/20 Re: [PR] perf: dedupe Iceberg delete files by index in native scan serde [datafusion-comet] via GitHub
2026/07/20 Re: [PR] fix: skip dynamic filter pushdown for null-aware anti joins with a nullable build key [datafusion] via GitHub
2026/07/20 [PR] fix: executor hanging on ctrl+c [datafusion-ballista] via GitHub
2026/07/20 Re: [PR] perf: dedupe Iceberg delete files by index in native scan serde [datafusion-comet] via GitHub
2026/07/20 Re: [I] Implement TimeType support - Time extraction (from TimeType to Int/Decimal) [datafusion-comet] via GitHub
2026/07/20 [I] Implement TimeType support - Time extraction (from TimeType to Int/Decimal) [datafusion-comet] via GitHub
2026/07/20 Re: [PR] feat: support co-partitioned range right-side equi hash joins [datafusion] via GitHub
2026/07/20 [PR] perf: dedupe Iceberg delete files by index in native scan serde [datafusion-comet] via GitHub
2026/07/20 [PR] chore(join): refactor `BitwiseSortMergeJoinStream` to use generators instead of manual state [datafusion] via GitHub
2026/07/20 Re: [PR] Reuse hash values during Aggregate(partial) -> Repartition -> Aggregate(final) [datafusion] via GitHub
2026/07/20 Re: [PR] Improvement: keep order-preserving repartitions for streaming aggregates [datafusion] via GitHub
2026/07/20 Re: [PR] Improvement: keep order-preserving repartitions for streaming aggregates [datafusion] via GitHub
2026/07/20 [PR] chore: remove dead Parquet parallel-IO configs [datafusion-comet] via GitHub
2026/07/20 Re: [PR] fix: skip dynamic filter pushdown for null-aware anti joins with a nullable build key [datafusion] via GitHub
2026/07/20 Re: [PR] Remove the hash-partitioning shuffle writer [datafusion-ballista] via GitHub
2026/07/20 Re: [I] (Informational) AI driven performance analysis of scan implementation across plain Spark, Velox, and Comet [datafusion-comet] via GitHub
2026/07/20 Re: [PR] fix: avoid panic in array_position start_from near i64::MIN [datafusion] via GitHub
2026/07/20 Re: [I] Spark 4.2: native Iceberg REST catalog scan test fails under Comet [datafusion-comet] via GitHub
2026/07/20 Re: [PR] Add blog: Optimizing for Almost Sorted Data: Sort Pushdown in Apache DataFusion [datafusion-site] via GitHub
2026/07/20 Re: [PR] Add blog: Optimizing for Almost Sorted Data: Sort Pushdown in Apache DataFusion [datafusion-site] via GitHub
2026/07/20 Re: [I] Native implementation of `get_json_object` returns last value for duplicate keys, Spark returns first [datafusion-comet] via GitHub
2026/07/20 Re: [I] cast string to boolean: trim ISO control bytes to match Spark's UTF8String.trimAll [datafusion-comet] via GitHub
2026/07/20 Re: [I] Spark format_string ignores parentheses flag for negative decimals [datafusion] via GitHub
2026/07/20 Re: [PR] Add optional native Lance scan support [datafusion-comet] via GitHub
2026/07/20 Re: [PR] Remove the hash-partitioning shuffle writer [datafusion-ballista] via GitHub
2026/07/20 Re: [I] executor hangs on `ctrl+c` [datafusion-ballista] via GitHub
2026/07/20 Re: [PR] Remove the hash-partitioning shuffle writer [datafusion-ballista] via GitHub
2026/07/20 Re: [PR] POC hash aggregate repartition subpartitions [datafusion] via GitHub
2026/07/20 Re: [PR] feat(benchmarks): persist TPC-H results resiliently and add a compare subcommand [datafusion-ballista] via GitHub
2026/07/20 Re: [PR] feat(benchmarks): persist TPC-H results resiliently and add a compare subcommand [datafusion-ballista] via GitHub
2026/07/20 Re: [I] Benchmarks: persist partial/failed TPC-H results and add a compare tool [datafusion-ballista] via GitHub
2026/07/20 Re: [PR] fix: avoid panic in array_position start_from near i64::MIN [datafusion] via GitHub
2026/07/20 Re: [PR] POC hash aggregate repartition subpartitions [datafusion] via GitHub
2026/07/20 Re: [PR] Remove the hash-partitioning shuffle writer [datafusion-ballista] via GitHub
2026/07/20 Re: [PR] POC hash aggregate repartition subpartitions [datafusion] via GitHub
2026/07/20 Re: [PR] POC hash aggregate repartition subpartitions [datafusion] via GitHub
2026/07/20 Re: [PR] feat: support pushdown-aware dynamic filter [datafusion] via GitHub
2026/07/20 Re: [PR] Js/benchmark 4 dynamic filtering alternatives [datafusion] via GitHub
2026/07/20 Re: [PR] feat: support pushdown-aware dynamic filter [datafusion] via GitHub
2026/07/20 Re: [PR] feat: removed all instances of deprecated virtualtable values field [datafusion] via GitHub
2026/07/20 [I] Bug triage results: 2026-07-20 [datafusion-comet] via GitHub
2026/07/20 Re: [PR] Added support for unpivot in Redshift with expression and bracketsless [datafusion-sqlparser-rs] via GitHub
2026/07/20 Re: [PR] Remove the hash-partitioning shuffle writer [datafusion-ballista] via GitHub
2026/07/20 Re: [PR] POC hash aggregate repartition subpartitions [datafusion] via GitHub
2026/07/20 Re: [PR] IN LIST: add branchless filter for small primitive lists [datafusion] via GitHub
2026/07/20 Re: [PR] feat: support pushdown-aware dynamic filter [datafusion] via GitHub
2026/07/20 Re: [PR] POC hash aggregate repartition subpartitions [datafusion] via GitHub
2026/07/20 Re: [PR] feat: add withAlternative alias mechanism for CometConf [datafusion-comet] via GitHub
2026/07/20 Re: [PR] Js/benchmark 4 dynamic filtering alternatives [datafusion] via GitHub
2026/07/20 Re: [PR] feat: support approx_count_distinct aggregate expression [datafusion-comet] via GitHub
2026/07/20 Re: [PR] Remove the hash-partitioning shuffle writer [datafusion-ballista] via GitHub
2026/07/20 Re: [PR] Remove the hash-partitioning shuffle writer [datafusion-ballista] via GitHub
2026/07/20 Re: [PR] feat(parquet): implement file commit protocol for native Parquet writes [datafusion-comet] via GitHub
2026/07/20 Re: [PR] feat: support pushdown-aware dynamic filter [datafusion] via GitHub
2026/07/20 Re: [PR] Js/benchmark 4 dynamic filtering alternatives [datafusion] via GitHub
2026/07/20 [PR] Js/benchmark 4 dynamic filtering alternatives [datafusion] via GitHub
2026/07/20 Re: [PR] feat: Range Partitioning FFI [datafusion] via GitHub
2026/07/20 Re: [I] scheduler logs quite noisy [datafusion-ballista] via GitHub
2026/07/20 Re: [PR] feat: support listagg / string_agg aggregate (Spark 4.0+) [datafusion-comet] via GitHub
2026/07/20 Re: [PR] chore(scheduler,executor): downgrade #2038 per-task traces to debug [datafusion-ballista] via GitHub
2026/07/20 Re: [PR] Remove the hash-partitioning shuffle writer [datafusion-ballista] via GitHub
2026/07/20 Re: [PR] POC hash aggregate repartition subpartitions [datafusion] via GitHub
2026/07/20 [PR] Remove the hash-partitioning shuffle writer [datafusion-ballista] via GitHub
2026/07/20 [PR] feat(substrait): add extension table consumer hook [datafusion] via GitHub
2026/07/20 Re: [PR] feat: support pushdown-aware dynamic filter [datafusion] via GitHub
2026/07/20 Re: [PR] feat: support pushdown-aware dynamic filter [datafusion] via GitHub
2026/07/20 Re: [PR] POC hash aggregate repartition subpartitions [datafusion] via GitHub
2026/07/20 Re: [I] scheduler logs quite noisy [datafusion-ballista] via GitHub
2026/07/20 [I] executor hangs on `ctrl+c` [datafusion-ballista] via GitHub
2026/07/20 [PR] feat: add withAlternative alias mechanism for CometConf [datafusion-comet] via GitHub
2026/07/20 [I] Config naming audit: rename inconsistent spark.comet.* keys before 1.0 [datafusion-comet] via GitHub
2026/07/20 [PR] chore(scheduler,executor): downgrade #2038 per-task traces to debug [datafusion-ballista] via GitHub
2026/07/20 Re: [PR] POC hash aggregate repartition subpartitions [datafusion] via GitHub
2026/07/20 Re: [I] scheduler logs quite noisy [datafusion-ballista] via GitHub
2026/07/20 Re: [I] scheduler logs quite noisy [datafusion-ballista] via GitHub
2026/07/20 [I] scheduler logs quite noisy [datafusion-ballista] via GitHub
2026/07/20 Re: [PR] feat: support pushdown-aware dynamic filter [datafusion] via GitHub
2026/07/20 [PR] docs: document Spark version adoption and support-lifetime policy [datafusion-comet] via GitHub
2026/07/20 Re: [PR] feat: Add SQL planner, physical planner, and TableProvider hook for MERGE INTO [datafusion] via GitHub
2026/07/20 Re: [PR] IN LIST: add branchless filter for small primitive lists [datafusion] via GitHub
2026/07/20 Re: [PR] IN LIST: add branchless filter for small primitive lists [datafusion] via GitHub
2026/07/20 Re: [I] panic: generate_series table function overflows when integer step passes i64::MAX [datafusion] via GitHub
2026/07/20 Re: [PR] feat: support pushdown-aware dynamic filter [datafusion] via GitHub
2026/07/20 [I] Benchmarks: persist partial/failed TPC-H results and add a compare tool [datafusion-ballista] via GitHub
2026/07/20 [PR] feat(benchmarks): persist TPC-H results resiliently and add a compare subcommand [datafusion-ballista] via GitHub
2026/07/20 Re: [PR] test: promote `try_to_date`/`try_to_timestamp` SQL tests to native coverage [datafusion-comet] via GitHub
2026/07/20 Re: [I] try_to_date / try_to_timestamp fall back to Spark even though to_date / to_timestamp are accelerated [datafusion-comet] via GitHub
2026/07/20 Re: [PR] perf: vectorize `spark_unscaled_value` (9x faster) [datafusion-comet] via GitHub
2026/07/20 Re: [PR] chore(ci): bump actions/setup-python from 6 to 7 [datafusion-ballista] via GitHub
2026/07/20 Re: [PR] Improvement: keep order-preserving repartitions for streaming aggregates [datafusion] via GitHub
2026/07/20 Re: [PR] chore(ci): bump taiki-e/install-action from 2.83.3 to 2.83.4 [datafusion-ballista] via GitHub
2026/07/20 Re: [PR] chore(deps): bump futures from 0.3.32 to 0.3.33 [datafusion-ballista] via GitHub
2026/07/20 Re: [PR] chore(deps): bump serde from 1.0.228 to 1.0.229 [datafusion-ballista] via GitHub
2026/07/20 Re: [I] Support Substrait exchange output for range repartitioning [datafusion] via GitHub
2026/07/20 Re: [PR] feat: Support Union type in approx_distinct [datafusion] via GitHub
2026/07/20 Re: [PR] feat: support pushdown-aware dynamic filter [datafusion] via GitHub
2026/07/20 Re: [PR] feat: Add SQL planner, physical planner, and TableProvider hook for MERGE INTO [datafusion] via GitHub
2026/07/20 Re: [PR] feat: support pushdown-aware dynamic filter [datafusion] via GitHub
2026/07/20 Re: [PR] feat: Support Union type in approx_distinct [datafusion] via GitHub
2026/07/20 Re: [PR] chore(deps): bump async-trait from 0.1.89 to 0.1.91 [datafusion-ballista] via GitHub
2026/07/20 Re: [PR] feat: log sort shuffle spills at WARN, keep write completion at DEBUG [datafusion-ballista] via GitHub
2026/07/20 Re: [PR] feat: Support Union type in approx_distinct [datafusion] via GitHub
2026/07/20 Re: [PR] feat: Store only the last row in the previous cursor for round robin tie-breaking purposes [datafusion] via GitHub
2026/07/20 Re: [PR] fix: reduce peak memory usage when round robin tiebreaker is disabled [datafusion] via GitHub
2026/07/20 Re: [PR] perf: reuse input null buffer and add no-nulls fast path in Spark `hex` [datafusion] via GitHub
2026/07/20 Re: [PR] feat: support pushdown-aware dynamic filter [datafusion] via GitHub
2026/07/20 Re: [PR] feat: native collect_list / array_agg aggregate [datafusion-comet] via GitHub
2026/07/20 Re: [PR] `array_agg()` performance improvements [datafusion] via GitHub
2026/07/20 Re: [PR] Reuse hash values during Aggregate(partial) -> Repartition -> Aggregate(final) [datafusion] via GitHub