[ https://issues.apache.org/jira/browse/HIVE-26222?page=com.atlassian.jira.plugin.system.issuetabpanels:all-tabpanel ]
Yukun Zhang updated HIVE-26222: ------------------------------- Description: 这是一个史诗般的 Jira,用于在 Hive 中原生支持 GeoSpatial 数据类型。这将满足对大量空间数据进行查询的应用程序的需求。这种支持将分阶段增加。首先,我们计划利用 ESRI [https://github.com/Esri/spatial-framework-for-hadoop |https://github.com/Esri/spatial-framework-for-hadoop).] 在 Apache 2.0 许可证上开发的框架。这个项目不是很活跃,也没有对 maven central 进行发布。因此,使用 pom 依赖项直接下载 jar 并不容易。此外,UDF 基于旧版本的 Hive。因此,我们决定复制此存储库,并在 Hive 中对其进行维护。这将使进行任何改进和管理依赖项变得更加容易。截至目前,数据加载仅在二进制数据类型上完成。我们需要增强这一点,使其更加用户友好。在下一阶段,将支持本机 Geometry/Geography 数据类型。用户可以直接创建几何类型并对其进行操作。除此之外,我们可以开始添加对不同索引的支持,如四边形树、R 树、ORC/Parquet/Iceberg 支持等。 (was: This is an epic Jira to support GeoSpatial datatypes natively in Hive. This will cater to the applications which queries on large volumes of spatial data. This support will be added in a phased manner. To start with, we are planning to make use of framework developed by ESRI [https://github.com/Esri/spatial-framework-for-hadoop |https://github.com/Esri/spatial-framework-for-hadoop).] on the Apache 2.0 license. This project is not very active and there is no release done to maven central. So its not easy to get the jars downloaded directly using pom dependency. Also the UDFs are based on older version of Hive. So we have decided to make a copy of this repo and maintained it inside Hive. This will make it easier to do any improvement and manage dependencies. As of now, the data loading is done only on a binary data type. We need to enhance this to make it more user friendly. In the next phase, a native Geometry/Geography datatype will be supported. User can directly create a geometry type and operate on it. Apart from these we can start adding support for different indices like quad tree, R-tree, ORC/Parquet/Iceberg support etc. ) > Native GeoSpatial Support in Hive > --------------------------------- > > Key: HIVE-26222 > URL: https://issues.apache.org/jira/browse/HIVE-26222 > Project: Hive > Issue Type: New Feature > Components: Hive, HiveServer2 > Reporter: mahesh kumar behera > Assignee: Ayush Saxena > Priority: Major > Fix For: 4.0.0 > > > 这是一个史诗般的 Jira,用于在 Hive 中原生支持 GeoSpatial > 数据类型。这将满足对大量空间数据进行查询的应用程序的需求。这种支持将分阶段增加。首先,我们计划利用 ESRI > [https://github.com/Esri/spatial-framework-for-hadoop > |https://github.com/Esri/spatial-framework-for-hadoop).] 在 Apache 2.0 > 许可证上开发的框架。这个项目不是很活跃,也没有对 maven central 进行发布。因此,使用 pom 依赖项直接下载 jar 并不容易。此外,UDF > 基于旧版本的 Hive。因此,我们决定复制此存储库,并在 Hive > 中对其进行维护。这将使进行任何改进和管理依赖项变得更加容易。截至目前,数据加载仅在二进制数据类型上完成。我们需要增强这一点,使其更加用户友好。在下一阶段,将支持本机 > Geometry/Geography 数据类型。用户可以直接创建几何类型并对其进行操作。除此之外,我们可以开始添加对不同索引的支持,如四边形树、R > 树、ORC/Parquet/Iceberg 支持等。 -- This message was sent by Atlassian Jira (v8.20.10#820010)