morningman commented on code in PR #2281: URL: https://github.com/apache/doris-website/pull/2281#discussion_r2037684478
########## i18n/zh-CN/docusaurus-plugin-content-docs/current/lakehouse/file-formats/text.md: ########## @@ -64,13 +64,24 @@ under the License. ## JSON -* Catalog +### Catalog - 支持读取 `org.apache.hive.hcatalog.data.JsonSerDe` 格式的 Hive 表。(3.0.4 版本支持) +- `org.apache.hive.hcatalog.data.JsonSerDe` 格式的 Hive 表(自3.0.4 版本支持) -* 导入 + 1. 支持普通类型和复杂类型。 + 2. 不支持 `timestamp.formats` SERDEPROPERTIES + +- `org.openx.data.jsonserde.JsonSerDe` 格式的 Hive 表(自3.0.6 版本支持) + + 1. 支持普通类型和复杂类型。 + 2. SERDEPROPERTIES: 只支持 `ignore.malformed.json` 且行为与该JsonSerDe一致, 其他 SERDEPROPERTIES 不生效。 + 3. 不支持`Using Arrays`(类似于Text/CSV, 将所有列的数据放一个数组中)。 + 4. 不支持Promoting a Scalar to an Array (提升标量返回一个的单元素数组)。 + 5. 可以通过`set read_hive_json_in_one_column = true`, 将一整行json数据都放到第一列中,要求第一列的数据类型为String. Review Comment: ```suggestion 5. 默认情况下,Doris 会正常识别表的 Schema。但因为某些特殊参数不支持,可能导致自动识别 Schema 失败。此时可以通过`set read_hive_json_in_one_column = true`, 将一整行json数据都放到第一列中,这样可以确保原始数据被完整读取,用户可以自行处理。该功能要求第一列的数据类型为String. ``` ########## i18n/zh-CN/docusaurus-plugin-content-docs/current/lakehouse/file-formats/text.md: ########## @@ -64,13 +64,24 @@ under the License. ## JSON -* Catalog +### Catalog - 支持读取 `org.apache.hive.hcatalog.data.JsonSerDe` 格式的 Hive 表。(3.0.4 版本支持) +- `org.apache.hive.hcatalog.data.JsonSerDe` 格式的 Hive 表(自3.0.4 版本支持) -* 导入 + 1. 支持普通类型和复杂类型。 + 2. 不支持 `timestamp.formats` SERDEPROPERTIES + +- `org.openx.data.jsonserde.JsonSerDe` 格式的 Hive 表(自3.0.6 版本支持) Review Comment: 这里可以加一个 org.openx.data.jsonserde.JsonSerDe 那个github的引用。 eg: 关于该类型的描述,可参阅:xxx ########## i18n/zh-CN/docusaurus-plugin-content-docs/current/lakehouse/file-formats/text.md: ########## @@ -64,13 +64,24 @@ under the License. ## JSON -* Catalog +### Catalog - 支持读取 `org.apache.hive.hcatalog.data.JsonSerDe` 格式的 Hive 表。(3.0.4 版本支持) +- `org.apache.hive.hcatalog.data.JsonSerDe` 格式的 Hive 表(自3.0.4 版本支持) -* 导入 + 1. 支持普通类型和复杂类型。 + 2. 不支持 `timestamp.formats` SERDEPROPERTIES + +- `org.openx.data.jsonserde.JsonSerDe` 格式的 Hive 表(自3.0.6 版本支持) + + 1. 支持普通类型和复杂类型。 + 2. SERDEPROPERTIES: 只支持 `ignore.malformed.json` 且行为与该JsonSerDe一致, 其他 SERDEPROPERTIES 不生效。 Review Comment: ```suggestion 2. SERDEPROPERTIES: 只支持 `ignore.malformed.json` 且行为与该 JsonSerDe 一致, 其他 SERDEPROPERTIES 不生效。 ``` -- This is an automated message from the Apache Git Service. To respond to the message, please log on to GitHub and use the URL above to go to the specific comment. To unsubscribe, e-mail: commits-unsubscr...@doris.apache.org For queries about this service, please contact Infrastructure at: us...@infra.apache.org --------------------------------------------------------------------- To unsubscribe, e-mail: commits-unsubscr...@doris.apache.org For additional commands, e-mail: commits-h...@doris.apache.org