Hi, have you queried with "select count(*) from {fact_table}" both in hive and
kylin, and please check they have the same result.
I doubt the segments you have built do not include all your hive data.
Best regards,
Chun’en Ni(George)
----- 原始邮件 -----
发件人: [email protected]
收件人: dev <[email protected]>
已发送邮件: Thu, 15 Nov 2018 17:43:31 +0800 (CST)
主题: 大神,求助kylin的使用问题
大神们好!
请容我慢慢描述我的问题
在kylin使用中,我建立了一个model,暂且叫他 big_int_sum_model,Dimensions有11个,
Measures 有三个 分别是 求count, SUM, SUM, sum 是对 两个bigint字段求和,分别为 sum_4g 和sum_wifi
,用以统计4g总流量和wifi总流量
hive表中的数据有400万,在cube之后,可以从kylin查出数据。
但是出现了一个奇怪的现象:
从 hive表中统计的4g流量总数为 295763957458 ,但是kylin中统计出来的是89605527250,
hive表中统计的WIFI流量总数为 456897813426,但是kylin中统计出来的是164840037298。
各位大神,可以给点思考方向吗?
[email protected]