Hi, have you queried with "select count(*) from {fact_table}" both in hive and 
kylin, and please check they have the same result. 

I doubt the segments you have built do not include all your hive data.

Best regards,
 
Chun’en Ni(George)

----- 原始邮件 -----
发件人: [email protected]
收件人: dev <[email protected]>
已发送邮件: Thu, 15 Nov 2018 17:43:31 +0800 (CST)
主题: 大神,求助kylin的使用问题

大神们好!

请容我慢慢描述我的问题
在kylin使用中,我建立了一个model,暂且叫他 big_int_sum_model,Dimensions有11个,
Measures 有三个 分别是 求count, SUM, SUM,  sum 是对 两个bigint字段求和,分别为 sum_4g 和sum_wifi 
,用以统计4g总流量和wifi总流量
hive表中的数据有400万,在cube之后,可以从kylin查出数据。
但是出现了一个奇怪的现象:
    从 hive表中统计的4g流量总数为 295763957458 ,但是kylin中统计出来的是89605527250,
        hive表中统计的WIFI流量总数为 456897813426,但是kylin中统计出来的是164840037298。

各位大神,可以给点思考方向吗?




[email protected]

Reply via email to