小编给大家分享一下Hive流量表如何规划,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!
create EXTERNAL table IF NOT EXISTS ext_clicklog (
cookieId string COMMENT 'cookieId Nginx服务器分配,示例:05dvOVC6Il6INhYABV6LAg==',
cate1 string COMMENT '一级表现分类,示例:房产',
cate2 string COMMENT '二级表现分类,示例:xx',
cate3 string COMMENT '三级表现分类,示例:xx',
area1 string COMMENT '一级表现地域:北京(城市)',
area2 string COMMENT '二级表现地域:区域',
area3 string COMMENT '三级表现地域:商圈',
pageType string COMMENT '一级页面类型list detail ect',
page string COMMENT '二级页面类型',
url string COMMENT '本次浏览行为的页面 url 地址',
trackTime string COMMENT '用户本次访问时间:2014-05-25 23:03:36',
userIp string COMMENT '用户本次访问IP地址;175.153.41.6',
loginUid string COMMENT '登录用户 ID',
referer string COMMENT 'referer URL:当前页面的来源URL',
fromtag string COMMENT 'fromtag 埋点名称',
trackURLMap map<string,String> COMMENT '可变长字段,一些自定义字段:,
platform string COMMENT '是哪个平台的日志:pc/m/app',
urlParamMap map<string,String> COMMENT 'url参数map'
) PARTITIONED BY (statDate STRING) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\001' COLLECTION ITEMS TERMINATED BY '\002' MAP KEYS TERMINATED BY '\003' LINES TERMINATED BY '\n' STORED AS TEXTFILE LOCATION '/DataWarehouse/ods/ClickLogTable'
以上是“Hive流量表如何规划”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注天达云行业资讯频道!