行轉列和列轉行(重點)
行轉列(split + explode + laterview)
列轉行 ( concat_ws + collect_list/set )
Hive排名函數
row_number不并列不跳過: 1 2 3 4
dense_rank并列不跳過: 1 1 2 3
rank并列跳過: 1 1 3 4
Hive分析函數:Ntile
效果:
排序并分桶 ntile(3) over(partition by A order by B) => {1,2,3}->1,{4,5,6}->2,{7,8,9}->3 可用于取前50%數據統計、取中間三分之一統計等需求。