Hive Array数据处理-526互联

CREATE TABLE IF NOT EXISTS default.array_test(
id String COMMENT 'id',
name Array<String> COMMENT '名称'
) COMMENT 'array测试'
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' 
COLLECTION ITEMS TERMINATED BY ',' STORED AS TEXTFILE;

1 a,b
2 a,b
3 c,d
4 d,f
vim test.txt
hadoop fs -put test.txt /warehouse/tablespace/managed/hive/array_test;

0: jdbc:hive2://hadoop01:2181/default> select * from array_test;
+----------------+------------------+
| array_test.id | array_test.name |
+----------------+------------------+
| 1 | ["a","b"] |
| 2 | ["a","b"] |
| 3 | ["c","d"] |
| 4 | ["d","f"] |
+----------------+------------------+

0: jdbc:hive2://hadoop01:2181/default> select * from array_test where array_contains(name, 'c');
+----------------+------------------+
| array_test.id | array_test.name |
+----------------+------------------+
| 3 | ["c","d"] |
+----------------+------------------+

0: jdbc:hive2://hadoop01:2181/default> select id, aname from array_test lateral view explode(name) v as aname;
+-----+--------+
| id | aname |
+-----+--------+
| 1 | a |
| 1 | b |
| 2 | a |
| 2 | b |
| 3 | c |
| 3 | d |
| 4 | d |
| 4 | f |
+-----+--------+

0: jdbc:hive2://hadoop01:2181/default> select t.aname, count(1) from (
. . . . . . . . . . . . . . . . . . .> select id, aname from array_test lateral view explode(name) v as aname
. . . . . . . . . . . . . . . . . . .> ) as t group by t.aname；

+----------+------+
| t.aname | _c1 |
+----------+------+
| b | 2 |
| c | 1 |
| a | 2 |
| d | 2 |
| f | 1 |
+----------+------+