hive的相关学习1---wordCount实例

发布时间 2023-09-19 15:22:16作者: yesyes1

1、新建一个名为file1.txt的txt文件存储数据

2、在sss数据库中新创建一个名为docs的表

create table if not exists docs(line string);

3、将file1.txt的数据导入到新创建的docs表中

load data local inpath '/data/' overwrite into table docs;

4、编写sql语句实现wordCount算法

create table wordcount as
select word,count(1) as count from
(select explode(split(line,' ')) as word from docs) w
group by word
order by word;

其中,
explode()函数------代表为数据打散,即将一行数据才分为多行;

上面的第三行语句则表示为------根据空格字符将各个字符且存储为多行字符;

而w代表------他只是作为数据分析过程中的一个临时表(不要误认为为写入操作);

然后直接执行,等待程序运行完成即可:

它说它运行成功了:

查看运行结果: