Hive数据仓库的学习——DML学习

发布时间 2023-09-26 21:15:36作者: yesyes1

1、load加载

load语法:

2、Hive3.X新特性

能够使用load将文件数据存储到分区中,将分区默认作为表格数据的最后一列;

3、insert+select向表插入数据

这个语法就是在上次测试的时候遇到过的问题嘞!

insert+values这个语法执行效率就很慢,而换用insert+select之后效率就提升很多啦!

4、insert多重插入————multiple-insert

就举例说,原来是这样的:

insert table s1
select num from student;

insert table s2
select name from student;

现在改良成这样(使用多重插入):

from student
insert overerite table s1
select num
insert overwrite table s2
select name;

5、insert插入动态分区

开启动态分区,指定为非严格模式:

6、insert————实现导出数据

导出到文件:

insert overwrite directory '文件路径' select 字段名 from 基础表名;

//(指定分隔符————row format delimited fields terminated by ',')

导出到表:

insert overwrite table 表名 select 字段名 from 基础表名;