今日总结9.22

发布时间 2023-09-22 15:59:12作者: 庞司令

今天周五进行大数据可视化的课堂测试,测试内容如下:

1、数据导入:

要求将样表文件中的sales_sample_20170310数据导入HIVE数据仓库中。

步骤:

首先在创建文件要导入的hdfs的目录,我这里创建的是根目录data

 

 然后向根目录里上传.csv数据

 紧接着在DataGrip创建数据表

CREATE EXTERNAL TABLE IF NOT EXISTS test1(
day_id String,
sale_nbr String,
buy_nbr String,
cnt String,
round String
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' LINES TERMINATED BY '\n' STORED AS TEXTFILE;

将数据导入到数据库test1中

load data inpath '/data/sales_sample_20170310.csv' into table test1;

如果首行与列名称重复,则:

//去掉首行
alter table test1 set tblproperties('skip.header.line.count'='1');

导入结果如下: