今天周五进行大数据可视化的课堂测试,测试内容如下:
1、数据导入:
要求将样表文件中的(sales_sample_20170310)数据导入HIVE数据仓库中。
步骤:
首先在创建文件要导入的hdfs的目录,我这里创建的是根目录data
然后向根目录里上传.csv数据
紧接着在DataGrip创建数据表
CREATE EXTERNAL TABLE IF NOT EXISTS test1(
day_id String,
sale_nbr String,
buy_nbr String,
cnt String,
round String
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' LINES TERMINATED BY '\n' STORED AS TEXTFILE;
将数据导入到数据库test1中
load data inpath '/data/sales_sample_20170310.csv' into table test1;
如果首行与列名称重复,则:
//去掉首行 alter table test1 set tblproperties('skip.header.line.count'='1');
导入结果如下: