hadoop hbase hive

Hive学习4(ETL)

etl数据清洗:案例一 需求1:对字段为空的不合法数据进行过滤 Where过滤 需求2:通过时间字段构建天和小时字段 Substr函数 需求3:从GPS的经纬度中提取经度和维度 Split函数 需求4:将ETL以后的结果保存到一张新的Hive表中 Create table …… as select ......
Hive ETL

Hive数据仓库的学习——DML学习

1、load加载 load语法: 2、Hive3.X新特性 能够使用load将文件数据存储到分区中,将分区默认作为表格数据的最后一列; 3、insert+select向表插入数据 这个语法就是在上次测试的时候遇到过的问题嘞! insert+values这个语法执行效率就很慢,而换用insert+se ......
仓库 数据 Hive DML

Hive数据仓库的学习——DDL之内部表、外部表、分区表、分桶表

1、内部表和外部表 没有指定建表的类型的话,默认为内部表(Internal Table或者是Managed Table) 可以通过这行代码查看表的类型: describe formatted 表名; 内部表和外部表的区别以及适合使用的范围: 2、分区表--避免全表扫描,提高查询效率 需要注意的是,在 ......
仓库 数据 Hive DDL

Hive数据仓库的学习--DDL部分

1、建表语法 2、数据类型转换函数CAST--也就是强制转换 例如, CAST('100' AS INT) 3、有关于SerDe的描述 序列化和反序列化————用于从文件中读取和数据写入文件的操作(通俗来说,就是分辨分隔符,读取有效数据存储到数据库中); 4、rowformat 指定具体的分隔符是什 ......
仓库 部分 数据 Hive DDL

hive架构

Hive的架构原理及组成_hive架构_hunter95671的博客-CSDN博客 ......
架构 hive

hive考试总结

这次测试的流程主要分为五个步骤。 1、数据导入 2、数据清洗 3、数据分析处理 4、Sqoop导入Hive数据到MySQL 5、通过javaweb+echarts进行数据可视化 一、数据导入: 建表: create table sales_sample_20170310 ( `day_id` str ......
hive

hive string, map, struct类型的建表和导入数据语句

本文转载于 https://blog.51cto.com/u_14405/6419362,https://blog.csdn.net/tototuzuoquan/article/details/115493697 和 https://blog.csdn.net/weixin_43597208/art ......
语句 类型 数据 string struct

Hadoop介绍

一,Hadoop介绍 狭义上Hadoop指的是Apache软件基金会的一款开源软件,用java语言实现。允许用户使用简单的编程模型实现跨机器集群对海量数据进行分布式计算处理 Hadoop核心组件 Hadoop HDFS(分布式文件存储系统):解决海量数据存储 Hadoop YARN(集群资源管理和任 ......
Hadoop

Hadoop集群搭建(完全分布式)

一,Hadoop集群简介 1.1 Hadoop集群整体概述 Hadoop集群包括两个集群:HDFS集群、YARN集群 两个集群逻辑上分离、通常物理上在一起 两个集群都是标准的主从架构集群 Hadoop两种集群内容: 逻辑上分离,物理上合并的理解: 逻辑上分离:两个集群互相之间没有依赖、互不影响 物理 ......
分布式 集群 Hadoop

hive数据分析

HIVE数据分析实验报告 信2105-3 20213728杨申龙 数据导入 将csv文件导入到虚拟机的hive数据库中,并通过datagrip软件实现对数据库的可视化操作 数据清洗 在datagrip中进行如下操作,将数值清洗为真实日期 insert overwrite table test2 se ......
数据分析 数据 hive

hive

hive测试步骤 1.在hive中建表,一个表存放原始数据,一个表存放清洗后的数据 create table sales_initial ( day_id varchar(30), sale_nbr varchar(30), buy_nbr varchar(30), cnt varchar(30), ......
hive

华为云HBase冷热分离最佳实践

冷热分离功能支持将冷热数据存储在不同的介质上,可以大大降低存储成本,HBase支持对同一张表的数据进行冷热分离存储。 ......
冷热 HBase

软件工程测试--hive数据分析,步骤

![](https://img2023.cnblogs.com/blog/2913863/202309/2913863-20230925134737420-1341675633.png) ![](https://img2023.cnblogs.com/blog/2913863/202309/2913... ......

hive测试

这次的hive测试的流程主要分为以下几个步骤 1、数据导入到hive数据库里 2、对数据清洗 3、数据分析处理 4、将处理后的数据导出到MySQL 5、 通过网页进行数据可视化 一.数据导入到hive数据库里 1)建立初始表 create table sales_sample_20214044 ( ......
hive

hive极限测试2

......
极限 hive

hadoop和hive的兼容问题

本人之前搭建的集群是hadoop3.3.5+hive3.1.3版本,后来发现这两个版本不兼容,虽然官方文档里面说hive3.1.3版本兼容hadoop3.x.y版本,但是当我在使用hive 执行插入语句时发现一直报同一个错误 java.lang.ClassCastException: org.apa ......
hadoop 问题 hive

HIVE增量同步方案2

SELECT student_temp.id ,coalesce(student_temp.age,student.age) as age ,student_temp.name ,coalesce(student_temp.dt,student.dt) as dt FROM student_temp ......
增量 方案 HIVE

Could not open client transport with JDBC Uri: jdbc:hive2://node1:10000: java.net.ConnectException: 拒绝连接 (Connection refused) (state=08S01,code=0)

今天发现连接beeline是时候连接不上,不应该啊昨晚还可以的qaq 破案了,我启动了metastore之后忘记去启动hiveserver2 hiveserver2都没启动能连上就怪了 一定一定要记得启动顺序!!! hadoop+metastore+hiveserver2+beeline ......

使用sqoop export命令将hive数据导入mysql

描述一下 因为我前两天的测试里面,用的是另外一种方法,所以今天想要尝试一下sqoop export的方法,这个方法我之前也试过,但是一直报错,但是!我又来啦!!! 相关步骤 自己设置一个数量不多的csv文件: 然后按照之前的步骤:上传,导入数据库: 然后在mysql里面同时创建一个与hive数据库中 ......
命令 数据 export sqoop mysql

hive的一些操作(防忘)

create database test_1; 创建数据库 drop database test_1; 删除数据库 show databases; 查看数据库 ......
hive

关于Hadoop和hive启动关闭的一些命令

Hadoop启动/关闭:start-all.sh / stop-all.sh HDFS:start-dfs.sh / stop-dfs.sh YARN:start-yarn.sh / stop-yarn.shhive 启动metastore服务: 前台启动 /export/server/apache ......
命令 Hadoop hive

Hive的使用以及如何利用echarts实现可视化在前端页面展示(四)---连接idea使用echarts可视化界面

说来惭愧,我的javaweb烂得一批,其他步骤我还是很顺利地,这个最简单的,我遇到了一系列问题。只能说,有时候失败也是一种成功吧 这一步其实就是正常的jdbc,没什么可说明的,但是关于使用echarts我还是遇到了一些困难,如果有高手能指正一二,感激不尽 echarts获取前端数据要使用Ajax,我 ......
echarts 前端 界面 页面 Hive

Hive的使用以及如何利用echarts实现可视化在前端页面展示(三)---hive数据利用sqoop导出到mysql数据库里

1、安装sqoop 我的版本 jdk1.8 hadoop3.1.3 sqoop1.4.6 基本上就安装这个版本都没问题,如果是执行连接数据库命令时报错:java.lang.NoClassDefFoundError;报错,在lib下再放一个commons-lang-2.6.jar即可, sqoop安装 ......
数据 前端 echarts 页面 数据库

Hive的使用以及如何利用echarts实现可视化在前端页面展示(二)---hive部分的实现

1、利用远程连接器上传csv文件 2、进入hive创建表结构: 创建一个Hive表的SQL语句:这个表名为 "sales",包含了五个列:day_id、sale_nbr、buy_nbr、cnt 和 round。此表的数据格式为逗号分隔的文本文件,每一行都用逗号分隔字段。 create table s ......
前端 echarts 页面 部分 Hive

Hive

Hive简介 Hive 是一种大数据处理工具,使用类SQL 的HiveQL 语言实现数据查询,它底层封装了Hadoop ,所有Hive 的数据都存储在Hadoop 兼容的HDFS中。 更官方的描述: Hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和 ......
Hive

Hive学习3(数据库操作DML、join、hive函数)

1.对数据库操作 数据定义语言 (Data Definition Language, DDL),是SQL语言集中对数据库内部的对象结构进行创建,删除,修改等的操作语言,这些数据库对象包括database、table等。 DDL核心语法由CREATE、ALTER与DROP三个所组成。DDL并不涉及表内 ......
函数 数据库 数据 Hive join

Hadoop架构原理 hadoop 架构

Hadoop 1、Hadoop 2.0提供分布式存储(HDFS)和分布式操作系统(Yarn)两大功能软件包 2、Hadoop 1.0项目模块 Hadoop Common:支持其他模块的公用组件 Hadoop Distributed File System(HDFS):Hadoop的分布式文件系统 H ......
架构 原理 Hadoop hadoop

HIVE数据分析-处理结果入库

1、navicat远程连接Hive数据库 1、打开navicat里的mysql连接 2、使用SSH隧道 出现上面这个显示连接就是成功 3、设置常规连接 显示成功后点击确定,navicat远程连接Hive数据库成功 问题 4、处理结果入库: 将上述统计分析的结果数据保存到mySQL数据库中。 1、通过 ......
数据分析 结果 数据 HIVE

HIVE数据分析-数据清洗

题目:2、数据清洗: 要求将day_id一列中的数值清洗为真实的日期格式,可用字符串表示。 数据1对应日期2023-09-01,依次类推,15对应日期2023-09-15 二、数据清洗 (2)创建表格存放清洗后的数据: create table sales_y(day_id string,sale_ ......
数据 数据分析 HIVE

Hive学习2(hive部署启动,DataGrip连接hiveserver2)

1.Hive部署: hive部署:09-Apache hive安装部署--与Hadoop整合、MySQL安装_哔哩哔哩_bilibili 10-Apache hive安装部署--配置文件修改编辑_哔哩哔哩_bilibili 2.Hive启动 hadoop启动后。 node1上: nohup /exp ......
hiveserver2 hiveserver DataGrip Hive hive