hive-dml hive dml dql
MySQL之DQL数据查询操作
一:SQL概述及规范 SQL(Structured Query Language,结构化查询语言)是使用关系模型的数据库应用语言,与数据直接打交道,由 IBM 上世纪70年代开发出来。后由美国国家标准局(ANSI)开始着手制定SQL标准,先后有SQL-86,SQL-89,SQL-92,SQL-99等 ......
DML修改
update 更新 set 值 where 查询 -- 修改 指定表update course1 set ddress='天津' where cname='小兰';update course1 set ddress='广州' where cname='小红';-- 修改全部update course ......
DML插入字段
insert into 字段值 values值 -- 项目统计学生 create table course1( Student int, cname varchar(20), age int, gender char(1), ddress varchar(40) );-- 不推荐 insert in ......
Hive的分区、分桶
Hive的分区表、分桶表 一、 Hive库的分区表 1.1概述 Hive 中的表对应为 HDFS 上的指定目录,在查询数据时候,默认会对全表进行扫描,这样时间和性能的消耗都非常大。 分区为 HDFS 上表目录的子目录,数据按照分区存储在子目录中。如果查询的 where 字句的中包含分区条件,则直接从 ......
hive优秀文章
hiveserver2源码: 转 Hive源码分析——HiveServer2启动过程 https://zhizhi.pcwanli.com/front/article/9514.html 【原创】大数据基础之Hive(1)Hive SQL执行过程之代码流程 https://blog.csdn.net ......
本地spark通过spark集群连接hive
最近在学习spark,上周将spark集群搭建起来了,今天在idea中创建了一个测试程序读取hive库中的数据,程序很简单,但是踩到一些坑,卡了四五个小时,做个记录。 搭建Spark集群比较简单: 1、安装scala,scala版本要和spark使用的scala版本一致(因为这个问题卡了五六个小时) ......
MySQL-DQL
准备测试表,先跟着执行下面的SQL ```sql #1.登录MySQL后 #2.创建test_database数据库,不存在则创建 create database if not exists test_database; #2.1.如果test_database库存在,可以根据自己意愿删除或换个名称 ......
Centos7安装配置Hive
Centos7安装配置 # 一 、 安装 安装就不多做详述,选择好自己的镜像设置好路径即可 # 二 、配置 #### 2.1 网络配置 桌面右键进入 `cmd` 命令编辑窗口,在 Linux 中设置网络的相关配置都需要管理员权限,需要先切换到 root 用户。 ```markdown vim /et ......
hive(七) -- 拉链表、数据存储及优化配置
## 拉链表 ### 数据同步问题 Hive在实际工作中主要用于构建离线数据仓库,定期的从各种数据源中同步采集数据到Hive中,经过分层转换提供数据应用。比如每天需要从MySQL中同步最新的订单信息、用户信息、店铺信息等到数据仓库中,进行订单分析、用户分析。 ![image](https://img ......
hive(六)
## 函数 Hive的函数分为两大类∶内置函数(Built-in Functions )、用户定义函数UDF (User-Defined Functions ) . 内置函数可分为︰数值类型函数、日期类型函数、字符串类型函数、集合函数、条件函数等; 用户定义函数根据输入输出的行数可分为3类:UDF、 ......
hive学习基础与调优
一、Hive基础知识 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能(hive的HQL语法设计实际模仿Mysql的语法)。其本质是将SQL转换为MapReduce的任务进行运算,底层由HDFS来提供数据的存储,说白了hive可以理解为一 ......
DML,DDL,DCL
DML是用于操作表中数据的SQL命令,包括SELECT、INSERT、UPDATE和DELETE等命令。使用DML命令可以对表中的数据进行查询、添加、修改和删除等操作。 DDL是用于定义表结构的SQL命令,包括CREATE、ALTER和DROP等命令。使用DDL命令可以创建、修改和删除表,以及定义表 ......
hive查询练习
## 练习1 ```SQl 2022-08-07 1,liuyan 2,tangyan 3,jinlian 4,dalang 5,ximenqing 2022-08-08 1,liuyan 2,tangyan 4,dalang 6,wusong -- 创建分区表记录每天用户登陆信息 create t ......
Hive函数大全
Hive内部提供了很多函数给开发者使用,包括数学函数,类型转换函数,条件函数,字符函数,聚合函数,表生成函数等等,这些函数都统称为内置函数。 数学函数 Return Type Name (Signature) Description DOUBLE round(DOUBLE a) Returns th ......
Hive - Hive介绍
是 基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供 类SQL查询功能。 Hive处理的数据存储在HDFS上,数据分析底层实现是MR,执行程序运行在Yarn上。 ......
hive(四)
## 内部表和外部表 默认情况下创建的表就是内部表,Hive拥有该表的结构和文件。换句话说,Hive完全管理表(元数据和数据)的生命周期,类似于RDBMS中的表。当你删除内部表时,它会删除数据以及表的元数据。可以使用DESCRIBE FORMATTED tablename,来获取表的元数据描述信息, ......
sqoop导数到hive任务状态一直是Accepted或Running
昨天晚上装了sqoop准备将数据从pg库导入Hive库备用,写了个sqoop脚本,运行脚本本后从yarn ui上看任务状态一直 Accepted,卡了三四个小时,最后发现是 yarn-site.xml 配置问题,给的资源太少,无法运行任务。 在 yarn-site.xml 中添加下面的内容: ``` ......
hive(三)
## HQL基础语法 Hive中的语句叫做HQL语句,是一种类似SQL的语句,基本上和SQL相同但是某些地方也是有很大的区别. ### 数据库操作 **创建数据库** - 1.创建一个数据库,数据库在HDFS上的默认存储路径是/hive/warehouse/*.db。 ```sql create d ......
DML语句 ------- mysql增删改
DML语句 1、插入(insert) insert into 表 values(数据) 要求插入数据的数量,类型要和表的结构一致 insert into 表(列名) values(数据) 要求插入的数据的数量顺序和表名后的列要一致 insert into 表(列名) select 从另外一张表查询的 ......
DQL语句(二)-------函数和分组
6、函数 函数是数据库自有的,我们可以直接调用,使用函数可以计算出我们需要的数据 MySQL 函数 大全 单行函数 字符串函数 -- 长度length(),截取substr(),大小写upper(str),lower(str),拼接concat(),替换replace() SELECT upper( ......
DQL语句(三)------- 多表查询
9、多表查询 9.1 多表连接 select * from emp,dept; -- 直接两张表之间加逗号就会全连接 如果没有任何条件去连接两张表,那么会产生一张很大的表,两张表记录相乘条记录 设置条件用点 . 比如:emp.deptno=dept.deptno(员工表中deptno=部门表中的de ......
DQL语句(一) -----简单select查询
DQL语句 1、格式 select 列名*N from 表名 where 查询条件1 and/or 查询条件2 group by 列 Having 分组条件 Order by 排序 2、规则 sql在书写时除了查询条件外,大小写都可以 select * from user where uname=' ......
HIVE跨集群迁移
查看mysql使用端口 ps -ef | grep mysql ss -antp | grep [ps查出来的pid] 停止HIVE写入服务 创建备份路径 mkdir -p /root/hivebackup/ 执行备份数据库命令:(在目标集群执行) mysqldump -uroot -pPasswo ......
impala jdbc导出hive数据字典
####业务需求太多了,给完整导出为html文件,以及之前搞的 public static void main(String[] args) throws Exception { kerberos(); } public static void kerberos() { URL resource = ......
Hive3安装
Hive3安装 Mysql安装 卸载Centos7自带的mariadb [root@node3 ~]# rpm -qa|grep mariadb mariadb-libs-5.5.64-1.el7.x86_64 [root@node3 ~]# rpm -e mariadb-libs-5.5.64-1 ......
【大数据】Hive Join 的原理与机制
一、概述 Hive是一个基于Hadoop的数据仓库解决方案,它提供了类似于SQL的查询语言,称为HiveQL,用于处理结构化数据。在Hive中,JOIN操作用于将两个或多个表中的数据连接在一起,以便进行联合查询和分析。 Hive 中 的 Join 可分为 Common Join(Reduce阶段完成 ......
☆常用的Sql语句汇总(DDL/DML)
常用的sql语句汇总 1、获取所有表名、表信息 里面有表注释 | 数据库种类 | sql | 备注 | | | | | | mysql | -- 获取所有表名、视图名show tables-- 获取 dev_test_data数据库 所有表、视图信息select * from information ......
基于Hadoop3.1.3安装Hive3.1.2
Hive是什么? \t Hive 是一个基于 Hadoop 的数据仓库工具,它提供了类似 SQL 的查询语言 HQL(Hive Query Language),使得开发人员可以使用类 SQL 语言来查询和处理存储在大规模 分布式文件系统(如 HDFS)中的数据。 Hive有哪些功能? Hive 的主 ......
【大数据】Hive DDL 操作与视图讲解
一、概述 Hive是建立在Hadoop上的数据仓库工具,它允许用户通过类SQL的语法来查询和管理数据。在Hive中,DDL(数据定义语言)和视图操作是非常常见的。 1)表和视图关系 表和视图都是数据存储的逻辑表示方式。它们之间有以下关系: 视图可以基于一个或多个表创建,而表不可以基于其他表或视图创建 ......
【大数据】Hive 内置函数和 UDF 讲解
一、概述 Hive是基于Hadoop的一个数据仓库工具,可以将结构化数据文件映射为一张数据库表,并提供类SQL语句操作。Hive内置了很多函数,可以满足基本的查询需求,同时还支持自定义函数(UDF)来实现更加灵活的操作。 官方文档:https://cwiki.apache.org/confluenc ......