hive-dml hive dml dql

MySQL之DQL数据查询操作

一:SQL概述及规范 SQL(Structured Query Language,结构化查询语言)是使用关系模型的数据库应用语言,与数据直接打交道,由 IBM 上世纪70年代开发出来。后由美国国家标准局(ANSI)开始着手制定SQL标准,先后有SQL-86,SQL-89,SQL-92,SQL-99等 ......
数据查询 数据 MySQL DQL

DML修改

update 更新 set 值 where 查询 -- 修改 指定表update course1 set ddress='天津' where cname='小兰';update course1 set ddress='广州' where cname='小红';-- 修改全部update course ......
DML

DML插入字段

insert into 字段值 values值 -- 项目统计学生 create table course1( Student int, cname varchar(20), age int, gender char(1), ddress varchar(40) );-- 不推荐 insert in ......
字段 DML

Hive的分区、分桶

Hive的分区表、分桶表 一、 Hive库的分区表 1.1概述 Hive 中的表对应为 HDFS 上的指定目录,在查询数据时候,默认会对全表进行扫描,这样时间和性能的消耗都非常大。 分区为 HDFS 上表目录的子目录,数据按照分区存储在子目录中。如果查询的 where 字句的中包含分区条件,则直接从 ......
Hive

hive优秀文章

hiveserver2源码: 转 Hive源码分析——HiveServer2启动过程 https://zhizhi.pcwanli.com/front/article/9514.html 【原创】大数据基础之Hive(1)Hive SQL执行过程之代码流程 https://blog.csdn.net ......
文章 hive

本地spark通过spark集群连接hive

最近在学习spark,上周将spark集群搭建起来了,今天在idea中创建了一个测试程序读取hive库中的数据,程序很简单,但是踩到一些坑,卡了四五个小时,做个记录。 搭建Spark集群比较简单: 1、安装scala,scala版本要和spark使用的scala版本一致(因为这个问题卡了五六个小时) ......
spark 集群 hive

MySQL-DQL

准备测试表,先跟着执行下面的SQL ```sql #1.登录MySQL后 #2.创建test_database数据库,不存在则创建 create database if not exists test_database; #2.1.如果test_database库存在,可以根据自己意愿删除或换个名称 ......
MySQL-DQL MySQL DQL

Centos7安装配置Hive

Centos7安装配置 # 一 、 安装 安装就不多做详述,选择好自己的镜像设置好路径即可 # 二 、配置 #### 2.1 网络配置 桌面右键进入 `cmd` 命令编辑窗口,在 Linux 中设置网络的相关配置都需要管理员权限,需要先切换到 root 用户。 ```markdown vim /et ......
Centos7 Centos Hive

hive(七) -- 拉链表、数据存储及优化配置

## 拉链表 ### 数据同步问题 Hive在实际工作中主要用于构建离线数据仓库,定期的从各种数据源中同步采集数据到Hive中,经过分层转换提供数据应用。比如每天需要从MySQL中同步最新的订单信息、用户信息、店铺信息等到数据仓库中,进行订单分析、用户分析。 ![image](https://img ......
拉链 数据 hive

hive(六)

## 函数 Hive的函数分为两大类∶内置函数(Built-in Functions )、用户定义函数UDF (User-Defined Functions ) . 内置函数可分为︰数值类型函数、日期类型函数、字符串类型函数、集合函数、条件函数等; 用户定义函数根据输入输出的行数可分为3类:UDF、 ......
hive

hive学习基础与调优

一、Hive基础知识 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能(hive的HQL语法设计实际模仿Mysql的语法)。其本质是将SQL转换为MapReduce的任务进行运算,底层由HDFS来提供数据的存储,说白了hive可以理解为一 ......
基础 hive

DML,DDL,DCL

DML是用于操作表中数据的SQL命令,包括SELECT、INSERT、UPDATE和DELETE等命令。使用DML命令可以对表中的数据进行查询、添加、修改和删除等操作。 DDL是用于定义表结构的SQL命令,包括CREATE、ALTER和DROP等命令。使用DDL命令可以创建、修改和删除表,以及定义表 ......
DML DDL DCL

hive查询练习

## 练习1 ```SQl 2022-08-07 1,liuyan 2,tangyan 3,jinlian 4,dalang 5,ximenqing 2022-08-08 1,liuyan 2,tangyan 4,dalang 6,wusong -- 创建分区表记录每天用户登陆信息 create t ......
hive

Hive函数大全

Hive内部提供了很多函数给开发者使用,包括数学函数,类型转换函数,条件函数,字符函数,聚合函数,表生成函数等等,这些函数都统称为内置函数。 数学函数 Return Type Name (Signature) Description DOUBLE round(DOUBLE a) Returns th ......
函数 大全 Hive

Hive - Hive介绍

是 基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供 类SQL查询功能。 Hive处理的数据存储在HDFS上,数据分析底层实现是MR,执行程序运行在Yarn上。 ......
Hive

hive(四)

## 内部表和外部表 默认情况下创建的表就是内部表,Hive拥有该表的结构和文件。换句话说,Hive完全管理表(元数据和数据)的生命周期,类似于RDBMS中的表。当你删除内部表时,它会删除数据以及表的元数据。可以使用DESCRIBE FORMATTED tablename,来获取表的元数据描述信息, ......
hive

sqoop导数到hive任务状态一直是Accepted或Running

昨天晚上装了sqoop准备将数据从pg库导入Hive库备用,写了个sqoop脚本,运行脚本本后从yarn ui上看任务状态一直 Accepted,卡了三四个小时,最后发现是 yarn-site.xml 配置问题,给的资源太少,无法运行任务。 在 yarn-site.xml 中添加下面的内容: ``` ......
导数 Accepted 状态 任务 Running

hive(三)

## HQL基础语法 Hive中的语句叫做HQL语句,是一种类似SQL的语句,基本上和SQL相同但是某些地方也是有很大的区别. ### 数据库操作 **创建数据库** - 1.创建一个数据库,数据库在HDFS上的默认存储路径是/hive/warehouse/*.db。 ```sql create d ......
hive

DML语句 ------- mysql增删改

DML语句 1、插入(insert) insert into 表 values(数据) 要求插入数据的数量,类型要和表的结构一致 insert into 表(列名) values(数据) 要求插入的数据的数量顺序和表名后的列要一致 insert into 表(列名) select 从另外一张表查询的 ......
语句 mysql DML

DQL语句(二)-------函数和分组

6、函数 函数是数据库自有的,我们可以直接调用,使用函数可以计算出我们需要的数据 MySQL 函数 大全 单行函数 字符串函数 -- 长度length(),截取substr(),大小写upper(str),lower(str),拼接concat(),替换replace() SELECT upper( ......
语句 函数 DQL

DQL语句(三)------- 多表查询

9、多表查询 9.1 多表连接 select * from emp,dept; -- 直接两张表之间加逗号就会全连接 如果没有任何条件去连接两张表,那么会产生一张很大的表,两张表记录相乘条记录 设置条件用点 . 比如:emp.deptno=dept.deptno(员工表中deptno=部门表中的de ......
语句 DQL

DQL语句(一) -----简单select查询

DQL语句 1、格式 select 列名*N from 表名 where 查询条件1 and/or 查询条件2 group by 列 Having 分组条件 Order by 排序 2、规则 sql在书写时除了查询条件外,大小写都可以 select * from user where uname=' ......
语句 select DQL

HIVE跨集群迁移

查看mysql使用端口 ps -ef | grep mysql ss -antp | grep [ps查出来的pid] 停止HIVE写入服务 创建备份路径 mkdir -p /root/hivebackup/ 执行备份数据库命令:(在目标集群执行) mysqldump -uroot -pPasswo ......
集群 HIVE

impala jdbc导出hive数据字典

####业务需求太多了,给完整导出为html文件,以及之前搞的 public static void main(String[] args) throws Exception { kerberos(); } public static void kerberos() { URL resource = ......
字典 数据 impala hive jdbc

Hive3安装

Hive3安装 Mysql安装 卸载Centos7自带的mariadb [root@node3 ~]# rpm -qa|grep mariadb mariadb-libs-5.5.64-1.el7.x86_64 [root@node3 ~]# rpm -e mariadb-libs-5.5.64-1 ......
Hive3 Hive

【大数据】Hive Join 的原理与机制

一、概述 Hive是一个基于Hadoop的数据仓库解决方案,它提供了类似于SQL的查询语言,称为HiveQL,用于处理结构化数据。在Hive中,JOIN操作用于将两个或多个表中的数据连接在一起,以便进行联合查询和分析。 Hive 中 的 Join 可分为 Common Join(Reduce阶段完成 ......
原理 机制 数据 Hive Join

☆常用的Sql语句汇总(DDL/DML)

常用的sql语句汇总 1、获取所有表名、表信息 里面有表注释 | 数据库种类 | sql | 备注 | | | | | | mysql | -- 获取所有表名、视图名show tables-- 获取 dev_test_data数据库 所有表、视图信息select * from information ......
语句 常用 Sql DDL DML

基于Hadoop3.1.3安装Hive3.1.2

Hive是什么? \t Hive 是一个基于 Hadoop 的数据仓库工具,它提供了类似 SQL 的查询语言 HQL(Hive Query Language),使得开发人员可以使用类 SQL 语言来查询和处理存储在大规模 分布式文件系统(如 HDFS)中的数据。 Hive有哪些功能? Hive 的主 ......
Hadoop3 Hadoop Hive3 Hive 1.3

【大数据】Hive DDL 操作与视图讲解

一、概述 Hive是建立在Hadoop上的数据仓库工具,它允许用户通过类SQL的语法来查询和管理数据。在Hive中,DDL(数据定义语言)和视图操作是非常常见的。 1)表和视图关系 表和视图都是数据存储的逻辑表示方式。它们之间有以下关系: 视图可以基于一个或多个表创建,而表不可以基于其他表或视图创建 ......
视图 数据 Hive DDL

【大数据】Hive 内置函数和 UDF 讲解

一、概述 Hive是基于Hadoop的一个数据仓库工具,可以将结构化数据文件映射为一张数据库表,并提供类SQL语句操作。Hive内置了很多函数,可以满足基本的查询需求,同时还支持自定义函数(UDF)来实现更加灵活的操作。 官方文档:https://cwiki.apache.org/confluenc ......
函数 数据 Hive UDF