hive-dml hive dml dql

【必知必会的MySQL知识】⑤DQL语言

(DQL语言) 一、前言 上一节中我们说了DML 数据操作语言,这一篇到了DQL语言,DQL语言就是我们常说的select 语句。 它是从一个表或多个表中根据各种条件,检索出我们想要的数据集。 DQL语句算是我们工作中最长用也是最复杂的SQL语句了。 二、基础查询 2.1 语法 -- ① 查询字段 ......
语言 知识 MySQL DQL

【大数据】Hive 分区和分桶的区别及示例讲解

一、概述 在大数据处理过程中,Hive是一种非常常用的数据仓库工具。Hive分区和分桶是优化Hive性能的两种方式,它们的区别如下: 1)分区概述 Hive分区是把数据按照某个属性分成不同的数据子集。 在Hive中,数据被存储在HDFS中,每个分区实际上对应HDFS下的一个文件夹,这个文件夹中保存了 ......
示例 数据 Hive

【必知必会的MySQL知识】③DML语言

(DML语言) 前言 前面的两篇文章中,我们已经对MySQL有了基本了解。 并且知道了怎么用工具连接数据库?怎么创建数据库?怎么创建表? 这一篇呢我们就来看看怎么在我们创建的表中插入数据、删除数据和修改数据。也就是上一篇文章中提到的DML 数据操作语言 准备 根据上一章所说的,我们创建一个db_xi ......
语言 知识 MySQL DML

基础-SQL-DQL-分页查询

分页操作在业务系统开发时,也是非常常见的一个功能,我们在网站中看到的各种各样的分页条,后台 都需要借助于数据库的分页操作。 SELECT 字段列表 FROM 表名 LIMIT 起始索引, 查询记录数 ; 注意事项: • 起始索引从0开始,起始索引 = (查询页码 - 1)* 每页显示记录数。 • 分 ......
SQL-DQL 基础 SQL DQL

基础-SQL-DQL-分组查询

where与having区别 执行时机不同:where是分组之前进行过滤,不满足where条件,不参与分组; 而having是分组 之后对结果进行过滤。 判断条件不同:where不能对聚合函数进行判断,而having可以。 注意事项: • 分组之后,查询的字段一般为聚合函数和分组字段,查询其他字段无 ......
SQL-DQL 基础 SQL DQL

基础-SQL-DQL-条件查询

查询没有身份证号的员工信息 select * from emp where idcard is null; 查询年龄在15岁(包含) 到 20岁(包含)之间的员工信息 select * from emp where age >= 15 && age <= 20; select * from emp ......
条件 SQL-DQL 基础 SQL DQL

基础-DML-插入

DML-添加数据 1.给指定字段添加数据 INSERT INTO 表名 (字段名1, 字段名2, ...) VALUES(值1, 值2,...); 2. 给全部字段添加数据 INSERT INTO 表名 VALUES(值1, 值2,...); 3.批量添加数据 INSERT INTO 表名 (字段名 ......
基础 DML

Hive单机安装与测试

安装MySQL并运行 在当前用户下运行 sudo apt update sudo apt install mysql-server 安装成功后启动MySQL服务,运行 sudo service mysql start 查看MySQL的默认用户名和密码,运行 sudo cat /etc/mysql/d ......
单机 Hive

DML操作

外键 概念: 外键作用: 创建外键 建表时指定外键约束 建表后修改 删除外键 操作:删除具有主键关系的表示,要先删字表,后删除主表 DML语言 添加数据 INSERT命令 修改数据 update命令 where条件子句 删除数据 DELETE命令 TRUNCATE命令 外键 1. 概念: 如果公共关 ......
DML

DQL操作

DQL语言 SELECT语法 AS 子句作为别名 DISTINCT关键字的使用 使用表达式的列 逻辑操作符 模糊查询:比较运算符 JOIN DQL语言 DQL( Data Query Language 数据查询语言 ) 查询数据库数据 , 如SELECT语句 简单的单表查询或多表的复杂查询和嵌套查询 ......
DQL

hive on spark报错

Error in query: Detected implicit cartesian product for LEFT OUTER join between logical plansUnion Join condition is missing or trivial.Either: use th ......
spark hive on

Ubuntu系统python连接hive遇到的一些问题

1.第一个问题,sasl这个库安装不上,报 缺少sasl.h的问题(#include <sasl/sasl.h>) 解决方法:sudo apt-get install -y libsasl2-dev gcc python-dev 2.第二个问题,连接的时候报 Could not start SASL ......
Ubuntu python 问题 系统 hive

Hive On Spark调优

第1章 集群环境概述 1.1 集群配置概述 本课程所用集群由5台节点构成 其中2台为master节点: 用于部署HDFS的NameNode Yarn的ResourceManager 另外3台为worker节点,用于部署HDFS的DataNode、Yarn的NodeManager等角色。 Master ......
Spark Hive On

datax从hive向pg同步踩的坑

1. [INFO] 2023-04-21 14:11:00.836 - [taskAppId=TASK-9296114303648_1-2137236-2376388]:[61] - -> 2023-04-21 14:11:00.783 [job-0] ERROR RetryUtil - Excep ......
datax hive

hive出现MetaException(message:Metastore contains multiple versions (2)异常

1、使用Spark操作Hive表时发生的报错 2、错误日志 23/04/19 08:49:28 WARN metadata.Hive: Failed to access metastore. This class should not accessed in runtime. org.apache. ......

Hive 修改计算引擎方法

前置说明 各位应该清楚,hive 默认计算引擎是 mr,当集群配置了 hive-ob-spark 后可以根据需要自行切换计算引擎 其它计算引擎切换为mapreduce set hive.execution.engine=mr; 其它计算引擎切换为 spark set hive.execution.e ......
引擎 方法 Hive

hive

解压hive到/usr/local/src目录下并修改名称为hive mv apache-hive-3.1.3-bin hive 配置hive的环境变量 #HIVE_HOME export HIVE_HOME=/usr/local/src/hive export PATH=$PATH=$HIVE_H ......
hive

DQL(数据查询)

DQL(数据查询) 基础查询 不推荐 select * from 表名; -- 查询所有列的所有数据,列名的列表可以使用*代替,但是以后在公司是不让使用的 为了语法规范 建议一个个写 推荐 select 列名1,列名2,... from stu; select id,name,age,sex,add ......
数据查询 数据 DQL

19c dml重定向使用

主库上执行SQL>connect / as sysdbaSQL>alter session set container=pdb1;SQL>create user hxl identified by oracle;SQL>grant dba to hxl; 连接具体pdbsqlplus /nologS ......
19c dml 19

DML(对表中的数据进行增删改)

DML(对表中的数据进行增删改) 添加(insert) 给指定列添加数据它 INSERT INTO 表名(列名1,列名2,.….)VALUES(值1,值2,...); 给全部列添加数据 INSERT INTO 表名VALUES(值1,值2.…); 批量添加数据 INSERT INTO 表名(列名1, ......
数据 DML

Mysql数据库-DQL操作

DQL是数据查询语言(Data Query Language)的缩写,是一种用于从数据库中检索数据的编程语言。DQL是SQL(结构化查询语言)的子集,用于查询关系型数据库,例如MySQL、Oracle和SQL Server等。 DQL提供了多种查询操作,如SELECT、FROM、WHERE、GROU ......
数据库 数据 Mysql DQL

hive使用trino查询时报分区不存在问题

1.使用sql界面查询时报错”分区不存在“ 2.后台查看文件不存在 $ hdfs dfs -s /warehouse/cleaned.db/dataitem1 202304/f=20230412 2se/warehouse/cleaned.db/dataitem1 202304/f=20230412 ......
时报 问题 trino hive

Windows10系统下Hadoop和Hive环境搭建

文章部分内容来自:https://www.cnblogs.com/sheng-sjk/p/16186508.html 结合实际搭建过程中的问题,对文章进行了优化 环境准备 | 软件 | 版本 | 备注 | | : : | : : | : : | | Windows | 10 | 操作系统 | | J ......
Windows 环境 Hadoop 系统 Hive

Hive解析Json字符串

在Hive中会有很多数据是用Json格式来存储的,如开发人员对APP上的页面进行埋点时,会将多个字段存放在一个json数组中,因此数据平台调用数据时,要对埋点数据进行解析。接下来就聊聊Hive中是如何解析json数据的。 Hive自带的json解析函数 1. get_json_object 语法:g ......
字符串 字符 Hive Json

Hive构造数据踩坑

运维哥哥为了获取每个表的访问时间,开启了Hive钩子,在集群参数里面配置了hive.exec.pre.hooks= org.apache.hadoop.hive.ql.hooks.UpdateInputAccessTimeHook$PreExec,结果导致在使用图1的sql时报找不到虚拟表的错误(如 ......
数据 Hive

Pandas实现Hive中的窗口函数

1、Hive窗口函数 我们先来介绍一下Hive中几个常见的窗口函数,row_number(),lag()和lead()。 1.1 row_number() 该函数的格式如下: row_Number() OVER (partition by 分组字段 ORDER BY 排序字段 排序方式asc/des ......
函数 Pandas Hive

Hive元数据信息表

--Hive元数据表 1.表信息 (1)TBLS--记录数据表信息,可作为左表,关联其他表信息 (2)TABLE_PARAMS—存储Hive表的属性信息 具体数据内容: (3)COLUMNS_V2—保存表的字段信息 2.分区信息 (1)PARTITIONS (2)PARTITIONS_PARAMS— ......
数据 信息 Hive

Hive元数据配置到Mysql

1. 将mysql的JDBC驱动拷贝到Hive的lib目录下 [root@hadoop1 lib]# ls mysql-connector-java-5.1.34.jar 2. 配置MetaStore到Mysql [root@hadoop1 conf]# vi hive-site.xml <conf ......
数据 Mysql Hive

Hive启动成功

1. 启动hive [root@hadoop1 ~]# /root/tools/hive/hive/bin/hive SLF4J: Class path contains multiple SLF4J bindings. SLF4J: Found binding in [jar:file:/root ......
Hive

Hive的SQL优化

--HiveSQL优化 1.查看执行计划 --基本信息 explain select * from part1 where id<10; --显示输入属性 explain dependency --查看SQL相关权限信息 explain authorization --查看SQL向量化描述信息,显示 ......
Hive SQL