hive-dml hive dml dql

21.DQL 表查询操作 - 聚合函数

目录 聚合函数 聚合查询 聚合函数 COUNT():统计指定列不为 NULL 的记录行数 MAX():计算指定列的最大值 MIN():计算指定列的最小值 SUM():计算指定列的数值和 AVG():计算指定列的平均值 聚合查询 语法:SELECT 聚合函数(列名) FROM 表名; -- 查询职级名 ......
函数 DQL 21

20.DQL 表查询操作 - 排序

目录 排序语法 单列排序 组合排序 排序语法 ASC 表示升序排序(默认) DESC 表示降序排序 -- 对查询结果进行排序 SELECT 列名 FROM 表名 [WHERE 条件表达式] ORDER BY 列名1 [ASC / DESC], 列名2 [ASC / DESC] 单列排序 只按照某一个 ......
DQL 20

19.DQL 表查询操作 - 条件查询

目录 条件查询语法 比较运算符 逻辑运算符 通配符 条件查询语法 -- 条件查询 SELECT 列名 FROM 表名 WHERE 条件表达式 比较运算符 运算符说明 > < <= >= = <> != 大于、小于、小于等于、大于等于、等于、不等于 BETWEEN...AND... 范围限定 IN 子 ......
条件 DQL 19

18.DQL 表查询操作 - 简介

目录 数据准备 单表查询 字段查询 起别名 去重 数据准备 测试数据库: https://github.com/datacharmer/test_db 网盘下载: 网盘下载地址 提取码:gxow cd 数据所在目录 mysql -h 127.0.0.1 -uroot -p < employees.s ......
简介 DQL 18

17.DML 表数据操作 - 删除

目录 通过 DELETE 语句删除数据 通过 TRUNCATE TABLE 语句删除数据 实例 通过 DELETE 语句删除数据 数据表名:指定要删除的数据表的表名 WHERE 子句:限定表中要删除的行 -- 删除表中指定行的数据 DELETE FROM 数据表名 WHERE 条件表达式 通过 TR ......
数据 DML 17

16.DML 表数据操作 - 修改

目录 表数据修改语法 实例 表数据修改语法 SET 子句:必选项,用于指定表中要修改的字段名及其字段值 WHERE 子句:可选项,用于限定表中要修改的行 -- 修改表中数据 UPDATE 数据表名 SET 列名1=值1 [, 列名2=值2...] [WHERE 条件表达式] 实例 -- 选择 db1 ......
数据 DML 16

15.DML 表数据操作 - 插入

目录 表数据插入语法 完整插入数据 插入数据记录的一部分 插入多条记录 注意事项 表数据插入语法 INTO 数据表名:指定被操作的数据表 (列名1, 列名2…):可选项,向数据表的指定列插入数据 VALUES(值1, 值2…):需要插入的数据 -- 插入数据 INSERT INTO 数据表名 (列名 ......
数据 DML 15

Hive事务表转换为非事务表

环境:hive3.1.0 由于建表时默认会建为非事务表 CREATE TABLE bucket_text_table2(column1 string,column2 string,column3 int) CLUSTERED BY (column3) into 5 BUCKETS STORED AS ......
事务 Hive

Hive的存储格式

一、简介 1、hive建表时存储格式 一般情况下hive在创建表时默认的存储格式是textfile,hive常用的存储格式有五种,textfile、sequencefile、rcfile、orc、parquet。 2、五种存储格式的区别 hive五种存储格式的区别 存储格式文件存储编码格式建表指定 ......
格式 Hive

使用-数据湖Iceberg和现有hive数仓打通并使用

一、集群配置 1、版本使用 技术 版本 iceberg 1.3.1 flink 1.16.1 spark 3.2.1 hive 2.3.7 dlc-presto 待定 2、集群配置调整 (1)使用hive查询的话所有hiveserver2节点修改hive-site.xml文件,添加jar包,添加如下 ......
Iceberg 数据 hive

Hive的表类型

在Hive的学习中,有一个非常重要的知识点,那就是Hive的表类型。 Hive的表类型主要有四种:内部表(受控表)、外部表、分区表、分桶表。 一:内部表 ......
类型 Hive

Hive基本操作

Hive的基本操作很简单,与SQL的写法很类似,总结如下: 进入Hive环境 $HIVE_HOME/bin/hive 数据库操作 CREATE (DATABASE|SCHEMA) [IF NOT EXISTS] database_name [COMMENT database_comment] [LO ......
基本操作 Hive

华为云耀云服务器L实例--Hive的部署

华为云耀云服务器L实例--Hive的部署 产品官网:https://www.huaweicloud.com/product/hecs-light.html 今天我们采用可靠更安全、智能不卡顿、价优随心用、上手更简单、管理特省心的华为云耀云服务器L实例为例,继续Hive的部署 Hive 是建立在 Ha ......
实例 服务器 Hive

华为云耀云服务器L实例-大数据学习-Hive的部署-1

华为云耀云服务器L实例-大数据学习-Hive的部署-1 产品官网:https://www.huaweicloud.com/product/hecs-light.html 今天我们采用可靠更安全、智能不卡顿、价优随心用、上手更简单、管理特省心的华为云耀云服务器L实例为例,介绍Hive的部署 Hive  ......
实例 服务器 数据 Hive

Hive ACID笔记

环境:hive 3.1.0 执行引擎:hive on tez 什么是hive ACID? hive官网对于ACID的介绍: https://cwiki.apache.org/confluence/display/Hive/Hive+Transactions 中文文档关于ACID的介绍: https: ......
笔记 Hive ACID

Hive安装部署

引言 Apache Hive 是一款建立在 Hadoop 生态系统之上的数据仓库工具,它提供了一种 SQL 类似的查询语言(HiveQL)来查询和分析存储在 Hadoop 分布式文件系统(HDFS)中的大规模数据。Hive 的设计目标是让用户可以在大规模数据集上执行复杂的查询,而无需深入了解 Map ......
Hive

MRS基础组件之HBase与Hive开发应用_tyt2023

MRS基础组件之HBase与Hive开发应用 本实验基于MRS环境,介绍如何利用HBase与Hive来进行相关操作。其中,HBase主要介绍包括如何利用Java API创建数据表、写入数据、查看数据以及删除数据;而Hive则通过介绍UDF、UDTF和UDAF等自定义函数的基本操作,讲解如何进行自定义 ......
组件 基础 HBase 2023 Hive

web访问hive

配置 <property> <name>hive.server2.thrift.port</name> <value>10000</value> </property> <property> <name>hive.server2.thrift.bind.host</name> <value>slav ......
hive web

dremio hive jdbc arp date 类型问题记录

简单记录下碰到的一些问题 分析 arthas stack 查看调用 ffect(class count: 2 , method count: 4) cost in 329 ms, listenerId: 11 ts=2023-12-26 06:18:17;thread_name=e3 - 1a758 ......
类型 dremio 问题 date hive

Hive的体系架构

Hello,大家好,上一篇博文聊了一下Hive的基本知识,为了让大家更深入地理解Hive,本篇就写一下Hive的体系架构吧。 先看一张图: 大概解释一下: command-line shell & thrift/jdbc 可以用 command-line shell 和 thrift/jdbc 两种 ......
架构 体系 Hive

Hive“横空出世”的原因

在沸沸扬扬的大数据江湖里,有这么一个框架,它刚开始很低调,然而,就在那么一个不起眼的一天,突然展示出其绝妙的武功,让大数据各大框架的掌门人暗挑大拇指,好了,不卖关子了,这个“横空出世”的框架就是——Hive。 一:Hive产生的背景 万事有因果,Hive的出现也不是无缘无故的,总体来说,Hive出现 ......
原因 Hive

大数据从业者必知必会的Hive SQL调优技巧 | 京东云技术团队

摘要:在大数据领域中,Hive SQL被广泛应用于数据仓库的数据查询和分析。然而,由于数据量庞大和复杂的查询需求,Hive SQL查询的性能往往不尽人意。本文针对Hive SQL的性能优化进行深入研究,提出了一系列可行的调优方案,并给出了相应的优化案例和优化前后的SQL代码。通过合理的优化策略和技巧 ......
从业者 团队 技巧 数据 技术

Hive 3.1.3 生产安装

1.安装用于存储元数据的关系数据库 生产环境中一般存储元数据采用独立的关系型数据库而非Hive本地的嵌入式数据库 本地的嵌入式数据库无法支持多个请求同时访问。 本示例采用Mysql8.0作为示例 具体的支持列表参考官方文档: https://cwiki.apache.org/confluence/d ......
Hive

Hive 3.1.3最小化安装

1.解压 mkdir /usr/hive tar -zxvf apache-hive-3.1.3-bin.tar.gz -C /usr/hive 2.配置Hive环境变量 在/etc/profile.d中配置 1.新建hive.sh vi /etc/profile.d/hive.sh export ......
Hive

Spark写hive insertInto和saveAsTable的差别和错误

insertInto必须保证源表字段顺序和hive表字段顺序一致,不然会插入乱序,如果字段数不一致,会报错 saveAsTable append模式下,如果字段数不一致,会报错,overwrite模式下,会重建表 如果是外部表,已经存在了数据,saveAsTable会报错 org.apache.sp ......
saveAsTable insertInto 差别 错误 Spark

ClickHouse(19)ClickHouse集成Hive表引擎详细解析

目录Hive集成表引擎创建表使用示例如何使用HDFS文件系统的本地缓存查询 ORC 输入格式的Hive 表在 Hive 中建表在 ClickHouse 中建表查询 Parquest 输入格式的Hive 表在 Hive 中建表在 ClickHouse 中建表查询文本输入格式的Hive表在Hive 中建 ......
ClickHouse 引擎 Hive 19

Hive-mapjoin详解(mapjoin原理)

笼统的说,Hive中的Join可分为Common Join(Reduce阶段完成join)和Map Join(Map阶段完成join)。本文简单介绍一下两种join的原理和机制。 一 .Common Join 如果不指定MapJoin或者不符合MapJoin的条件,那么Hive解析器会将Join操作 ......
mapjoin Hive-mapjoin 原理 Hive

Hive和Spark生产集群搭建

1.环境准备 1.1 版本选择 序号 bigdata-001 bigdata-002 bigdata-003 bigdata-004 bigdata-005 MySQL-8.0.31 mysql Datax Datax Datax Datax Datax Datax Spark-3.3.1 Spar ......
集群 Spark Hive

MySQL-08.聚合函数和SQL(DQL)的执行流程

C-08 聚合(分组)函数和SQL(DQL)执行流程 上一章,讲到了SQL单行函数。实际上SQL函数还有一类,叫做聚合函数,或者多行,分组函数,它是对一组数据进行汇总的函数,输入的是一组数据的集合,输出的是单个值。 1.聚合函数的介绍 什么是聚合函数 聚合函数作用于一组数据,并对一组数据返回一个值。 ......
函数 流程 MySQL DQL SQL

hive Metastore 启动报错 Version information not found in metastore报错处理

修改 conf/hive-site.xml中的 hive.metastore.schema.verification 设置为false。 hive Metastore 启动报错 [main]: Metastore Thrift Server threw an exception... org.apa ......
共540篇  :2/18页 首页上一页2下一页尾页