emr-hive openldap hive emr

Hive-DDL

学会了Hive的一些操作，发现Hive建过表，后续的数据并不是向MySQL是通过自己手写进行插入的，而是将TXT文件解析成为数据表的操作。其实是HDFS将文件映射成Hive表，然后然后通过写类SQL的语句来操作该文件，底层会被解析成为MR程序。 Hive的本质把HDFS文件映射成一张Hive表, ......

Hive-DDL Hive DDL更新时间 2023-06-08

Hive执行计划之hive依赖及权限查询和常见使用场景

[TOC] ## 概述 Hive查看执行计划的命令中还有两个不怎么常用但很重要的命令，接下来详细介绍一下。有一个问题：**如何在hiveSQL执行之前就探查到这段逻辑的血缘依赖关系？** hive血缘是很多生产级数仓必须要提供的功能，大多数解决方案都是**使用hive hooks的方法通过SQL执 ......

场景权限常见 Hive hive更新时间 2023-06-07

Hive - 多种表类型的CURD测试

关于torc、textfile、orc、es、hyperdrive表的CURD测试 TORC（支持事务的orc表）测试 TORC（分区表）测试 TEXTFILE 表测试 ORC 表测试 ES（ElasticSearch表）测试 hyperdrive 表测试 TORC（支持事务的orc表）测试 -- ......

多种类型 Hive CURD更新时间 2023-06-07

Hive - hive 安装部署

Hadoop - 分布式部署 > Hive - 安装部署准备工作安装部署准备工作 Hive版本：apache-hive-3.1.2 Hive官网：https://hive.apache.org/ Hive下载地址：https://downloads.apache.org/hive/ 角色部署： ......

Hive hive更新时间 2023-06-07

RDS 、HDFS、 mapreduce 、spark 、hive、 hbase 、zookeeper 、kafka 、flume、mysql 安装时之间配置文件是如何依赖的？

这些技术是大数据领域的常用组件，它们之间的配置文件依赖关系如下： RDS是一种关系型数据库，可以独立安装和使用，不需要依赖其他组件。 HDFS是Hadoop分布式文件系统，通常与MapReduce一起使用。在Hadoop集群中，HDFS需要配置core-site.xml和hdfs-site.xml两 ......

mapreduce zookeeper 之间文件 hbase更新时间 2023-06-06

Hive执行计划之一文读懂Hive执行计划

**目录** [TOC] ## 概述 Hive的执行计划描述了一个hiveSQL语句的具体执行步骤，通过执行计划解读可以了解hiveSQL语句被解析器转换为相应程序语言的执行逻辑。通过执行逻辑可以知晓HiveSQL运行流程，进而对流程进行优化，实现更优的数据查询处理。同样，通过执行计划，还可以了解 ......

Hive更新时间 2023-06-06

hive初识

## **HIVE的认识：** #### 定义： hive 是基于 hadoop 的数据仓库工具，将结构化的数据映射成一张表，提供sql查询功能，可以对数据提取，转化，加载，简而言之：查询和分析存储在 hadoop大规模的数据工具，离线的大数据分析 #### hive在hadoop的生态圈 hiv ......

hive更新时间 2023-06-03

Spark集成Hive

### 命令行集成Hive 将hive中的`hive-site.xml`配置文件拷贝到spark配置文件目录下，仅需要以下内容 ```xml hive.metastore.warehouse.dir /user/hive/warehouse javax.jdo.option.ConnectionUR ......

Spark Hive更新时间 2023-06-02

hive - beeline命令行可以使用的命令

beeline> !help !all Execute the specified SQL against all the current connections !autocommit Set autocommit mode on or off !batch Start or execute a ......

命令 beeline hive更新时间 2023-06-01

Hive扩展内容

### 一个SQL语句的分析 ```sql SELECT a.Key, SUM(a.Cnt) AS Cnt FROM ( SELECT Key, COUNT(*) AS Cnt FROM TableName GROUP BY Key, CASE WHEN Key = 'KEY001' THEN Ha ......

内容 Hive更新时间 2023-06-01

Hive高级函数实战

### 函数的基本操作和mysql一样的，hive也是一个主要做统计的工具，所以为了满足各种各样的统计需要，它也内置了相当多的函数 ```sql show functions; # 查看所有内置函数 desc function functionName; # 查看指定函数的描述信息 desc fu ......

函数实战 Hive更新时间 2023-06-01

【博学谷学习记录】超强总结，用心分享 | hive

【博学谷IT技术支持】 # 一、介绍 `hive`是基于`hadoop`的数据仓库工具，用来进行数据的提取、转化、加载，是一种可以存储、查询和分析存储在`hadoop`中的大规模数据机制。`hive`将结构化的数据文件映射为一张数据库表，并提供`SQL`查询功能，将SQL语句变成`MapReduce ......

hive更新时间 2023-06-01

博学谷学习记录】超强总结，用心分享 | hive的内置函数

【博学谷IT技术支持】 # 操作 ## 内置函数 ### 数学函数 - 取整函数round ``` -- 取整函数第一个为值，第二个为保留几位小数，取证规则四舍五入 select round(2.2222); -- 2 select round(2.5); 3 select round(2.555 ......

函数 hive更新时间 2023-06-01

【博学谷学习记录】超强总结，用心分享 | hive 查询、分组、join

【博学谷IT技术支持】 ## 查询 ### 常用函数 - 常用函数 ``` 常用函数 -- 求总行数（count） select count(1) from score; -- 36 -- 求分数的最大值（max） select max(sscore) from score; 99 -- 求分数的最 ......

hive join更新时间 2023-06-01

【博学谷学习记录】超强总结，用心分享 | hive 日期函数与条件函数

【博学谷IT技术支持】公众号: 积雷山摩云洞，欢迎关注！！！ # 操作 ## 日期函数 - 获取当前时间 ``` -- 获取当前时间 -- 获取年月日 select `current_date`(); -- 2022-10-30 -- 获取年月日时分秒 select `current_timest ......

函数条件日期 hive更新时间 2023-06-01

【博学谷学习记录】超强总结，用心分享 | hive分区与分桶的区别

【博学谷IT技术支持】公众号: 积雷山摩云洞，欢迎关注！！！ # 概念 - 分区表：将数据分散到多个子目录中，在执行查询是，可以根据条件加快查询效率 - 分桶表：是相对分区更细的颗粒度划分，分桶表是将表查分到不同的文件中，根据数据表某列的hash值进行分区，对某列数据分区就是对该列属性值的has ......

hive更新时间 2023-06-01

Hive核心实战

### Hive中数据库的操作 ```sql show databases; # 查看数据库列表 use default; # 选择数据库 create database mydb1; # 创建数据库 create database mydb2 location '/user/hive/mydb2' ......

实战核心 Hive更新时间 2023-05-31

Hive中的表类型

在Mysql中没有表类型这个概念，因为它就只有一种表。但是Hive中是有多种表类型的，我们可以分为四种，内部表、外部表、分区表、桶表下面来一个一个学习一下这些类型的表 ### 内部表内部表也可以称为受控表，它是Hive中的默认表类型，表数据默认存储在 warehouse 目录中。在加载数据的过 ......

类型 Hive更新时间 2023-05-31

Hive基础使用

### Hive的使用方式可以在Shell命令行下操作Hive，或者使用JDBC代码的方式操作 ### 命令行方式针对命令行这种方式，其实还有两种使用 - 第一个是使用bin目录下的hive命令，这个是从hive一开始就支持的使用方式 - 后来又出现一个beeline命令，它是通过HiveSer ......

基础 Hive更新时间 2023-05-31

Hive - 言出法随

-- 显示当前数据库 select current_database(); -- 设置hive属性在命令行显示当前数据库 set hive.cli.print.current.db=true; ......

言出法随 Hive更新时间 2023-05-31

Hive详解

### 什么是Hive Hive是建立在Hadoop上的数据仓库基础构架。它提供了一系列的工具，可以用来进行数据提取转化加载，可以简称为ETL。 Hive 定义了简单的类SQL查询语言，称为HQL，它允许熟悉SQL的用户直接查询Hadoop中的数据，同时，这个语言也允许熟悉MapReduce的开发者 ......

Hive更新时间 2023-05-30

Hive的分区、分桶

Hive的分区表、分桶表一、 Hive库的分区表 1.1概述 Hive 中的表对应为 HDFS 上的指定目录，在查询数据时候，默认会对全表进行扫描，这样时间和性能的消耗都非常大。分区为 HDFS 上表目录的子目录，数据按照分区存储在子目录中。如果查询的 where 字句的中包含分区条件，则直接从 ......

Hive更新时间 2023-05-29

hive优秀文章

hiveserver2源码：转 Hive源码分析——HiveServer2启动过程 https://zhizhi.pcwanli.com/front/article/9514.html 【原创】大数据基础之Hive（1）Hive SQL执行过程之代码流程 https://blog.csdn.net ......

文章 hive更新时间 2023-05-28

本地spark通过spark集群连接hive

最近在学习spark，上周将spark集群搭建起来了，今天在idea中创建了一个测试程序读取hive库中的数据，程序很简单，但是踩到一些坑，卡了四五个小时，做个记录。搭建Spark集群比较简单： 1、安装scala，scala版本要和spark使用的scala版本一致（因为这个问题卡了五六个小时） ......

spark 集群 hive更新时间 2023-05-27

Centos7安装配置Hive

Centos7安装配置 # 一、安装安装就不多做详述,选择好自己的镜像设置好路径即可 # 二、配置 #### 2.1 网络配置桌面右键进入 `cmd` 命令编辑窗口,在 Linux 中设置网络的相关配置都需要管理员权限,需要先切换到 root 用户。 ```markdown vim /et ......

Centos7 Centos Hive更新时间 2023-05-26

hive(七) -- 拉链表、数据存储及优化配置

## 拉链表 ### 数据同步问题 Hive在实际工作中主要用于构建离线数据仓库，定期的从各种数据源中同步采集数据到Hive中，经过分层转换提供数据应用。比如每天需要从MySQL中同步最新的订单信息、用户信息、店铺信息等到数据仓库中，进行订单分析、用户分析。 ![image](https://img ......

拉链数据 hive更新时间 2023-05-25

hive(六)

## 函数 Hive的函数分为两大类∶内置函数(Built-in Functions )、用户定义函数UDF (User-Defined Functions ) . 内置函数可分为︰数值类型函数、日期类型函数、字符串类型函数、集合函数、条件函数等; 用户定义函数根据输入输出的行数可分为3类:UDF、 ......

hive更新时间 2023-05-24

hive学习基础与调优

一、Hive基础知识 Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供类SQL查询功能（hive的HQL语法设计实际模仿Mysql的语法）。其本质是将SQL转换为MapReduce的任务进行运算，底层由HDFS来提供数据的存储，说白了hive可以理解为一 ......

基础 hive更新时间 2023-05-24

hive查询练习

## 练习1 ```SQl 2022-08-07 1,liuyan 2,tangyan 3,jinlian 4,dalang 5,ximenqing 2022-08-08 1,liuyan 2,tangyan 4,dalang 6,wusong -- 创建分区表记录每天用户登陆信息 create t ......

hive更新时间 2023-05-23

Hive函数大全

Hive内部提供了很多函数给开发者使用，包括数学函数，类型转换函数，条件函数，字符函数，聚合函数，表生成函数等等，这些函数都统称为内置函数。数学函数 Return Type Name (Signature) Description DOUBLE round(DOUBLE a) Returns th ......

函数大全 Hive更新时间 2023-05-23

共438篇 :12/15页 首页上一页9101112131415下一页尾页