hadoop2 hadoop hive 7.2

Hive之set参数大全-1

A 控制是否允许在需要时按需加载用户定义函数（UDF） hive.allow.udf.load.on.demand 是 Apache Hive 中的一个配置属性，用于控制是否允许在需要时按需加载用户定义函数（UDF）。在 Hive 中，UDFs是用户编写的自定义函数，可以在 Hive SQL 查询 ......

参数大全 Hive set更新时间 2024-01-07

Hive之set参数大全-2

C 指定是否启用表达式缓存的评估 hive.cache.expr.evaluation 是 Hive 中的一个配置属性，用于指定是否启用表达式缓存的评估。表达式缓存是一项优化技术，它可以在执行查询时缓存表达式的评估结果，以减少计算开销。在 Hive 配置中，可以使用以下方式设置 hive.cach ......

参数大全 Hive set更新时间 2024-01-07

Hive之set参数大全-3

D 是否启用本地任务调试模式 hive.debug.localtask 是 Apache Hive 中的一个配置参数，用于控制是否启用本地任务调试模式。在调试模式下，Hive 将尝试在本地模式下运行一些任务，以便更容易调试和分析问题。具体来说，当 hive.debug.localtask 被设置为 ......

参数大全 Hive set更新时间 2024-01-07

Hive之set参数大全-4

F 指定在使用 FETCH 命令提取查询结果时的序列化/反序列化器 hive.fetch.output.serde 是 Hive 的一个配置参数，用于指定在使用 FETCH 命令提取查询结果时的序列化/反序列化器。以下是一个示例： -- 设置 hive.fetch.output.serde 为 o ......

参数大全 Hive set更新时间 2024-01-07

大数据本地环境搭建-Zookeeper/Hadoop/Hive搭建

1. Zookeeper环境安装链接：https://pan.baidu.com/s/1wzbCiDxP7H5G_llwjSS3Rw?pwd=wgal 提取码：wgal 1.1 上传tar包 zookeeper-3.4.6.tar 注意：上传文件位置为 /export/server目录 1.2 解 ......

Zookeeper 环境数据 Hadoop Hive更新时间 2024-01-07

设计你生活的Hadoop yarn

去年十月份，我决定考雅思。然而，除了这项任务之外，我还有其他四个主要任务需要同时兼顾：学校的学业、数据结构和算法的学习、LeetCode的刷题以及大数据网课的学习。这五项任务都非常重要，但由于每天可用于学习的时间是固定的，我发现很难在这些任务之间找到平衡。事实上，在当时我并没有达到良好的平衡，因此结 ......

Hadoop yarn更新时间 2024-01-06

hive小记

Hive介绍 1、Hadoop是由java语言编写的，在分布式服务器集群上存储海量数据并运行分布式分析应用的开源框架 2、Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射成一张表，并提供类SQL查询功能 3、Hive处理的数据存储在HDFS，底层实现是MapReduce，执行 ......

小记 hive更新时间 2024-01-06

终于肝完了！全网最全、最详细、最全面的 Hadoop大数据学习教程（ 2023最新版）

大家好，我是民工哥！前面给大家介绍了：关系型数据库 MySQL 、 NoSQL 数据库 Redis 、 MongoDB 、搜索引擎 ElasticSearch 等知识体系学习的文章。在当今这样的就业大背景下，卷是肯定的，强大自己也是必须的。所以，学习不能停，必须一直卷下去。截止今天，又一个知识体 ......

学习教程全网最新版完了面的更新时间 2024-01-05

hive小记

小记 hive更新时间 2024-01-04

Hadoop理论知识

1、Hadoop是什么？ Hadoop是一个由Apache基金会所研发的分布式系统基础架构。主要解决海量数据存储和海量数据的分析计算问题。 2、Hadoop的特点？（1）高可靠性：Hadoop底层维护多个数据副本，所以即使Hadoop某个计算元素或存储出现故障，也不会导致数据的丢失。（2）高扩展 ......

理论知识 Hadoop更新时间 2024-01-03

Hive理论知识

1、什么是Hive？ Hive是基于Hadoop的一个数据仓库工具，它提供了类似SQL的查询语言来进行大规模的数据分析和处理。Hive将结构化的数据映射到Hadoop分布式文件系统（HDFS）上，并通过MapReduce任务执行查询操作。 2、数据模型有哪些？星形模式(Star Schema)：星 ......

理论知识 Hive更新时间 2024-01-03

Hadoop Map/Reduce

Map/Reduce框架运转在<key, value> 键值对上，也就是说，框架把作业的输入看为是一组<key, value> 键值对，同样也产出一组 <key, value> 键值对做为作业的输出，这两组键值对的类型可能不同。框架需要对key和value的类(classes)进行序列化操作， ......

Hadoop Reduce Map更新时间 2024-01-03

Hive事务表转换为非事务表

环境：hive3.1.0 由于建表时默认会建为非事务表 CREATE TABLE bucket_text_table2(column1 string,column2 string,column3 int) CLUSTERED BY (column3) into 5 BUCKETS STORED AS ......

事务 Hive更新时间 2024-01-02

Hive的存储格式

一、简介 1、hive建表时存储格式一般情况下hive在创建表时默认的存储格式是textfile，hive常用的存储格式有五种，textfile、sequencefile、rcfile、orc、parquet。 2、五种存储格式的区别 hive五种存储格式的区别存储格式文件存储编码格式建表指定 ......

格式 Hive更新时间 2024-01-02

使用-数据湖Iceberg和现有hive数仓打通并使用

一、集群配置 1、版本使用技术版本 iceberg 1.3.1 flink 1.16.1 spark 3.2.1 hive 2.3.7 dlc-presto 待定 2、集群配置调整（1）使用hive查询的话所有hiveserver2节点修改hive-site.xml文件，添加jar包，添加如下 ......

Iceberg 数据 hive更新时间 2024-01-02

Hive的表类型

在Hive的学习中，有一个非常重要的知识点，那就是Hive的表类型。 Hive的表类型主要有四种：内部表（受控表）、外部表、分区表、分桶表。一：内部表 ......

类型 Hive更新时间 2024-01-02

Hadoop HA部署

实现Hadoop高可用性部署 Hadoop High Availability（HA）是一种设计模式，用于确保在Hadoop分布式文件系统（HDFS）和资源管理器（ResourceManager）等关键组件中发生故障时，系统能够继续提供服务。HA的目标是减小单点故障对系统可用性的影响，使Hadoop ......

Hadoop更新时间 2023-12-31

Hive基本操作

Hive的基本操作很简单，与SQL的写法很类似，总结如下：进入Hive环境 $HIVE_HOME/bin/hive 数据库操作 CREATE (DATABASE|SCHEMA) [IF NOT EXISTS] database_name [COMMENT database_comment] [LO ......

基本操作 Hive更新时间 2023-12-30

华为云耀云服务器L实例--Hive的部署

华为云耀云服务器L实例--Hive的部署产品官网：https://www.huaweicloud.com/product/hecs-light.html 今天我们采用可靠更安全、智能不卡顿、价优随心用、上手更简单、管理特省心的华为云耀云服务器L实例为例，继续Hive的部署 Hive 是建立在 Ha ......

实例服务器 Hive更新时间 2023-12-29

华为云耀云服务器L实例-大数据学习-Hive的部署-1

华为云耀云服务器L实例-大数据学习-Hive的部署-1 产品官网：https://www.huaweicloud.com/product/hecs-light.html 今天我们采用可靠更安全、智能不卡顿、价优随心用、上手更简单、管理特省心的华为云耀云服务器L实例为例，介绍Hive的部署 Hive ......

实例服务器数据 Hive更新时间 2023-12-29

华为云耀云服务器L实例-大数据学习-hadoop前置准备2-JDK环境部署

华为云耀云服务器L实例-大数据学习-hadoop前置准备2-JDK环境部署产品官网：https://www.huaweicloud.com/product/hecs-light.html 今天我们采用可靠更安全、智能不卡顿、价优随心用、上手更简单、管理特省心的华为云耀云服务器L实例为例，演示单台服 ......

实例环境服务器数据 hadoop更新时间 2023-12-29

华为云耀云服务器L实例-大数据学习-hadoop前置准备1-主机名映射与SSH免密登录

华为云耀云服务器L实例-大数据学习-hadoop前置准备1-主机名映射与SSH免密登录产品官网：https://www.huaweicloud.com/product/hecs-light.html 今天我们采用可靠更安全、智能不卡顿、价优随心用、上手更简单、管理特省心的华为云耀云服务器L实例为例 ......

实例主机服务器数据 hadoop更新时间 2023-12-29

华为云耀云服务器L实例-大数据学习-hadoop前置准备3-防火墙、 SElinux 、时间同步等系统设置

华为云耀云服务器L实例-大数据学习-hadoop前置准备3-防火墙、 SElinux 、时间同步等系统设置产品官网：https://www.huaweicloud.com/product/hecs-light.html 今天我们采用可靠更安全、智能不卡顿、价优随心用、上手更简单、管理特省心的华为云 ......

防火墙实例 SElinux 服务器时间更新时间 2023-12-29

华为云耀云服务器L实例-大数据学习-单台服务器配置伪分布式模式hadoop集群

华为云耀云服务器L实例-大数据学习-单台服务器配置伪分布式模式hadoop集群产品官网：https://www.huaweicloud.com/product/hecs-light.html 今天我们采用可靠更安全、智能不卡顿、价优随心用、上手更简单、管理特省心的华为云耀云服务器L实例为例，演示单 ......

服务器分布式集群实例模式更新时间 2023-12-29

Hive ACID笔记

环境：hive 3.1.0 执行引擎：hive on tez 什么是hive ACID？ hive官网对于ACID的介绍： https://cwiki.apache.org/confluence/display/Hive/Hive+Transactions 中文文档关于ACID的介绍： https: ......

笔记 Hive ACID更新时间 2023-12-29

K8s中下线Hadoop节点（节点下线，调整副本数）

K8s中下线Hadoop节点（节点下线，调整副本数）将Hadoop从三副本修改为双副本，同时修改datanode和nodemanager节点数为2 修改hadoop节点副本数和datanode以及yarn nodemanager节点数： hadoop.hdfs.replication=2 hado ......

节点下线副本 Hadoop K8s更新时间 2023-12-27

Hive安装部署

引言 Apache Hive 是一款建立在 Hadoop 生态系统之上的数据仓库工具，它提供了一种 SQL 类似的查询语言（HiveQL）来查询和分析存储在 Hadoop 分布式文件系统（HDFS）中的大规模数据。Hive 的设计目标是让用户可以在大规模数据集上执行复杂的查询，而无需深入了解 Map ......

Hive更新时间 2023-12-27

hadoop配置

基础准备 sudo apt install ssh pdsh # 安装 ssh sudo apt install openjdk-8-jdk # 安装 jdk8 在.bashrc文件中添加： export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64 ......

hadoop更新时间 2023-12-27

MRS基础组件之HBase与Hive开发应用_tyt2023

MRS基础组件之HBase与Hive开发应用本实验基于MRS环境，介绍如何利用HBase与Hive来进行相关操作。其中，HBase主要介绍包括如何利用Java API创建数据表、写入数据、查看数据以及删除数据；而Hive则通过介绍UDF、UDTF和UDAF等自定义函数的基本操作，讲解如何进行自定义 ......

组件基础 HBase 2023 Hive更新时间 2023-12-27

web访问hive

配置 <property> <name>hive.server2.thrift.port</name> <value>10000</value> </property> <property> <name>hive.server2.thrift.bind.host</name> <value>slav ......

hive web更新时间 2023-12-26

共790篇 :2/27页 首页上一页12345下一页尾页