hadoop3 hadoop hive3 hive

Hadoop的运行模式

Hadoop官方网站 http://hadoop.apache.org/ Hadoop运行模式本地模式：单机运行，只是用来演示一下官方案例。生产环境不用。伪分布式模式：也是单机运行，但是具备Hadoop集群的所有功能，一台服务器模拟一个分布式的环境。个别缺钱的公司用来测试，生产环境不用。完全分 ......

模式 Hadoop更新时间 2023-05-08

hadoop前期环境搭建

主机名 ip ssh免密登陆 #修改主机名 hostnamectl set-hostname node1 #修改ip地址 vim /etc/sysconfig/network-scripts/ifcfg-ens33 #node1 IPADDR="192.168.88.101" NETMASK="22 ......

前期环境 hadoop更新时间 2023-05-08

【大数据】Hive Join 的原理与机制

一、概述 Hive是一个基于Hadoop的数据仓库解决方案，它提供了类似于SQL的查询语言，称为HiveQL，用于处理结构化数据。在Hive中，JOIN操作用于将两个或多个表中的数据连接在一起，以便进行联合查询和分析。 Hive 中的 Join 可分为 Common Join（Reduce阶段完成 ......

原理机制数据 Hive Join更新时间 2023-05-07

基于Hadoop3.1.3安装Hive3.1.2

Hive是什么？ \t Hive 是一个基于 Hadoop 的数据仓库工具，它提供了类似 SQL 的查询语言 HQL（Hive Query Language），使得开发人员可以使用类 SQL 语言来查询和处理存储在大规模分布式文件系统（如 HDFS）中的数据。 Hive有哪些功能？ Hive 的主 ......

Hadoop3 Hadoop Hive3 Hive 1.3更新时间 2023-05-06

[Hadoop] 在集群中安装Hadoop

[Hadoop] 在集群中安装Hadoop 类似的教程其实有很多，网上随便一搜就是一大把。这里简单的记录一下本人的安装过程，留给本人或者后人参考。集群配置内网互联的三台机器，IP分别为10.0.0.1,10.0.0.2,10.0.0.3。我们的目标配置是让10.0.0.1做主节点，也就是mas ......

Hadoop 集群更新时间 2023-05-06

hadoop 3.3.5伪分布式集群部署

hadoop包下载 https://archive.apache.org/dist/hadoop/common/ 安装好jdk并配置环境变量下载hadoop压缩包并放至 /data/hadoop目录解压 tar -zxvf hadoop-3.3.5.tar.gz 1配置 1.1在Hadoop安装 ......

分布式集群 hadoop更新时间 2023-05-06

【大数据】Hive DDL 操作与视图讲解

一、概述 Hive是建立在Hadoop上的数据仓库工具，它允许用户通过类SQL的语法来查询和管理数据。在Hive中，DDL（数据定义语言）和视图操作是非常常见的。 1）表和视图关系表和视图都是数据存储的逻辑表示方式。它们之间有以下关系：视图可以基于一个或多个表创建，而表不可以基于其他表或视图创建 ......

视图数据 Hive DDL更新时间 2023-05-05

【大数据】Hive 内置函数和 UDF 讲解

一、概述 Hive是基于Hadoop的一个数据仓库工具，可以将结构化数据文件映射为一张数据库表，并提供类SQL语句操作。Hive内置了很多函数，可以满足基本的查询需求，同时还支持自定义函数(UDF)来实现更加灵活的操作。官方文档：https://cwiki.apache.org/confluenc ......

函数数据 Hive UDF更新时间 2023-05-05

Hadoop之HDFS的API操作文件的上传下载参数的优先级

Hadoop之HDFS的API操作文件的上传下载参数的优先级 package com.itnihao.hdfs; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FileSystem; import o ......

上传下载优先级参数文件 Hadoop更新时间 2023-05-05

DB - HDFS (Hadoop Distributed File System)

Hadoop Distributed File System，简称 HDFS，是一个分布式文件系统。 HDFS 有着高容错性（fault-tolerent）的特点，并且设计用来部署在低廉的（low-cost）硬件上。而且它提供高吞吐量（high throughput）来访问应用程序的数据，适合那些有 ......

Distributed Hadoop System HDFS File更新时间 2023-05-04

Hadoop运行集群搭建

Hadoop运行集群搭建虚拟机环境准备安装虚拟机及基本配置 IP地址192.168.10.100、主机名称hadoop100,内存4G、硬盘50G 测试下虚拟机联网情况 1 [root@hadoop100 ~]# ping www.baidu.com 2 PING www.baidu.com ( ......

集群 Hadoop更新时间 2023-05-04

【大数据】Hive 分区和分桶的区别及示例讲解

一、概述在大数据处理过程中，Hive是一种非常常用的数据仓库工具。Hive分区和分桶是优化Hive性能的两种方式，它们的区别如下： 1）分区概述 Hive分区是把数据按照某个属性分成不同的数据子集。在Hive中，数据被存储在HDFS中，每个分区实际上对应HDFS下的一个文件夹，这个文件夹中保存了 ......

示例数据 Hive更新时间 2023-05-03

Mapreduce二次排序时，将jar包上传至Hadoop上运行时，抛出异常"java.util.NoSuchElementException"

查询原因后发现是java中实现实现Mapper时StringTokenizer 类时使用了一个方法nextToken()会抛出这个异常， ”我们可以使用 hasMoreTokens() 和 hasMoreElements() 方法来避免异常。如果标记器的字符串中有更多标记可用，则这两种方法都返回 t ......

NoSuchElementException quot Mapreduce Hadoop java更新时间 2023-05-02

Hadoop集群运行

1. 实验一：hadoop 集群运行实验任务一：配置 Hadoop 格式化步骤一：NameNode 格式化 [root@master ~]# su - hadoop [hadoop@master ~]$ cd /usr/local/src/hadoop/ 结果： [hadoop@master ~ ......

集群 Hadoop更新时间 2023-04-30

Hadoop全分布配置

1.实验一：hadoop 全分布配置 1.1. 实验目的完成本实验，您应该能够：掌握 hadoop 全分布的配置掌握 hadoop 全分布的安装掌握 hadoop 配置文件的参数意义 1.2. 实验要求熟悉 hadoop 全分布的安装了解 hadoop 配置文件的意义 1.3. 实验环境 ......

Hadoop更新时间 2023-04-30

hadoop平台安装

Hadoop平台安装 1.实验一：Linux 操作系统环境设置 1.1. 实验目的完成本实验，您应该能够：掌握 linux 操作系统环境设置掌握 hadoop 安装的环境要求 1.2. 实验要求熟悉常用 Linux 操作系统命令熟悉 hadoop 安装的环境了解 linux 修改系统变量 ......

hadoop 平台更新时间 2023-04-30

Hive单机安装与测试

安装MySQL并运行在当前用户下运行 sudo apt update sudo apt install mysql-server 安装成功后启动MySQL服务，运行 sudo service mysql start 查看MySQL的默认用户名和密码，运行 sudo cat /etc/mysql/d ......

单机 Hive更新时间 2023-04-30

单机版hadoop在Linux环境下的安装和配置

创建hadoop用户首先打开终端窗口，输入如下命令创建hadoop用户，这条命令创建可以登录的hadoop用户，并使用/bin/bash作为shell： $ sudo useradd -m hadoop -s /bin/bash 接着为hadoop设置登录密码，可简单设为123456，按提示输入两 ......

单机版单机环境 hadoop Linux更新时间 2023-04-30

hive on spark报错

Error in query: Detected implicit cartesian product for LEFT OUTER join between logical plansUnion Join condition is missing or trivial.Either: use th ......

spark hive on更新时间 2023-04-28

Hadoop启动集群报错:Starting namenodes on [hadoop01] hadoop01: root@hadoop01: Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password).

搭建三个hadoop集群的时候,master没有启动namenode和datanode，报错: Starting namenodes on [hadoop01]hadoop01: root@hadoop01: Permission denied (publickey,gssapi-keyex,gs ......

hadoop gssapi gssapi-with-mic 集群 gssapi-keyex更新时间 2023-04-28

共760篇 :21/26页 首页上一页18192021222324下一页尾页

526互联

hadoop3 hadoop hive3 hive

Hadoop的运行模式

hadoop前期环境搭建

【大数据】Hive Join 的原理与机制

基于Hadoop3.1.3安装Hive3.1.2

[Hadoop] 在集群中安装Hadoop

hadoop 3.3.5伪分布式集群部署

【大数据】Hive DDL 操作与视图讲解

【大数据】Hive 内置函数和 UDF 讲解

Hadoop之HDFS的API操作文件的上传下载参数的优先级

DB - HDFS (Hadoop Distributed File System)

Hadoop运行集群搭建

【大数据】Hive 分区和分桶的区别及示例讲解

Mapreduce二次排序时，将jar包上传至Hadoop上运行时，抛出异常"java.util.NoSuchElementException"

Hadoop集群运行

Hadoop全分布配置

hadoop平台安装

Hive单机安装与测试

单机版hadoop在Linux环境下的安装和配置

hive on spark报错

Hadoop启动集群报错:Starting namenodes on [hadoop01] hadoop01: root@hadoop01: Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password).

Hadoop概述

2-Hadoop集群配置-安装-启动

Hadoop-HDFS压测】针对HDFS进行读写性能测试

Hadoop集群搭建总结

从0-1_Hadoop安装

头歌平台——Hadoop开发环境搭建

Ubuntu系统python连接hive遇到的一些问题

Hive On Spark调优

Hadoop操作

datax从hive向pg同步踩的坑