hadoop3 hadoop hive3 hive

hadoop系列---【hadoop集群的搭建---(一)环境配置】

#Hadoop集群的搭建 ##一、集群环境配置（准备三台服务器） ###1.设置hostname,/etc/hosts #查看当前host名称 hostname #三台分别设置网络hostname，node01，node02，node03 vi /etc/sysconfig/network NETW ......

hadoop 集群环境更新时间 2023-03-30

docker 搭建大数据集群（hive、hbase、ZooKeeper、Scala、Spark）

1）本机系统设置电脑设置虚拟缓存（设置为自动管理）虚拟机设置内存和CPU 内存设置为8G（或以上） CPU稍微设置高一点（三个虚拟化能开就开）虚拟机系统配置阿里源 wget -O /etc/yum.repos.d/CentOS-Base.repo https://mirrors.aliyun. ......

集群 ZooKeeper 数据 docker Scala更新时间 2023-03-28

Hadoop 学习

关于Hadoop Hadoop崩溃集群重启先停掉进程，sbin/stop-yarn.sh sbin/stop-dfs.sh。然后删除每个集群上datanode的信息。默认在/tmp。如果配置了该目录，就去指定目录删除。data目录和log目录，最后执行格式化namenode format，再重启H ......

Hadoop更新时间 2023-03-26

HIVE库查看版本号

查看hive版本号（web） 1、进入hadoop的CM控制台，找到左边的hive点击进入 2、在hive中，找到状态摘要：Hive Metastore Server 3、在Hive Metastore Server ( Cluster 1 Hive hadoop05 )中，点击‘hadoop05 ......

版本 HIVE更新时间 2023-03-26

hadoop 第二期

Hive 启动hive 使用命令`hive` ==输入命令之后要有一个 ; 结尾！！！！！！！== DDL命令 1.创建数据表 create table lxl( num int, name string, gender string ) row formate delimited fields t ......

hadoop更新时间 2023-03-26

第六章.Hive组件安装配置

第六章.Hive组件安装配置 1.1. 实验目的完成本实验，您应该能够：掌握 Hive 组件安装配置掌握 Hive 组件格式化和启动 1.2. 实验要求熟悉 Hive 组件安装配置了解 Hive 组件格式化和启动 1.3. 实验环境本实验所需之主要资源环境如表 1-1 所示。 | 服务器 ......

组件 Hive更新时间 2023-03-24

春哥甲（Hadoop雷点记录）

“如果你也被春哥击倒，那么套上这个春哥甲吧！！！” 这篇博客主要记录在学习Hadoop中遇到的各种雷点坑点！ WordCountAndLen 在这一节，我们开始尝试使用自定义的类型：WordCountAndLen去实现我们原有的WordCount问题！首先附上WordCountAndLen类的定义 ......

Hadoop更新时间 2023-03-23

hive引入partition和bucket的概念，中文翻译分别为分区和桶

https://www.cnblogs.com/cxzdy/p/5524477.html hive引入partition和bucket的概念，中文翻译分别为分区和桶（我觉的不是很合适，但是网上基本都是这么翻译，暂时用这个吧），这两个概念都是把数据划分成块，分区是粗粒度的划分桶是细粒度的划分，这样做为 ......

partition 概念 bucket hive更新时间 2023-03-23

Springboot 系列 (23) - Springboot+HBase 大数据存储（一）| 安装配置 Apache Hadoop

Apache HBase 是 Apache Hadoop 项目的子项目，是 Hadoop Database 的简称。HBase 是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统，利用 HBase 技术可在廉价 PC Server 上搭建起大规模结构化存储集群。HBase 不同于一般的关系数据库 ......

Springboot 数据 Apache Hadoop HBase更新时间 2023-03-22

hadoop 安装

deban 安装hadoop 文档 1.使用的kvm 创建的虚拟机,创建虚拟机的同时创建 hadoop用户建议使用最简单的安装方式 2.配置 /etc/network/interfaces文件 3.配置/etc/hosts文件,添加如下内容 192.168.20.101 hadoop-master ......

hadoop更新时间 2023-03-22

hive和kudu数据之间的互相迁移存在的坑

一、为什么要进行数据迁移背景：我现在有个需求：需要修改kudu表的主键，主键由1个字段增加为2个字段。因为不能影响下游系统使用kudu表，kudu表表名不能做修改。需要将原kudu表删除后再建新kudu表。这里存在几个潜在知识点： 1.kudu表修改主键不能使用命令直接修改，必须重新删表然后建表 ......

之间数据 hive kudu更新时间 2023-03-22

Hadoop启动后jps没有Datenode的问题

Hadoop启动后jps没有Datenode的问题问题描述最近在学习搭建大数据集群的过程中碰到了一个问题，就是web界面起不来，在start-all.sh启动集群后，输入jps，发现缺少DataNode节点，上网查询了一下，可能是由于多次输入hadoop namenode -format格式化节 ......

Datenode Hadoop 问题 jps更新时间 2023-03-22

工良出品：包教会，Hadoop、Hive 搭建部署简易教程

导读最近一个数据分析朋友需要学习 Hive，刚好我也想学，便利用手头的服务器搭建一个学习环境，但是搭建过程中，发现网上的教程很多过时了，而且部署过程中，很多地方走不通，博主也没有给出对应的说明。花了大力气才从各种资料中完成 Hadoop、Mysql、Hive 三者的部署。因此，本文记录在 Win ......

教会简易教程 Hadoop Hive更新时间 2023-03-22

Hadoop-HA节点介绍

设计思想 hadoop2.x启用了主备节点切换模式（1主1备）当主节点出现异常的时候，集群直接将备用节点切换成主节点要求备用节点马上就要工作主备节点内存几乎同步有独立的线程对主备节点进行监控健康状态需要有一定的选举机制，帮助我们确定主从关系我们需要实时存储日志的中间件 ActiveNam ......

节点 Hadoop-HA Hadoop HA更新时间 2023-03-22

在 Ubuntu 22 的基础上进行 Hadoop 伪分布式（HDFS）的搭建

一、使用VMware安装Ubuntu虚拟机推荐可以再下个Xshell用于操作终端。 Xshell免费版官网下载地址：https://www.xshell.com/zh/free-for-home-school/ 二、伪分布式平台搭建 Part1: 准备工作首先按 ctrl+alt+t 打开终端窗 ......

分布式基础 Ubuntu Hadoop HDFS更新时间 2023-03-22

Centos7系统编译Hadoop3.3.4

1、背景最近在学习hadoop，此篇文章简单记录一下通过源码来编译hadoop。为什么要重新编译hadoop源码，是因为为了匹配不同操作系统的本地库环境。 2、编译源码 2.1 下载并解压源码 [root@hadoop01 ~]# mkdir /opt/hadoop [root@hadoop01 ......

Centos7 Hadoop3 Centos Hadoop 系统更新时间 2023-03-22

Centos7搭建hadoop3.3.4分布式集群

1、背景最近在学习hadoop，本文记录一下，怎样在Centos7系统上搭建一个3个节点的hadoop集群。 2、集群规划 hadoop集群是由2个集群构成的，分别是hdfs集群和yarn集群。2个集群都是主从结构。 2.1 hdfs集群规划 | ip地址 | 主机名 |部署服务| |--|--| ......

分布式集群 Centos7 hadoop3 Centos更新时间 2023-03-22

05安装一个Hadoop分布式集群

安装一个Hadoop分布式集群最小化的Hadoop已经可以满足学习过程中大部分需求，但是为了研究Hadoop集群运行机制，部署一个类生产的环境还是有必要的。因为集群机器比较少，笔者没有配置ssh，所以就需要在每一台机器上手动启动服务。启动上相对繁琐一些，优点是可以高度自定义集群中的任务节点数量，从 ......

分布式集群 Hadoop更新时间 2023-03-22

Sqoop导出ClickHouse数据到Hive

背景公司采购了外部服务，其存储为ClickHouse，按照公司要求需要将其数据采集到Hive。验证环境 CDH: 6.3.2 ClickHouse: 19.15.4.10 Sqoop: 1.4.7 Driver 需要在脚本中明确指明所使用的Driver完整签名。 ClickHouse使用自定义协 ......

ClickHouse 数据 Sqoop Hive更新时间 2023-03-22

使用docker安装hadoop（已实现）

1.拉镜像这里推荐第一个 docker pull registry.cn-hangzhou.aliyuncs.com/hadoop_test/hadoop_base 或者 docker pull qianiqan/hadoop_only 2.创建容器三个容器的名称分别是Master、Slave1 ......

docker hadoop更新时间 2023-03-22

Hadoop如何保证自己的江湖地位？Yarn功不可没

前言任何计算任务的运行都离不开计算资源，比如CPU、内存等，那么如何对于计算资源的管理调度就成为了一个重点。大数据领域中的Hadoop之所以一家独大，深受市场的欢迎，和他们设计了一个通用的资源管理调度平台Yarn密不可分，那Yarn是如何做进行资源管理的呢？它的通用性体现在哪里呢？它是如何保证Ha ......

功不可没地位江湖 Hadoop Yarn更新时间 2023-03-22

一图看懂Hadoop中的MapReduce与Spark的区别：从单机数据系统到分布式数据系统经历了哪些?

今日博主思考了一个问题：Hadoop中的MapReduce与Spark他们之间到底有什么关系？直到我看到了下面这张图废话不多说先上图👇 我们知道，单机数据系统，在本地主机上针对数据有单机本地存储操作（localFS）和单机计算操作（SQL）这是在数据量比较小方便在一台主机就完成任务的情况。 ......

数据系统分布式单机 MapReduce更新时间 2023-03-22

通过Shell脚本自动安装Hive&JDBC测试&提供CDH5网盘地址

〇、参考地址 1、Linux下编写脚本自动安装hive https://blog.csdn.net/weixin_44911081/article/details/121227024?ops_request_misc=%257B%2522request%255Fid%2522%253A%252216 ......

脚本 amp 地址 Shell Hive更新时间 2023-03-22

共713篇 :24/24页 首页上一页21222324下一页尾页