hadoop hdfs

HDFS Short-Circuit Local Reads

1、背景 在HDFS中,读取操作通常是通过DataNode。因此,当客户端要读取文件时,DataNode 会从磁盘上读取文件,然后通过TCP套接字将数据发送给客户端。如果我们的客户端和数据在同一台机器上的时候, 那么是否可以绕过DataNode,允许客户端直接读取数据呢?通过Short-Circui ......
Short-Circuit Circuit Short Local Reads

Hadoop 学习

关于Hadoop Hadoop崩溃集群重启 先停掉进程,sbin/stop-yarn.sh sbin/stop-dfs.sh。然后删除每个集群上datanode的信息。默认在/tmp。如果配置了该目录,就去指定目录删除。data目录和log目录,最后执行格式化namenode format,再重启H ......
Hadoop

hadoop 第二期

Hive 启动hive 使用命令`hive` ==输入命令之后要有一个 ; 结尾!!!!!!!== DDL命令 1.创建数据表 create table lxl( num int, name string, gender string ) row formate delimited fields t ......
hadoop

春哥甲(Hadoop雷点记录)

“如果你也被春哥击倒,那么套上这个春哥甲吧!!!” 这篇博客主要记录在学习Hadoop中遇到的各种雷点坑点! WordCountAndLen 在这一节,我们开始尝试使用自定义的类型:WordCountAndLen去实现我们原有的WordCount问题! 首先附上WordCountAndLen类的定义 ......
Hadoop

Springboot 系列 (23) - Springboot+HBase 大数据存储(一)| 安装配置 Apache Hadoop

Apache HBase 是 Apache Hadoop 项目的子项目,是 Hadoop Database 的简称。HBase 是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用 HBase 技术可在廉价 PC Server 上搭建起大规模结构化存储集群。HBase 不同于一般的关系数据库 ......
Springboot 数据 Apache Hadoop HBase

hadoop 安装

deban 安装hadoop 文档 1.使用的kvm 创建的虚拟机,创建虚拟机的同时创建 hadoop用户 建议使用最简单的安装方式 2.配置 /etc/network/interfaces文件 3.配置/etc/hosts文件,添加如下内容 192.168.20.101 hadoop-master ......
hadoop

Hadoop启动后jps没有Datenode的问题

Hadoop启动后jps没有Datenode的问题 问题描述 最近在学习搭建大数据集群的过程中碰到了一个问题,就是web界面起不来,在start-all.sh启动集群后,输入jps,发现缺少DataNode节点,上网查询了一下,可能是由于多次输入hadoop namenode -format格式化节 ......
Datenode Hadoop 问题 jps

工良出品:包教会,Hadoop、Hive 搭建部署简易教程

导读 最近一个数据分析朋友需要学习 Hive,刚好我也想学,便利用手头的服务器搭建一个学习环境,但是搭建过程中,发现网上的教程很多过时了,而且部署过程中,很多地方走不通,博主也没有给出对应的说明。花了大力气才从各种资料中完成 Hadoop、Mysql、Hive 三者的部署。 因此,本文记录在 Win ......
教会 简易 教程 Hadoop Hive

HDFS节点的分类与作用

文件的数据类型 文件有一个stat命令 元数据信息-->描述文件的属性 文件有一个vim命令 查看文件的数据信息 分类 元数据 File 文件名 Size 文件大小(字节) Blocks 文件使用的数据块总数 IO Block 数据块的大小 regular file:文件类型(常规文件) Devic ......
节点 作用 HDFS

Hadoop-HA节点介绍

设计思想 hadoop2.x启用了主备节点切换模式(1主1备) 当主节点出现异常的时候,集群直接将备用节点切换成主节点 要求备用节点马上就要工作 主备节点内存几乎同步 有独立的线程对主备节点进行监控健康状态 需要有一定的选举机制,帮助我们确定主从关系 我们需要实时存储日志的中间件 ActiveNam ......
节点 Hadoop-HA Hadoop HA

在 Ubuntu 22 的基础上进行 Hadoop 伪分布式(HDFS)的搭建

一、使用VMware安装Ubuntu虚拟机 推荐可以再下个Xshell用于操作终端。 Xshell免费版官网下载地址:https://www.xshell.com/zh/free-for-home-school/ 二、伪分布式平台搭建 Part1: 准备工作 首先按 ctrl+alt+t 打开终端窗 ......
分布式 基础 Ubuntu Hadoop HDFS

hdfs file system shell的简单使用

1、背景 此处我们通过命令行,简单的学习一下 hdfs file system shell 的一些操作。 2、hdfs file system shell命令有哪些 我们可以通过如下网址https://hadoop.apache.org/docs/current/hadoop-project-dis ......
system shell hdfs file

Centos7系统编译Hadoop3.3.4

1、背景 最近在学习hadoop,此篇文章简单记录一下通过源码来编译hadoop。为什么要重新编译hadoop源码,是因为为了匹配不同操作系统的本地库环境。 2、编译源码 2.1 下载并解压源码 [root@hadoop01 ~]# mkdir /opt/hadoop [root@hadoop01 ......
Centos7 Hadoop3 Centos Hadoop 系统

Centos7搭建hadoop3.3.4分布式集群

1、背景 最近在学习hadoop,本文记录一下,怎样在Centos7系统上搭建一个3个节点的hadoop集群。 2、集群规划 hadoop集群是由2个集群构成的,分别是hdfs集群和yarn集群。2个集群都是主从结构。 2.1 hdfs集群规划 | ip地址 | 主机名 |部署服务| |--|--| ......
分布式 集群 Centos7 hadoop3 Centos

05安装一个Hadoop分布式集群

安装一个Hadoop分布式集群 最小化的Hadoop已经可以满足学习过程中大部分需求,但是为了研究Hadoop集群运行机制,部署一个类生产的环境还是有必要的。因为集群机器比较少,笔者没有配置ssh,所以就需要在每一台机器上手动启动服务。启动上相对繁琐一些,优点是可以高度自定义集群中的任务节点数量,从 ......
分布式 集群 Hadoop

使用docker安装hadoop(已实现)

1.拉镜像 这里推荐第一个 docker pull registry.cn-hangzhou.aliyuncs.com/hadoop_test/hadoop_base 或者 docker pull qianiqan/hadoop_only 2.创建容器 三个容器的名称分别是Master、Slave1 ......
docker hadoop

Hadoop如何保证自己的江湖地位?Yarn功不可没

前言 任何计算任务的运行都离不开计算资源,比如CPU、内存等,那么如何对于计算资源的管理调度就成为了一个重点。大数据领域中的Hadoop之所以一家独大,深受市场的欢迎,和他们设计了一个通用的资源管理调度平台Yarn密不可分,那Yarn是如何做进行资源管理的呢?它的通用性体现在哪里呢?它是如何保证Ha ......
功不可没 地位 江湖 Hadoop Yarn

一图看懂Hadoop中的MapReduce与Spark的区别:从单机数据系统到分布式数据系统经历了哪些?

今日博主思考了一个问题:Hadoop中的MapReduce与Spark他们之间到底有什么关系? 直到我看到了下面这张图 废话不多说先上图👇 我们知道,单机数据系统,在本地主机上针对数据有单机本地存储操作(localFS)和单机计算操作(SQL) 这是在数据量比较小方便在一台主机就完成任务的情况。 ......
数据 系统 分布式 单机 MapReduce
共438篇  :15/15页 首页上一页15下一页尾页