hadoop

Hadoop 配置日志聚集

本文章的前置Hadoop-3.3.6分布式集群搭建步骤 概念: 集群中的每台Hadoop节点的运行都会产生日志,开启日志聚集后,将所有运行日志信息上传到Hadoop HDFS系统上,可以更好的查看运行详情,方便开发及调试。 注意:需要重启NodeManage、ResourceManager和Hist ......
Hadoop 日志

hadoop高可用集群集成hive

hive和hadoop的关系 从上图可以看出实际上外界是通过thrift server这个节点和hadoop的hdfs以及rm进行交互的,中间为driver 因此当我修改完hadoop集群为高可用的时候,hive也需要重新配置环境以下是我hive的全新配置 <configuration> <!-- ......
集群 hadoop hive

Hadoop API 通过租户代理访问 Kerberos 安全 Hadoop 集群

这里记录一些方法,具备下面的特征: * 通过租户代理访问 Kerberos 认证的 HADOOP 资源 * 获取 FileSystem 对象的技巧:FileSystem.get(URI, configuration) * 通用 doAs模板 * 通用 hdfsCommand模板,使用 try-wit... ......
Hadoop 租户 集群 Kerberos API

四、Hadoop-HA 与 Hadoop-federation

一、Hadoop-HA 1.1 Hadoop1.x带来的问题 1、单点故障 a. 每个群集同一时刻只能有一个NameNode,NameNode存在单点故障(SPOF)。 ​ b. 如果该计算机或进程不可用,则整个群集在整个NameNode重新启动或在另一台计算机上启动之前将不可用 ​ c. 如果发生 ......

二、Hadoop集群搭建与学习

Hadoop集群搭建(完全分布式版本) 一、准备工作 三台虚拟机:master、node1、node2 时间同步(3.x版本不用做) ntpdate ntp.aliyun.com 调整时区 3.x版本不用做) cp /usr/share/zoneinfo/Asia/Shanghai /etc/loc ......
集群 Hadoop

Hadoop MapReduce 历史服务器配置

1.在mapred-site.xml中配置历史服务器 <?xml version="1.0"?> <?xml-stylesheet type="text/xsl" href="configuration.xsl"?> <configuration> <!-- 设置MapReduce程序默认运行模式: ......
MapReduce 服务器 Hadoop 历史

Hadoop 常用命令

1.文件类 1.新建文件夹 hadoop fs -mkdir {folderName} hadoop fs -mkdir /coreqi 2.上传文件 hadoop fs -put {localPath} {hadoopPath} hadoop fs -put /home/coreqi.txt /c ......
命令 常用 Hadoop

Hadoop-3.3.6分布式集群搭建步骤

1.下载JDK8 Linux 安装Openjdk 2.下载Hadoop3.3.6 Hadoop 安装及环境变量配置 3.创建hadoop数据存储的目录 mkdir -p /opt/hadoop/tmp /opt/hadoop/hdfs/data /opt/hadoop/hdfs/name 4.配置h ......
分布式 集群 步骤 Hadoop

Hadoop运行模式之本地模式(wordcount)

本地模式总结起来大概有以下几点: 单机运行,常用来演示,生产环境不适用 文件存储在操作系统的文件系统中而非Hadoop的HDFS中 1.安装JDK https://www.cnblogs.com/fanqisoft/p/16949738.html 2.安装Hadoop https://www.cnb ......
模式 wordcount Hadoop

Hadoop 环境变量配置

1.下载 https://hadoop.apache.org/releases.html 2.环境变量配置 在/etc/profile.d中配置 1.新建hadoop.sh vi /etc/profile.d/hadoop.sh export HADOOP_HOME=/usr/hadoop/hado ......
变量 环境 Hadoop

一、Hadoop概述与初步学习

一、Hadoop的发展史 Google 爬取全球的网站,然后计算页面的PageRank 要解决网站的问题: a:这些网站怎么存放 b:这些网站应该怎么计算 发布了三篇论文 a:GFS(Google File System) b:MapReduce(数据计算方法) c:BigTable-->HBase ......
Hadoop

运行hadoop version时出现 此时不应有 \Hadoop\hadoop-3.2.4\bin\

在Windows环境下cmd运行Hadoop version命令时出现 此时不应有 \Hadoop\hadoop-3.2.4\bin\ 报错 在网上查到是因为环境变量的路径中有空格,但是我通过 where Java 和where hadoop 都没有发现空格 但是我的路径中存在括号,当尝试将括号删除 ......
hadoop version Hadoop bin

阿里云centos+Docker+hadoop

在阿里云上搭建hadoop 镜像:centos 容器:docker 软件:hadoop 阿里云centos+Docker+hadoop Docker 在Centos7下面安装docker (1)移除旧版: yum remove docker \ docker-client \ docker-clie ......
centos Docker hadoop

hadoop的文件存储格式parquet

hadoop 里支持许多压缩算法。压缩的好处主要有两点:1. 减少了文件占用的存储空间,原来上 T 的文件可能压缩完以后只需要两三百 G 的空间即可;2. 文件的体积小了以后,数据传输的速度自然就快了。在现在的大数据环境下,这两点显得更加重要。所以现在 hdfs 文件系统上存的文件,如果数据量大到一 ......
parquet 格式 文件 hadoop

Hadoop学习(一) 搭建伪分布式集群

文章结构 1.准备工作 1.1 配置IP 1.2 关闭防火墙 1.3 修改主机名并与IP绑定 1.4 创建新用户 1.5 配置免密匙 2.安装并配置Hadoop伪分布式集群 2.1 安装Java 2.2 安装配置Hadoop伪分布式集群 1.准备工作 1.1 配置IP 首先进入该路径下 cd /et ......
分布式 集群 Hadoop

hadoop fs -test的相关命令

Hadoop FileSystem(HDFS)提供了多种命令来检查文件系统的状态和操作。以下是一些常用的hadoop fs -test命令: hadoop fs -test -e <path>: 检查指定路径是否存在。如果存在,返回0;否则返回非0值。 hadoop fs -test -d <pat ......
命令 hadoop test fs

11.9 hadoop学习

今天重新配置了hadoop,hbase,zookeeper,hive。 zk.sh start 启动zookeeperzk.sh stop 关闭zookeeperzk.sh status 查看zookeeper状态hbs.sh start 启动hbasehbs.sh stop 关闭hbaseall. ......
hadoop 11.9 11

20231107学习总结-大型数据库-实验1.熟悉常用的Linux操作和Hadoop操作

实验1 熟悉常用的Linux操作和Hadoop操作 1.实验目的 Hadoop运行在Linux系统上,因此,需要学习实践一些常用的Linux命令。本实验旨在熟悉常用的Linux操作和Hadoop操作,为顺利开展后续其他实验奠定基础。 2.实验平台 (1)操作系统:Linux(建议Ubuntu16.0 ......
20231107 常用 数据库 数据 Hadoop

Hadoop:Yarn资源调度

1、Yarn是什么? Apache Hadoop YARN (Yet Another Resource Negotiator 另一种资源协调者)是一种新的Hadoop资源管理器,提供一个通用资源管理系统和调度平台,可为上层应用提供统一的资源管理和调度。可以把Hadoop YARN理解为相当于一个分布 ......
Hadoop 资源 Yarn

Hadoop-3.3.3分布式集群的文件配置,启动hadoop历史服务和启动日志聚集

一、分布式集群的文件配置 涉及$HADOOP_HOME/etc/hadoop路径下的5个文件 workers、core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml 首先修改workers 进入$HADOOP_HOME/etc/hadoop ......
分布式 集群 文件 Hadoop hadoop

云计算-hadoop的安装(书接上回+分布式搭建)

书接上回,这次来进行分布式集群的搭建。 执行命令:echo $JAVA_HOME 查看路径,我的路径如图所示: 然后在/usr/local/hadoop目录下,执行命令gedit ./etc/hadoop/hadoop-env.sh 打开文本,然后再第一行添加刚刚的路径,如图所示: 因为之前一节咱们 ......
分布式 hadoop

hadoop 将nn节点的环境配置同步到dn节点

使用scp命令克隆配置 输入 sudo scp -r jdk1.8.0_391/ hxf@slaver2:/opt/module 报错ssh: Could not resolve hostname hxf: Temporary failure in name resolution lost conn ......
节点 环境 hadoop

Finalshell给虚拟机安装JDK1.8,hadoop-3.3.3,hive3.1.2并配置环境

点击红框按钮,把下载好的jdk,hadoop,hive安装包上传到指定路径 我的路径是/home/用户名/Downloads 查看上传文件 sudo tar -zxvf /home/hxf/Downloads/jdk-8u391-linux-x64.tar.gz -C /opt/module/ su ......
Finalshell 环境 hadoop hive3 JDK1

Hadoop3.x和Hive3.x环境搭建

Hadoop3.3.6 创建hadoop用户 useradd hadoop su - hadoop ssh-keygen -t rsa cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys chmod 0600 ~/.ssh/authorized_keys ......
Hadoop3 环境 Hadoop Hive3 Hive

hadoop 基础学习

......
基础 hadoop

hadoop 基础组件详解

......
组件 基础 hadoop

hadoop初体验1——官方案例pi值计算

1.执行命令 [hadoop@namenode mapreduce]$ hadoop jar hadoop-mapreduce-examples-3.3.6.jar pi 2 2 hadoop jarHadoop jar命令 hadoop-mapreduce-examples-3.3.6.jar程序 ......
案例 官方 hadoop

hadoop初体验2——官方案例wordcount

1.命令 [hadoop@namenode mapreduce]$ hadoop jar hadoop-mapreduce-examples-3.3.6.jar wordcount /wordcount/input /wordcount/output 执行命令hadoop jar hadoop-ma ......
wordcount 案例 官方 hadoop

Hadoop三大组件(HDFS,MapReduce,Yarn)

1、HDFS HDFS是Hadoop分布式文件系统。一个HDFS集群是由一个NameNode和若干个DataNode组成的。其中NameNode作为主服务器,管理文件系统的命名空间和客户端对文件的访问操作;集群中的DataNode管理存储的数据。 2、MapReduce MapReduce是一个软件 ......
组件 MapReduce 三大 Hadoop HDFS

window10安装单机hadoop

一、配置jdk 默认已配置 二、下载hadoop3.2.2 http://archive.apache.org/dist/hadoop/common/hadoop-3.2.2/ 三、下载hadoop-winutils https://github.com/cdarlint/winutils 下载后将 ......
单机 window hadoop 10