hadoop

云计算-hadoop的安装

云计算的课程，主要还是要梳理逻辑（尽管我不是做这个方向的，但是课程还是要好好完成！）前提：安装好虚拟机VirtualBox，并且下载好Ubuntu的光盘映像文件。文章思路： 1.配环境（SSH免密码登录，JAVA环境）２.配Hadoop（下载包，配置相应的环境）３.运行（感受一下实际例子） ......

hadoop更新时间 2023-10-26

Hadoop-大数据组件版本号查看

1．操作系统 cat /etc/redhat-release ; 2．JDK java -version 3．SCALA scala --version 4．MySQL mysql --version 5．Zookeeper ps -ef | grep -E “zookeeper-.*.jar” 6 ......

组件版本数据 Hadoop更新时间 2023-10-26

【1】基于docker搭建hadoop+hive+spark+hbase+zookeeper+scale集群

1、设置主机上的虚拟缓存当本地内存不足时，可以使用虚拟内存将一些内存数据转移到硬盘上，从而扩展计算机的内存容量。这样可以让计算机运行更复杂、更占用内存的程序，不会出现内存不足的情况。减轻物理存储器不足的压力，设置虚拟内存可以在内存不够的情况下将缓存一时放在硬盘上，解决内存不足问题。通过虚拟内存， ......

集群 zookeeper docker hadoop hbase更新时间 2023-10-24

基于docker容器，搭建hadoop+spark+hive+hbase+Zookeeper Scala集群

1.安装Docker和Docker Compose 2.下载镜像 docker pull bde2020/hadoop-base:2.0.0-hadoop3.2.1-java8 docker pull bde2020/hadoop-namenode:2.0.0-hadoop3.2.1-java8 d ......

集群容器 Zookeeper docker hadoop更新时间 2023-10-24

两台实体机器4个虚拟机节点的Hadoop集群搭建（Ubuntu版）

安装Ubuntu Linux元信息两台机器，每台机器两台Ubuntu Ubuntu版本：ubuntu-22.04.3-desktop-amd64.iso 处理器数量2，每个处理器的核心数量2，总处理器核心数量4 单个虚拟机内存8192MB（8G），最大磁盘大小30G 参考链接清华大学开源软件镜像 ......

节点集群实体机器 Hadoop更新时间 2023-10-22

报错Failed to execute spark task, with exception 'org.apache.hadoop.hive.ql.metadata.HiveException(Failed to create Spark client for Spark session 768047b9-c7f7-459f-9220-5d8d7bdabefe)

在执行hive on spark的时候上面的错误可能有以下几种问题： 1.版本问题不匹配 2.时间参数问题设置的参数太小了 3.在hive-site.xml文件中没有配置spark 的home 我的问题属于第一个问题导致没有跑成功当时也在想是不是内存出现了问题 ......

Failed Spark HiveException exception 7bdabefe更新时间 2023-10-22

hadoop集群大数据项目实战_电信用户行为分析_day04

进行HIVE环境配置 1.上传相关的包 2.对上传的包进行下载和创建软连接 3.配置相关的文件 4.分别发送给其他机子假设你需要在所有机器执行同一个指令，则你就需要相关设置 5.在hive的onf文件中创建hive-site.xml进行相关设置 ```xml<configuration> <-- ......

行为分析大数集群实战行为更新时间 2023-10-20

hadoop官方文档解读

Hadoop是一个分布式计算框架，用于存储和处理大规模数据集。首先搞清楚为什么需要使用Hadoop Hadoop进行数据处理可以充分利用分布式计算和存储的优势，适用于大规模数据的批处理和分布式计算场景。裸机上进行数据处理则更适合小规模数据或需要实时处理的场景。在裸机上进行数据处理和使用Hado ......

文档官方 hadoop更新时间 2023-10-20

Hadoop 1

hadoop 的核心架构：包括hdfs 和 mapReduce, HDFS 为海量数据提供了存储，而MapReduce 为海量数据提供了计算框架。 HBase：实时分布式数据库，MapReduce：分布式计算框架，HDFS：分布式文件系统。 HDFS中包含三个重要角色： NameNode, Data ......

Hadoop更新时间 2023-10-20

hadoop集群大数据项目实战_电信用户行为分析_day03

配置系统环境 Reis 1.先把之前的dump.rdb删除掉 rm -rf dump.rdb 2.把原始项目给的dump.rdb 放进来，它里面包含了需要的数据，比如端口；在这部之前必须要进行关闭端口，随后传送文件，最后重启端口相关指令: bin/redis-server conf/redis.c ......

行为分析大数集群实战行为更新时间 2023-10-19

hadoop集群大数据项目实战_电信用户行为分析_day02

集群配置好后，运行一个小例子，统计单词 1.hdfs dfs -put 将本地系统的文件或文件夹复制到HDFS上 2.hdfs dfs -ls /output 将所有的文件显示出来 3.hdfs dfs -cat /output/ 将所有的文件读取出来下载part-r-000000 安装Redis ......

行为分析大数集群实战行为更新时间 2023-10-16

Hadoop-3.3.5 自动安装

Hadoop-3.3.5 自动安装脚本为了方便数据科学与大数据技术的 hadoop-3.3.5 安装与配置目前适用于新安装的纯净虚拟机，未配置冲突检测.. 所以安装的话请使用全新创建的机器以避免错误... 如何使用 ssh localhost 输入你目前用户的密码 exit 退出当前ssh终端（ ......

Hadoop更新时间 2023-10-14

hadoop集群大数据项目实战_电信用户行为分析_day01

上图是相关配置的要求，主要创建了四个虚拟系统，有三台虚拟机搭建hadoop集群，一台作为业务系统。涉及到相关的Linux指令有::set nu[显示行号] :6[到第6行 shift+G跳到最后一行进入vi指令后查找相关东西/(你需要查找的东西) 1.配置环境、第一步设置网络参数，设置静态网络 ......

行为分析大数集群实战行为更新时间 2023-10-14

基于Docker搭建Hadoop+Hive

基于Docker搭建Hadoop+Hive 本文主要是照搬这篇文章的https://zhuanlan.zhihu.com/p/242658224，但是这篇文章有一些细节配置没有讲清楚，这里对其进行完善零、环境信息电脑配置 Ubuntu 20.04.6 LTS (Focal Fossa) 5.15 ......

Docker Hadoop Hive更新时间 2023-10-13

Hadoop-Operation category READ is not supported in state standby 故障解决

在查询hdfs时或者执行程序向hdfs写入数据时遇到报错：Operation category READ is not supported in state standby 意思是：该主机状态为待机,不支持操作类别READ. 你会发现最基本的hdfs命令都不能执行，例如：hadoop fs -ls ......

Hadoop-Operation Operation supported category 故障更新时间 2023-10-13

Hadoop2伪分布式安装

最近有观看我主讲的《Hadoop基础与演练》课程的同学问到Hadoop环境到底应该怎么安装。Hadoop的安装其实非常的简单，网上有很多教程，官网也有示例。但是可能部分同学对于linux不太熟悉，导致安装的时候会遇到各种问题，打击学习激情。本文就来详细的讲解一下如何配置Hadoop2的伪分布式环境， ......

分布式 Hadoop2 Hadoop更新时间 2023-10-13

Hadoop问题解决（5）

当一个HDFS系统同时处理许多个并行的put操作，往HDFS上传数据时，有时候会出现dfsclient 端发生socket 链接超时的报错，有的时候甚至会由于这种原因导致最终的put操作失败，造成数据上传不完整。log类似如下：All datanodes *** are bad. Aborting. ......

Hadoop 问题更新时间 2023-10-11

在hadoop虚拟机里面使用hadoop jar运行打包文件，出现Exception in thread "main" org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.ipc.RpcNoSuchProtocolException): Unknown protocol: org.apache.hadoop.的问题的解决

问题描述更改了JDK版本之后，再次运行又出现了这个错误：问题解决经过查阅相关资料，发现是自己定义的hdfs的路径不太对，本来写的是这样的：然后自己确实不记得配置环境时配置的是多少，就看了看这个文件core.site.xml: cat core-site.xml 然后看到这里：使用的端口号是 ......

hadoop apache org RpcNoSuchProtocolException quot更新时间 2023-10-10

共334篇 :4/12页 首页上一页1234567下一页尾页

526互联

hadoop

云计算-hadoop的安装

Hadoop-大数据组件版本号查看

【1】基于docker搭建hadoop+hive+spark+hbase+zookeeper+scale集群

基于docker容器，搭建hadoop+spark+hive+hbase+Zookeeper Scala集群

两台实体机器4个虚拟机节点的Hadoop集群搭建（Ubuntu版）

报错Failed to execute spark task, with exception 'org.apache.hadoop.hive.ql.metadata.HiveException(Failed to create Spark client for Spark session 768047b9-c7f7-459f-9220-5d8d7bdabefe)

hadoop集群大数据项目实战_电信用户行为分析_day04

hadoop官方文档解读

Hadoop 1

hadoop集群大数据项目实战_电信用户行为分析_day03

hadoop集群大数据项目实战_电信用户行为分析_day02

Hadoop-3.3.5 自动安装

hadoop集群大数据项目实战_电信用户行为分析_day01

基于Docker搭建Hadoop+Hive

Hadoop-Operation category READ is not supported in state standby 故障解决

Hadoop2伪分布式安装

Hadoop问题解决（5）

在hadoop虚拟机里面使用hadoop jar运行打包文件，出现Exception in thread "main" org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.ipc.RpcNoSuchProtocolException): Unknown protocol: org.apache.hadoop.的问题的解决

hadoop集群搭建及编程实践

Hadoop问题解决（3）

hadoop问题解决（4）

【大数据】Hadoop配置（文档版本）

Hadoop问题解决记（2）

Hadoop问题解决记（1）

LINUX：FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask

hadoop部署

hadoop HA高可用集群搭建

搭建Hadoop环境

Hadoop介绍

Hadoop集群搭建(完全分布式)