hadoop spark

Hadoop入门

第一章 Hadoop概述 1.1 Hadoop是什么 Hadoop是一个由Apache基金会所开发的分布式系统基础架构主要解决，海量数据的存储和海量数据的分析计算问题广义上来说，Hadoop通常是指一个更广泛的概念——Hadoop生态圈 1.2 Hadoop优势高可靠性：Hadoop底层维护多 ......

Hadoop更新时间 2023-09-14

(Windows Hadoop环境配置)IDEA：ERROR util.Shell: Failed to locate the winutils binary in the hadoop binary path

ERROR util.Shell: Failed to locate the winutils binary in the hadoop binary path 出错原因：还没有在windows上配置hadoop环境变量。解决：在windows上配置hadoop环境变量参考：windows下缺少 ......

binary the winutils Windows 环境更新时间 2023-09-14

使用Python调用Hadoop Hdfs的API

一、Java调用hdfs的api import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FileSystem; import org.apache.hadoop.fs.Path; import org.jun ......

Python Hadoop Hdfs API更新时间 2023-09-13

Failed to connect to server: hadoop/ip:9000: try once and fail.

hadoop 连接失败，报如下错误！ java.net.ConnectException: Connection refused at sun.nio.ch.SocketChannelImpl.checkConnect(Native Method) at sun.nio.ch.SocketChann ......

connect Failed server hadoop 9000更新时间 2023-09-12

sqoop1.4.7完全支持Hadoop3.x, Hive3.x Hbase2.x

已经修改好保存至云盘自己下载花了时间的，记得关注我。。。链接：https://pan.xunlei.com/s/VNe6P6Tm1A9Q-RG5GByN08rdA1# 提取码：5nke 复制这段内容后打开手机迅雷App，查看更方便下载解压直接用，里面的内容已经改好但是需要注意的是conf ......

Hadoop3 sqoop1 Hadoop Hbase2 sqoop更新时间 2023-09-12

Spark基础——Scala1.3

For循环控制 1.To 范围数据循环 to <-规定to 前后闭合，如i<- 1 to 10,则输出包括1到10的所有数 for (i<- 1 to 12){ println("她喜欢我"+i+"次")//输出结果为1-12所有数 2.until 前闭合后开 i<-1 until 10 相当于输出 ......

基础 Scala1 Spark Scala更新时间 2023-09-11

Spark基础——scala1.2

if/if else/StdIn.readShort方法运用 StdIn.readShort适用于整数数据类型 println("请输入年龄") var age=StdIn.readShort//交互式 if (age<18){ println("小屁孩") }else{ println("大人") ......

基础 scala1 Spark scala更新时间 2023-09-11

Spark基础——scala基础1.0

定义对象和强制转化 1.定义规则 var 变量名：变量类型 =初始值 var i :Int=10 var j :Double=3.33 //var 变量名：变量类型 =初始值 val o:Int=2 //val 常量名：变量类型 =初始值变量声明时，必须要有初始值 i=20 //var修饰的 ......

基础 Spark scala 1.0更新时间 2023-09-11

IDEA连接Hadoop

因为一些学习的需要，用到了idea连接hadoop，并对它进行一些相关的读写操作，总结一下大概的流程。一、使hadoop集群可以被远程访问，配置一些文件，可以参考一些其它博主的教程，记住配置的URL或者IP地址以及远程访问用到的端口号。二、在idea中建一个连接，测试一下是否可以连接hadoop ......

Hadoop IDEA更新时间 2023-09-11

Hadoop3.3.6 Shell命令操作

一、mkdir 创建文件夹通过命令hadoop fs -mkdir /cyw在hdfs中创建名为cyw的文件夹二、moveFromLocal从本地剪切到hdfs中这里将本地/home/input/movefromlocal文件剪切到hdfs的cyw文件夹下hadoop fs -moveFromL ......

命令 Hadoop3 Hadoop Shell 3.6更新时间 2023-09-11

Hadoop3.3.6配置历史服务器和日志

一、配置历史服务器 1.增加配置属性 Hadoop部署模式主要有3种：本地、伪分布式、完全分布式。云服务器只有一台所以我使用的是伪分布式模式部署的。要配置历史服务器只需修改mapred-site.xml文件。在里面增加如下配置。  <property> <name> ......

Hadoop3 服务器 Hadoop 历史日志更新时间 2023-09-10

大数据hadoop学习总结

一、环境配置: 1、hadoop 2、zookeeper 3、hbase 4、phoenix 二、连接准备 hbase-site.xml 1 <?xml version="1.0"?> 2 <?xml-stylesheet type="text/xsl" href="configuration.xs ......

数据 hadoop更新时间 2023-09-09

Hadoop基础学习1(SSHfinalshell、vim、别名、hadoop集群)

1.SSH协议 SSH协议为Secure Shell的缩写，是一种网络安全协议，转为远程的登录会话和其他网络服务提供安全性的协议。在Linux中，SSH的主要用途有：用户加密实现远程登录，服务器之间的免密登录。 SSH协议默认采用RSA算法实现非对称加密，需要两个密钥：公开密钥和私有密钥。公钥和 ......

别名集群 SSHfinalshell 基础 Hadoop更新时间 2023-09-09

1-centOS7搭建伪分布式Hadoop

前言：虚拟机快照的使用 VMware Workstation 软件可以用快照进行迅速的虚拟机状态的切换 ※. 类似于虚拟机备份，可以使用备份进行快速恢复。比如没安装jdk之前拍摄快照来备份 ※. 若jdk没安装好或者jdk环境变量配置的有问题，可以用安装之前的快照快速恢复虚拟机 1.拍摄快照： ......

分布式 centOS7 centOS Hadoop更新时间 2023-09-09

Ubuntu22系统部署Hadoop3.3.6环境

看boss有招大数据的讲师，好奇看了下，现在大学都讲大数据了，现在是越来越普及。昨天弄了一个云服务器部署了下Hadoop，虽然也是参考网上教程部署，但过程中还是出了不少问题。想着把部署过程完整记录下，所以我就把部署好的实例释放了又实例化了一台新的云服务器重新部署了下，如果是在我本地安装报错了还得重新 ......

Hadoop3 环境 Ubuntu Hadoop 系统更新时间 2023-09-09

spark2.4.4安装

1、环境准备：下载spark-2.4.4-bin-hadoop2.7.tgz 上传安装包到Linux中解压安装包 tar -zxf spark-2.4.4-bin-hadoop2.7.tgz -C /hadoop/app 2、配置环境 2.1修改hadoop中yarn-site.xml <pro ......

spark2 spark 4.4更新时间 2023-09-09

habase2.5.5解决ERROR: org.apache.hadoop.hbase.ipc.ServerNotRunningYetException: Server is not runnin

hbase的master和regionserver启动都正常但是出现错误 org.apache.hadoop.hbase.ipc.ServerNotRunningYetException: Server is not runnin之后我翻阅logs里面的启动日志解决方案在hbase-site.x ......

ServerNotRunningYetException habase2 habase apache Server更新时间 2023-09-07

Hadoop学习

# Hadoop ## java环境安装 ## hadoop上传、解压环境变量配置 ~~~bash JAVA_HOME=/usr/local/java/jdk1.8.0_161 CLASSPATH=$JAVA_HOME/lib/ PATH=$PATH:$JAVA_HOME/bin export P ......

Hadoop更新时间 2023-09-06

org.apache.hadoop.hive.metastore.HiveMetaException: Schema initialization FAILED! Metastore state would be inconsistent !!问题的解决

# 问题描述 hive进行初始化时，出现这样的问题； # 问题解决只要进入到我们的虚拟机安装配置的mysql里面，将我们hive-site.xml里面提及到的数据库删除，然后再进行初始化即可；这次出错是因为，我之前已经初始化过，才出现了这个问题； ......

HiveMetaException initialization inconsistent Metastore metastore更新时间 2023-09-06

共540篇 :8/18页 首页上一页567891011下一页尾页

526互联

hadoop spark

Hadoop入门

(Windows Hadoop环境配置)IDEA：ERROR util.Shell: Failed to locate the winutils binary in the hadoop binary path

使用Python调用Hadoop Hdfs的API

Failed to connect to server: hadoop/ip:9000: try once and fail.

sqoop1.4.7完全支持Hadoop3.x, Hive3.x Hbase2.x

Spark基础——Scala1.3

Spark基础——scala1.2

Spark基础——scala基础1.0

IDEA连接Hadoop

Hadoop3.3.6 Shell命令操作

Hadoop3.3.6配置历史服务器和日志

大数据hadoop学习总结

Hadoop基础学习1(SSHfinalshell、vim、别名、hadoop集群)

1-centOS7搭建伪分布式Hadoop

Ubuntu22系统部署Hadoop3.3.6环境

spark2.4.4安装

habase2.5.5解决ERROR: org.apache.hadoop.hbase.ipc.ServerNotRunningYetException: Server is not runnin

Hadoop学习

org.apache.hadoop.hive.metastore.HiveMetaException: Schema initialization FAILED! Metastore state would be inconsistent !!问题的解决

开发笔记-大数据技术栈-spark基础

Hadoop的写流程(微观层面)

Hadoop环境安装与配置

Hadoop大数据平台搭建

Ubuntu部署Spark集群

Ubuntu部署Hadoop集群

CDC一键入湖：当 Apache Hudi DeltaStreamer 遇见 Serverless Spark

图解Spark Graphx基于connectedComponents函数实现连通图底层原理

龙芯平台Hadoop集群搭建问题解决

图解Spark Graphx实现顶点关联邻接顶点的函数原理

spark教程-1