hadoop3 hadoop hive3 hive
IDEA连接Hadoop
因为一些学习的需要,用到了idea连接hadoop,并对它进行一些相关的读写操作,总结一下大概的流程。 一、使hadoop集群可以被远程访问,配置一些文件,可以参考一些其它博主的教程,记住配置的URL或者IP地址以及远程访问用到的端口号。 二、在idea中建一个连接,测试一下是否可以连接hadoop ......
hive启动整个流程
首先是start-all.sh然后打开历史服务器:mapred --daemon start historyserver最后首先启动metastore服务,然后启动hiveserver2服务nohup bin/hive --service metastore >> logs/metastore.lo ......
Hadoop3.3.6 Shell命令操作
一、mkdir 创建文件夹通过命令hadoop fs -mkdir /cyw在hdfs中创建名为cyw的文件夹 二、moveFromLocal从本地剪切到hdfs中 这里将本地/home/input/movefromlocal文件剪切到hdfs的cyw文件夹下hadoop fs -moveFromL ......
sqoop把hive中的数据导入mysql中文乱码问题解决
sqoop导出数据中文乱码问题我参考的这个博客sqoop把hive数据导入mysql出现中文乱码_mysql的表数据导入到hive表中文乱码_bboy枫亭的博客-CSDN博客 用方法一就行。剩下的就是测试。 测试样例 bin/sqoop export \ --connect "jdbc:mysql: ......
Hadoop3.3.6配置历史服务器和日志
一、配置历史服务器 1.增加配置属性 Hadoop部署模式主要有3种:本地、伪分布式、完全分布式。云服务器只有一台所以我使用的是伪分布式模式部署的。要配置历史服务器只需修改mapred-site.xml文件。在里面增加如下配置。 <!-- 历史服务器端地址 --> <property> <name> ......
关于IDEA里面连接数据库找不到org.apache.hive.jdbc.Driver的问题
问题描述 昨天就很顺利地连接上了,今天直接找不到我的class了,吓出一身冷汗; 问题解决 后来发现导入的jar包的路径不太对,突然想起来jar包的位置被我移动了,但是IDEA里面并没有改变原来的位置,找不到jar包的问题, 重新将jar包的路径浏览一遍即可解决; ......
大数据hadoop学习总结
一、环境配置: 1、hadoop 2、zookeeper 3、hbase 4、phoenix 二、连接准备 hbase-site.xml 1 <?xml version="1.0"?> 2 <?xml-stylesheet type="text/xsl" href="configuration.xs ......
Hadoop基础学习1(SSHfinalshell、vim、别名、hadoop集群)
1.SSH协议 SSH协议为Secure Shell的缩写,是一种网络安全协议,转为远程的登录会话和其他网络服务提供安全性的协议。 在Linux中,SSH的主要用途有:用户加密实现远程登录,服务器之间的免密登录。 SSH协议默认采用RSA算法实现非对称加密,需要两个密钥:公开密钥和私有密钥。 公钥和 ......
1-centOS7搭建伪分布式Hadoop
前言:虚拟机快照的使用 VMware Workstation 软件可以用快照进行迅速的虚拟机状态的切换 ※. 类似于虚拟机备份, 可以使用备份进行快速恢复。 比如没安装jdk之前拍摄快照来备份 ※. 若jdk没安装好或者jdk环境变量配置的有问题, 可以用安装之前的快照快速恢复虚拟机 1.拍摄快照: ......
使用IDEA连接Hive数据库使用Java代码实现增删改查还需要一个Hive配置类
可以取名为:HiveConfig-- package com.example.config; import com.alibaba.druid.pool.DruidDataSource; import lombok.Data; import org.springframework.beans.fac ......
Hive进行增删改查语句命令之前,需要做的一些配置
1、在我们刚刚将Hive连接到IDEA之后 满怀期待地想要试一试sql语句,发现除了select和insert,其余的都会报错; 2、查阅资料发现,要是想要执行其余的语句 需要在虚拟机的hive-site.xml文件里面,添加上下面的语句: <property> <name>hive.support ......
IDEA远程连接Hive(首先要确保本机和虚拟机在一个公网上面,具有连通性)
1、开启hiveserver2服务 start-all.sh nohup /export/server/apache-hive-3.1.2-bin/bin/hive --service metastore & nohup /export/server/apache-hive-3.1.2-bin/bi ......
Ubuntu22系统部署Hadoop3.3.6环境
看boss有招大数据的讲师,好奇看了下,现在大学都讲大数据了,现在是越来越普及。昨天弄了一个云服务器部署了下Hadoop,虽然也是参考网上教程部署,但过程中还是出了不少问题。想着把部署过程完整记录下,所以我就把部署好的实例释放了又实例化了一台新的云服务器重新部署了下,如果是在我本地安装报错了还得重新 ......
hive2.3.1部署
1.安装本人安装hive1.2.1的方式准备mysql和hive 2.不同点为配置hive-site.xml时,需要在文件中额外添加配置 <!--hive2需要初始换元数据 schematool -initSchema -dbType mysql--> <property> <name>datanu ......
FAILED: SemanticException Unable to determine if hdfs://localhost.localdomain:9000/root/software/apache-hive-3.1.2-bin问题的解决
# 问题描述 在hive数据库里面,使用select语句对表的数据进行查找,就出现了这个错误: ![](https://img2023.cnblogs.com/blog/2808014/202309/2808014-20230908193233783-1417039914.png) # 问题解决 这 ......
输入jps命令发现缺少namenode进程--同时猜想hive启动失败是由于缺少namenode进程的原因
# 问题描述 ![](https://img2023.cnblogs.com/blog/2808014/202309/2808014-20230908202931367-867211073.png) 且 ![](https://img2023.cnblogs.com/blog/2808014/202 ......
hive添加用户名和密码的问题
# 问题描述 没有添加之前,即进入到beeline里面,并不需要身份验证就能够登录hive: ![](https://img2023.cnblogs.com/blog/2808014/202309/2808014-20230908175337971-8629180.png) 但是在尝试将**NONE ......
关于hive数据库添加信息到表中出现问题的原因细说
# 问题来源 在建表完成之后,尝试使用insert into语句向表中添加数据信息,然后就一直不能成功,当然,添加的数据信息与表的字段类型是对应的; # 问题解决 查阅相关资料发现,原来是虚拟机的内存不太够,然后就按照网上的建议,将下面的语句放置到hadoop下面的**yarn-site.xml** ......
HIVE将长整数转字符串的错误
有一个超长字符串,比如:441066000000001005712973,原来存放在HIVE里表A 是用DECIMAL(24)类型。现在要与另外一个用string类型保存这个字段的表B关联,老是失败。单独检查,发现它与表B的空值关联上。 单独使用语句检查: select cast(441066000 ......
habase2.5.5解决ERROR: org.apache.hadoop.hbase.ipc.ServerNotRunningYetException: Server is not runnin
hbase的master和regionserver启动都正常但是出现错误 org.apache.hadoop.hbase.ipc.ServerNotRunningYetException: Server is not runnin之后我翻阅logs里面的启动日志 解决方案 在hbase-site.x ......
Hadoop学习
# Hadoop ## java环境安装 ## hadoop上传、解压 环境变量配置 ~~~bash JAVA_HOME=/usr/local/java/jdk1.8.0_161 CLASSPATH=$JAVA_HOME/lib/ PATH=$PATH:$JAVA_HOME/bin export P ......
org.apache.hadoop.hive.metastore.HiveMetaException: Schema initialization FAILED! Metastore state would be inconsistent !!问题的解决
# 问题描述 hive进行初始化时,出现这样的问题; # 问题解决 只要进入到我们的虚拟机安装配置的mysql里面,将我们hive-site.xml里面提及到的数据库删除,然后再进行初始化即可; 这次出错是因为,我之前已经初始化过,才出现了这个问题; ......
Hadoop的写流程(微观层面)
解释: 步骤1:客户端进行发送存储消息,FileSystem通过rpc调用NameNode的put方法,NameNode对文件的路径,大小以及权限进行校验, 步骤2:校验成功后,返回FSDateOutputStream对象给客户端进行使用 步骤3:客户端对文件进行划分,将划分信息返回给NameNod ......
Hadoop环境安装与配置
1.基础操作系统环境安装(略) 2.JDK的安装与配置 当前各大数据软件如Hadoop等,仍然停留在Java 8上,在本实验选用的是Java 8。在自己的Linux系统中,jdk可以使用如下命令进行一键安装(需具备sudo权限)。 sudo yum install java-1.8.0-openjd ......
hive数据类型
Hive支持以下数据类型: 1. 基本数据类型: * TINYINT:一个非常小的整数,可以存储从0到255的整数值。 * SMALLINT:一个较小的整数,可以存储从-32768到32767的整数值。 * INT:一个标准的整数,可以存储从-2147483648到2147483647的整数值。 * ......
Hadoop大数据平台搭建
# Hadoop平台搭建 ## 一、基础环境准备 ### 1.master、slave1、slave2三台主机上配置以下信息 ``` [root@localhost ~]# cd /etc/sysconfig/network-scripts [root@localhost network-scrip ......
Ubuntu部署Hadoop集群
## 前期准备 ### 系统及软件版本说明 本章操作中所使用的相关操作系统及软件版本如下: | 软件 | 版本 | | | | | 操作系统 | Ubuntu 14.04.1 | | JDK | 1.8.0 | | Hadoop | 2.7.3 | ### JDK 安装 集群中每台机器都需要安装 J ......
大数据实战-Hive-技巧实战_2LgaeiFwLs7mCTwG5T3c9M
# 大数据实战-Hive-技巧实战_2LgaeiFwLs7mCTwG5T3c9M # 大数据实战-Hive-技巧实战 # 1.union 和 union all - 前者可以去重 ```sql select sex,address from test where dt='20210218' unio ......
解决hive数据库的修改删除等更新语句问题
Hive对使用Update功能的表有特定的语法要求, 语法要求如下: (1)要执行Update的表中, 建表时必须带有buckets(分桶)属性 (2)要执行Update的表中, 需要指定格式,其余格式目前赞不支持, 如:parquet格式, 目前只支持ORCFileformat和AcidOutpu ......
龙芯平台Hadoop集群搭建问题解决
这几天一直在困扰我 pycurl 版本和本机的版本不符合 他连接又连接的自己自带的版本 与系统不相同 低级也会报错 https://blog.csdn.net/u010910682/article/details/89496550/?ops_request_misc=&request_id=&biz ......