hbase rdbms hdfs hive
实验6熟悉的hive的基本操作
今天完成了大数据实验六的hive的基本操作 参照实验6 熟悉Hive的基本操作_hive环境搭建实验报告-CSDN博客、 这位博主的代码,但是前期的启动hive并没有按照博主的来,启动hive大家参照我之前的一篇博客来就行 我是从黑马教程跟着下载的hive ......
hive执行sql报错 FAILED: Execution Error, return code 3 from org.apache.hadoop.hive.ql.exec.mr.MapredLocalTask
前言: 执行hive sql报错,sql逻辑是两个表左连接并将数据插入新的表中。 报错信息: [ERROR] 2023-12-05 15:49:49.165 +0800 - execute sql error: Error while processing statement: FAILED: Ex ......
DBeaver连接hive
配置maven仓库:窗口,首选项,连接,驱动,Maven,添加 https://repo.huaweicloud.com/repository/maven/ ......
datax采集txt文件数据到hive
1、提前创建hive表结构 DROP TABLE IF EXISTS ods.ods_log_1diu; CREATE TABLE IF NOT EXISTS ods.ods_log_1diu ( SI_NO STRING, --varchar(10) not null,主键 SEND_TABLE ......
关于hadoop hive中使用hive分区功能
很多人习惯了使用第三方的工具 去连接hive或者hbase数据库,并且 使用其中的sql编辑器进行失去了语句 的使用来进行数据的分析等一系列的 操作,但是一些shell命令也可以在其中 运行例如: 1. set hive.exec.dynamic.partition=true; 2. set hiv ......
HDFS HA配置后无法实现自动切换
对HDFS结合Zookeeper进行HA配置后无法实现自动切换,将active的namenode杀掉namenode进程后,standby的namenode并未自动切换为active,经查询,应将hdfs-site.xml中dfs.ha.fencing.methods一项配置为shell(/bin/ ......
hbase运行status时报错
在尝试运行status时出现了org.apache.hadoop.hbase.ipc.ServerNotRunningYetException: Server is not running yet的报错 解决方法—— 1.停止hbase集群 2. 在配置文件hbase-site.xml 文件中增加如 ......
hive向表中导入数据出现FAILED: SemanticException
完整错误信息 FAILED: SemanticException Line 1:23 Invalid path ''~/Downloads/stocks.csv'': No files matching path file:/home/lcz/~/Downloads/stocks.csv 路径错误, ......
hive启动出现Cannot create directory /tmp/hive. Name node is in safe mode.
原因:进入了安全模式,hdfs在启动开始时会进入安全模式,这时文件系统中的内容不允许修改也不允许删除,直到安全模式结束。 执行命令: hadoop dfsadmin -safemode leave 退出安全模式即可 出现 Safe mode is OFF 表示成功退出 ......
hive启动时有一堆WARN信息
hive启动时有一堆WARN信息 比如: SLF4J: Class path contains multiple SLF4J bindings. SLF4J: Found binding in [jar:file:/usr/local/hive/lib/log4j-slf4j-impl-2.17.1 ......
Hive的安装与配置
第1关:Hive的安装与配置 在修改 conf 下面的hive-site.xml文件这里,题目给的信息是错误的,正确的内容如下: <?xml version="1.0" encoding="UTF-8" standalone="no"?> <?xml-stylesheet type="text/xs ......
hive启动出现Either your MetaData is incorrect, or you need to enable "datanucleus.schema.autoCreateTables"
hive启动出现: Required table missing : "`VERSION`" in Catalog "" Schema "". DataNucleus requires this table to perform its persistence operations. Either ......
hive升级元数据报错The reference to entity "useSSL" must end with the ';' delimiter.
使用Hive自带的schematool工具升级元数据,也就是把最新的元数据重新写入MySQL数据库中。 执行以下命令 cd /usr/local/hive ./bin/schematool -initSchema -dbType mysql 出现The reference to entity "us ......
hadoop高可用集群集成hive
hive和hadoop的关系 从上图可以看出实际上外界是通过thrift server这个节点和hadoop的hdfs以及rm进行交互的,中间为driver 因此当我修改完hadoop集群为高可用的时候,hive也需要重新配置环境以下是我hive的全新配置 <configuration> <!-- ......
java使用hive-jdbc查询超时:java.sql.SQLException: org.apache.thrift.transport.TTransportException: java.net.SocketTimeoutException: Read timed out
java.sql.SQLException: org.apache.thrift.transport.TTransportException: java.net.SocketTimeoutException: Read timed out at org.apache.hive.jdbc.HiveSt ......
Hbase关于建表一直报错Master is initializing
最近在做大数据实验的时候发现hbase突然不能建表了,list命令没有问题而建表就报错 如下图所示 网上的答案是打开zookeeper的命令行删除下面的hbase,但是没有说明效果 后来,我突然想到,之前我搭载hadoop和hbase的时候,Hadoop并没有开启高可用 解决办法 先关闭hbase, ......
分布式系统HDFS
1、完全分布式搭建 hadoop102[namenode,datanode],hadoop103[datanode], hadoop104[secondarynamenode,datanode] 缺少104,配置104 选择完全克隆103 机器的名称 hadoop104 配置机器的IP 192.16 ......
二、HDFS的读写流程
一、写数据(宏观) 写数据就是将客户端上的数据上传到HDFS 1.客户端向HDFS发送写数据请求 hdfs dfs -put students.txt /shujia/ 2. Filesystem通过rpc调用namenode的put方法 a. nn首先检查是否有足够的空间权限等条件创建这个文件,或 ......
常用的hdfs操作
今天完成了常用的hdfs操作,其中遇到了一个是在刚开始的时候上传文件操作,老是不成功,具体原因后来发现是防火墙没有关闭 采用Hadoop dfsadmin -safemode leave把防火墙关闭就行。 除此之外,在hadoop的web界面上直接暴力上传文件要是防火墙没关闭的话也是上传不成功的,而 ......
spark离线分析--本地Spark1.6版本读写hive表
1. 搭建好hive环境,并将hive-site.xml文件放到本地工程的resources目录下 2. java测试代码 public class SparkHiveTest{ public static void main(String[] args){ JavaSparkContext jav ......
大数据实验(Mysql、hbase、redis、MongoDBjava客户端连接)
1.MySQL 启动:虚拟机输入mysql -u root -p 输入密码: hadoop(黑马的mysql密码是hadoop) pom.xml需要引入mysql <properties> <maven.compiler.source>8</maven.compiler.source> <maven ......
虚拟机打开Hbase shell
1、打开所有hadoop的进程 start-all.sh 2、打开yarn的进程 start-yarn.sh 这是为了防止start-all.sh,没有打开所有,其实不用管他的。 3、node1,node2,node3都打开zookeeper cd /export/server/apache-zoo ......
hive+mysql的伪分布式数据仓库搭建
1.前言 1.1所使用的配置 VMware 16pro #虚拟机 unbuntu22.04 #操作系统 jdk-8u202 hadoop-3.3.6 hive-3.1.1 mysql-8.054 mysql-connect-j-8.1.0 2.mysql和navicat的安装和使用 2.1mysql ......
大数据实验(HBase基础操作)
(一)Hadoop提供的HBase Shell命令完成任务 (1)列出hbase所有表信息 (2)打印表的所有数据 (3)添加、删除指定列族或列 (4)清空指定表的数据(先禁用表在清空) (5)统计行数 (二)HBase数据库操作 1.根据给出的表数据在HBase建表并存入数据 数据比较多可以先在t ......
HDFS与MAPREDUCE操作
HDFS文件操作 在分布式文件系统上验证HDFS文件命令,如下。 hadoop fs [genericOpitions] [-ls <path>] //显示目标路径当前目录下的所有文件 [-lsr <path>] //递归显示目标路径下的所有目录及文件(深度优先) [-du <path>] //以字 ......
HDFS
目录HDFS1、HDFS概述1.1 hdfs产生背景和意义1.2 HDFS优缺点1.3 HDFS组成架构1.4 HDFS文件块大小2、HDFS的Shell(命令)3、API4、HDFS的读写流程(面试重点)4.1.1 写入流程4.1.2 网络拓扑 - 节点距离计算4.1.3 机架感知4.2 HDFS ......
crontab任务以user用户执行hive -f命令不生效解决记录
现象:创建了一个shell脚本任务,使用crontab进行任务调度,其中hive执行为: hive -f /opt/test.sql > /opt/test.log 2>&1 任务调度起来后一直报错提示: /usr/bin/hive:行3: /parcels/sbin/configure.sh: 没 ......
Hive_解析 get_json_object
get_json_object ( string json_string, string path ) 说明: 第一个参数填写json对象变量,第二个参数使用$表示json变量标识,然后用 . 或 [] 读取对象或数组。 如果输入的json字符串无效,那么返回NULL。 每次只能返回一个数据项。 举 ......
datax抽取mysql数据到hive报错:javax.net.ssl.SSLException: Connection reset
datax抽取mysql数据报错: [INFO] 2023-11-09 12:35:14.090 +0000 - -> 2023-11-09 20:35:13.492 [0-0-0-reader] ERROR ReaderRunner - Reader runner Received Excepti ......