spark-hive spark hive

FAILED: SemanticException Unable to determine if hdfs://localhost.localdomain:9000/root/software/apache-hive-3.1.2-bin问题的解决

# 问题描述在hive数据库里面，使用select语句对表的数据进行查找，就出现了这个错误: ![](https://img2023.cnblogs.com/blog/2808014/202309/2808014-20230908193233783-1417039914.png) # 问题解决这 ......

SemanticException apache-hive localdomain determine localhost更新时间 2023-09-08

输入jps命令发现缺少namenode进程--同时猜想hive启动失败是由于缺少namenode进程的原因

# 问题描述 ![](https://img2023.cnblogs.com/blog/2808014/202309/2808014-20230908202931367-867211073.png) 且 ![](https://img2023.cnblogs.com/blog/2808014/202 ......

namenode 进程命令同时原因更新时间 2023-09-08

hive添加用户名和密码的问题

# 问题描述没有添加之前，即进入到beeline里面，并不需要身份验证就能够登录hive： ![](https://img2023.cnblogs.com/blog/2808014/202309/2808014-20230908175337971-8629180.png) 但是在尝试将**NONE ......

用户名密码用户问题 hive更新时间 2023-09-08

关于hive数据库添加信息到表中出现问题的原因细说

# 问题来源在建表完成之后，尝试使用insert into语句向表中添加数据信息，然后就一直不能成功，当然，添加的数据信息与表的字段类型是对应的； # 问题解决查阅相关资料发现，原来是虚拟机的内存不太够，然后就按照网上的建议，将下面的语句放置到hadoop下面的**yarn-site.xml** ......

原因数据库数据问题信息更新时间 2023-09-08

HIVE将长整数转字符串的错误

有一个超长字符串，比如：441066000000001005712973，原来存放在HIVE里表A 是用DECIMAL(24)类型。现在要与另外一个用string类型保存这个字段的表B关联，老是失败。单独检查，发现它与表B的空值关联上。单独使用语句检查： select cast(441066000 ......

整数字符串字符错误 HIVE更新时间 2023-09-08

org.apache.hadoop.hive.metastore.HiveMetaException: Schema initialization FAILED! Metastore state would be inconsistent !!问题的解决

# 问题描述 hive进行初始化时，出现这样的问题； # 问题解决只要进入到我们的虚拟机安装配置的mysql里面，将我们hive-site.xml里面提及到的数据库删除，然后再进行初始化即可；这次出错是因为，我之前已经初始化过，才出现了这个问题； ......

HiveMetaException initialization inconsistent Metastore metastore更新时间 2023-09-06

开发笔记-大数据技术栈-spark基础

Spark是一个快速、通用、可扩展的大数据分析引擎，是集批处理、实时流处理、交互式查询、机器学习与图计算为一体的大数据开源项目。一、对比MapReduce 1.Hadoop中的job处理流程：》从hdfs读取数据》在map阶段，执行mapper function,然后split到磁盘》在r ......

基础笔记数据 spark 技术更新时间 2023-09-06

hive数据类型

Hive支持以下数据类型： 1. 基本数据类型： * TINYINT：一个非常小的整数，可以存储从0到255的整数值。 * SMALLINT：一个较小的整数，可以存储从-32768到32767的整数值。 * INT：一个标准的整数，可以存储从-2147483648到2147483647的整数值。 * ......

类型数据 hive更新时间 2023-09-05

Ubuntu部署Spark集群

## 前期准备 ### 系统及软件版本说明本章操作中所使用的相关操作系统及软件版本如下： | 软件 | 版本 | | | | | 操作系统 | Ubuntu 14.04.1 | | JDK | 1.8.0 | | Hadoop | 2.7.3 | | Spark | 2.2.0 | ### JDK ......

集群 Ubuntu Spark更新时间 2023-09-04

CDC一键入湖：当 Apache Hudi DeltaStreamer 遇见 Serverless Spark

Apache Hudi的DeltaStreamer是一种以近实时方式摄取数据并写入Hudi表的工具类，它简化了流式数据入湖并存储为Hudi表的操作，自 `0.10.0` 版开始，Hudi又在DeltaStreamer的基础上增加了基于Debezium的CDC数据处理能力，这使得其可以直接将Debez ......

DeltaStreamer Serverless Apache Spark Hudi更新时间 2023-09-03

大数据实战-Hive-技巧实战_2LgaeiFwLs7mCTwG5T3c9M

# 大数据实战-Hive-技巧实战_2LgaeiFwLs7mCTwG5T3c9M # 大数据实战-Hive-技巧实战 # 1.union 和 union all - 前者可以去重 ```sql select sex,address from test where dt='20210218' unio ......

实战大数 2LgaeiFwLs LgaeiFwLs 技巧更新时间 2023-09-03

图解Spark Graphx基于connectedComponents函数实现连通图底层原理

![image](https://img2023.cnblogs.com/blog/1545382/202309/1545382-20230903170841666-247436382.png) 原创/朱季谦第一次写这么长的graphx源码解读，还是比较晦涩，有较多不足之处，争取改进。 ### 一 ......

connectedComponents 底层函数原理 Graphx更新时间 2023-09-03

解决hive数据库的修改删除等更新语句问题

Hive对使用Update功能的表有特定的语法要求, 语法要求如下: (1)要执行Update的表中, 建表时必须带有buckets(分桶)属性 (2)要执行Update的表中, 需要指定格式,其余格式目前赞不支持, 如:parquet格式, 目前只支持ORCFileformat和AcidOutpu ......

语句数据库数据问题 hive更新时间 2023-09-03

Hive SQL如何获取(YYYYMM)格式年月的前1个月

如果当前年月为202301，前一个月就是202212，使用如下SQL可以将年月字段（YYYYMM格式）向前平移1个月： date_format(add_months(from_unixtime(unix_timestamp(concat(年月字段,'01'),'yyyyMMdd'),'yyyy-MM ......

年月格式 YYYYMM Hive SQL更新时间 2023-09-01

hive客户端启动

1.sart-all.sh 2. 3.实现在其他虚拟机访问客户端 scp -r /export/server/apache-hive-3.1.2-bin root@node3:/export/server/ 4.在node3上面输入： /export/server/apache-hive-3.1.2 ......

客户端客户 hive更新时间 2023-09-01

hive链接数据库与建表，切换库

......

链接数据库数据 hive更新时间 2023-09-01

图解Spark Graphx实现顶点关联邻接顶点的函数原理

![image](https://img2023.cnblogs.com/blog/1545382/202309/1545382-20230901005349386-1258559942.png) ## 一、场景案例在一张社区网络里，可能需要查询出各个顶点邻接关联的顶点集合，类似查询某个人关系比较 ......

顶点函数原理 Graphx Spark更新时间 2023-09-01

hive-metastore服务启动方式

1.前台启动hive命令： /export/server/apache-hive-3.1.2-bin/bin/hive --service metastore 2.后台启动hive命令： ......

hive-metastore metastore 方式 hive更新时间 2023-08-31

Hive处理json数组

思路：使用正则替换json数组内部json串之间的逗号。"},{" > "}|{"，再使用炸裂函数lateral view explod(split(col,"|"))将列转行，最后使用get_json_object()单独处理每个展开行的数据。 SELECT explode(split( rege ......

数组 Hive json更新时间 2023-08-31

spark教程-1

# scala基本操作 ``` scala> val input=sc.textFile("C:\\Users\\gwj\\Desktop\\cont.txt") input: org.apache.spark.rdd.RDD[String] = C:\Users\gwj\Desktop\cont. ......

教程 spark更新时间 2023-08-31

hive-explode 和 lateral view

### explode&lateral view explode与lateral view在关系型数据库中本身是不该出现的，因为他的出现本身就是在操作不满足第一范式的数据（每个属性都不可再分），本身已经违背了数据库的设计原理（不论是业务系统还是数据仓库系统），不过大数据技术普及后，在业务系统中是存贮 ......

hive-explode explode lateral hive view更新时间 2023-08-30

HIVE-最大连续登陆天数

### 一、背景在网站平台类业务需求中用户的「最大登陆天数」，需求比较普遍。原始数据： ```plsql u0001 2019-10-10 u0001 2019-10-11 u0001 2019-10-12 u0001 2019-10-14 u0001 2019-10-15 u0001 2019- ......

天数 HIVE更新时间 2023-08-30

hive-拉链表

**工作中的拉链表是使用spark程序开发的，因为一些业务需求单纯使用sql解决不了，以下是使用纯sql写的拉链表**拉链表是针对数据仓库设计中表存储数据的方式而定义的，顾名思义，所谓拉链，就是记录历史。**记录一个事物从开始，一直到当前状态的所有变化的信息。**下面就是一张拉链表，存储的是用户的最 ......

拉链 hive更新时间 2023-08-30

Flink-读Kafka写Hive表

1. 目标使用Flink读取Kafka数据并实时写入Hive表。 2. 环境配置 EMR环境：Hadoop 3.3.3, Hive 3.1.3, Flink 1.16.0 根据官网描述： https://nightlies.apache.org/flink/flink-docs-release-1 ......

Flink Kafka Hive更新时间 2023-08-29

Hive LAG函数分析

含义：LAG(col,n,DEFAULT) 用于统计窗口内往上第n行值第一个参数为列名，第二个参数为往上第n行（可选，默认为1），第三个参数为默认值（当往上第n行为NULL时候，取默认值，如不指定，则为NULL） https://blog.csdn.net/weixin_43291055/arti ......

函数 Hive LAG更新时间 2023-08-29

hive-四种排序

![](https://img2023.cnblogs.com/blog/2228562/202308/2228562-20230829151201512-712306250.png) #### 数据准备 ```plsql 2008 32.0 2008 21.0 2008 31.5 2008 17. ......

hive更新时间 2023-08-29

hive-表的操作

### 创建表 create table语句遵从sql语法习惯，只不过Hive的语法更灵活。例如，可以定义表的数据文件存储位置，使用的存储格式等。 ```plsql create table if not exists test.user1( name string comment 'name', ......

hive更新时间 2023-08-29

hive-同比环比

HIVE-同比环比定义详情：（1）同比：本期与同期做对比。（2）环比：本期与上期做对比。同比：通常是指今年第n月与去年第n月比。同比发展速度主要是为了消除季节变动的影响，用以说明本期发展水平与去年同期发展水平对比而达到的相对发展速度。常用于分析数据的长期趋势。环比：通常是指表示连续2个单位周 ......

hive更新时间 2023-08-29

hive函数

运算函数 1、取整函数: round 语法: round(double a) 返回值: BIGINT 说明: 返回double类型的整数值部分（遵循四舍五入） hive> select round(3.1415926) from iteblog; 3 hive> select round(3.5) ......

函数 hive更新时间 2023-08-29

3.2.0 终极预告！云原生支持新增 Spark on k8S 支持

![file](https://img2023.cnblogs.com/other/2685289/202308/2685289-20230828190238753-1379880889.png) 视频贡献者 | 王维饶视频制作者 | 聂同学编辑整理 | Debra Chen > Apache ......

终极 Spark k8S 8S on更新时间 2023-08-28

共620篇 :10/21页 首页上一页78910111213下一页尾页