hadoop3 hadoop hive3 hive

Hive执行计划详解

## 什么是Hive SQL执行计划 Hive SQL执行计划描绘了SQL实际执行的整体轮廓,即**SQL转化为对应计算引擎的执行逻辑**;毫无疑问,这一块对于Hive SQL的优化是非常重要的。 Hive SQL早期是基于规则的方式生成执行计划,在Hive 0.14及之后,集成了Apache Ca ......
Hive

解密Hadoop生态系统的工作原理 - 大规模数据处理与分析

在当今的数字时代,大规模数据处理和分析已经成为了企业和组织中不可或缺的一部分。为了有效地处理和分析海量的数据,Hadoop生态系统应运而生。本文将深入探讨Hadoop生态系统的工作原理,介绍其关键组件以及如何使用它来处理和分析大规模数据。 ## 什么是Hadoop? Hadoop是一个开源的分布式计 ......
数据处理 大规模 原理 生态 数据

基于Hive数仓实现需求开发

# 1、建库建表与加载数据 ![](https://img2023.cnblogs.com/blog/2808014/202308/2808014-20230822101522516-97193522.png) 上传到HDFS,即加载数据,可以使用命令行进行上传,还可以直接在网页里面进行上传; 在D ......
需求 Hive

Hadoop部署HDFS集群 启动后只有node1有进程,node2和node3没有反应

最近有人向我询问说:为什么他的HDEF集群一键启动时只有node1进程有反应,node2和node3没有反应 我看完他的问题之后,想到了自己在部署时也遇到了同样的问题,现在来分享一下自己的解决方案 出现这种情况的主要原因是:workers文件没有配置好 解决方法: 输入:vim /export/se ......
node 集群 进程 只有 Hadoop

hadoop开发案例

本次基于陌陌数据案例实现可视化数据分析 数据准备:两个tsv文件,总计包含14w条数据,数据字段包括发送人,接收人 账号,性别,GPS坐标等20多个字段,这些字段利用制表符进行分隔开,其中有为null的杂乱数据,需要将这些数据过滤,时间数据格式为年月日时分秒,需要substr()进行截取,GPS坐标 ......
案例 hadoop

Hive相关学习

# 1、服务启动 ![](https://img2023.cnblogs.com/blog/2808014/202308/2808014-20230821161258541-1598369060.png) ![](https://img2023.cnblogs.com/blog/2808014/20 ......
Hive

hive sql运行时候reduce 只有2个问题解决

我们在explan sql 时候发现 width 是负数,事实上原因 width是通过data Size / rowNum计算出来的,这两个参数都是在执行计划中根据每个operator通过stats计算出来的。对于select query来说,data size是根据column stats、尤其是 ......
只有 时候 reduce 问题 hive

hbase报错 ERROR: org.apache.hadoop.hbase.ipc.ServerNotRunningYetException: Server is not running yet

hbase报错:hbase shell能打开 网页也能打开 但是一执行命令就开始报错。 原因:hadoop的安全模式打开。 解决方法:关闭安全模式 ,再重新启动HBase就可以了。 具体的命令: 1、查看namenode是否是安全状态 hadoop dfsadmin -safemode get Sa ......

ambari-hadoop集群中timeline和ams-hbase几种服务之间的调用关系

最近经常碰到ambari集群timeline server和ams-hbase 服务的一些问题,梳理了下这些服务之间的调用关系,留作笔记方便后续查阅 #1. 目前笔者用到的hadoop组件版本如下 ![](https://img2023.cnblogs.com/blog/1648386/202308 ......

Hive 刷题——查看每件商品的售价涨幅情况

题目描述 从商品价格变更明细表(sku_price_modify_detail),得到最近一次价格的涨幅情况,并按照涨幅升序排序。 结果如下: sku_id<string>(商品id)price_change<decimal(16,2)>(涨幅) 8 -200.00 9 -100.00 2 -70. ......
涨幅 售价 情况 商品 Hive

8.14-8.20学习总结博客五:Hive进阶与复杂查询

博客题目:学习总结五:Hive进阶与复杂查询实践内容概要:学习Hive进阶的使用方法,包括复杂查询、数据转换和性能优化等方面的知识。学习资源:推荐的Hive进阶教程、实践案例和性能优化技巧。实践内容:通过编写复杂的Hive查询语句,探索Hive的高级功能和性能优化方法,并分享实践中的挑战和解决方案。 ......
博客 8.14 8.20 Hive 14

Hadoop3.3.0--Linux编译安装

### Hadoop3.3.0--Linux编译安装 本实验内容教程来源于“黑马程序员”如有侵权请联系作者删除 基础环境:Centos 7.7 编译环境软件安装目录 ``` mkdir -p /export/server ``` #### 一、Hadoop编译安装(选做) > ==可以直接使用课程提 ......
Hadoop3 Hadoop Linux 3.0

MYSQL与Hive配置的相关步骤

# 1、配置元数据到MYSQL #### 1、新建Hive元数据库 登录Mysql: ``` mysql -uroot -p //不加分号 ``` ![](https://img2023.cnblogs.com/blog/2808014/202308/2808014-2023081715275115 ......
步骤 MYSQL Hive

Apache hive安装配置的相关步骤

# 1、Hive下载地址http://archive.apache.org/dist/hive/ 我选择的是Hive的这个版本: ![](https://img2023.cnblogs.com/blog/2808014/202308/2808014-20230817095816544-1154047 ......
步骤 Apache hive

hive排序函数 rank、dense_rank、row_number

rank函数:对有序序列编号,当排序字段取值相同时编号相同,且下一条取值不同记录的编号不连续。如序列为:13,13,13,13,13,14,…对应的排序编号为1,1,1,1,1,6,… dense_rank函数:对有序序列编号,当排序字段相同时编号相同,且下一条记录的编号仍连续。如序列为:13,13 ......
rank dense_rank row_number 函数 number

hadoop 问题集

1.Hadoop "Cannot create directory .Name node is in safe mode."解决方案 hadoop dfsadmin -safemode leave 2.本地eclipse连接外网Hadoop 通过查询发现,外网中的hadoop如果想要被外网访问,需要 ......
hadoop 问题

初识Hadoop

Hadoop生态系统 资源调试系统YARN HDFS写入数据流程图 HDFS原理漫画 结语 学习没有捷径,一步一个脚印! ......
Hadoop

Apache Hive相关基础学习

# 1、Hive概念 ![](https://img2023.cnblogs.com/blog/2808014/202308/2808014-20230816141336599-82360523.png) 使用Hive处理数据的好处: ![](https://img2023.cnblogs.com/ ......
基础 Apache Hive

HIve 刷题——同一时刻异地登录问题

题目描述 从登录明细表(user_login_detail)中查询在相同时刻,多地登陆(ip_address不同)的用户 题目需求 从登录明细表(user_login_detail)中查询在相同时刻,多地登陆(ip_address不同)的用户 期望结果如下: user_id<string>(用户id ......
异地 时刻 问题 HIve

HIVE带中括号的列名取数

某次取数,某表中有奇怪的字段名:pointchange_ygz_[yyyy],带了个中插号,用简单查询出错 select pointchange_ygz_[yyyy] as p from t 出错信息: Error while compiling statement: FAILED: Semanti ......
HIVE

Hadoop - WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform...

# Hadoop - WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... 配置完hadoop启动的时候出现如下警告信息: ```shell WARN util.NativeCode ......

Hive SQL 的 ntile 分组切片函数

Hive SQL 的 ntile 函数用于将分组数据按照顺序切分成n组,并返回当前切片值。如果切片不均匀,默认增加第一个切片的分布。它把有序的数据集合「平均分配」到指定的数量(n)个桶中, 将桶号分配给每一行。如果不能平均分配,则优先分配较小编号的桶,并且各个桶中能放的行数最多相差 1。 语法 Hi ......
函数 ntile Hive SQL

[42000][3] Error while processing statement: FAILED: Execution Error, return code 3 from org.apache.hadoop.hive.ql.exec.spark.SparkTask.

[42000][3] Error while processing statement: FAILED: Execution Error, return code 3 from org.apache.hadoop.hive.ql.exec.spark.SparkTask. Spark job fai ......

1.hive 简介

[TOC] ## 1.1 hive出现的原因 FaceBook网站每天产生海量的结构化日志数据,为了对这些数据进行管理,并且因为机器学习的需求,产生了hive这门技术,并继续发展成为一个成功的Apache项目(hive是由Facebook开源用于解决海量结构化日志的数据统计)==》广泛应用原因: + ......
简介 hive

问题排查Hive本地计算模式失败

# 问题排查Hive本地计算模式失败 ==查看hive.log后发现是**java space heap**,也就是java内存溢出。== ### 解决方案: 1. 配置yarn集群的资源分配。 - 由于是本地计算,因此container一定是申请在本地的,限制AM申请container容器资源的大 ......
模式 问题 Hive

问题排查Hive本地计算模式失败

# 问题排查Hive本地计算模式失败 ==查看hive.log后发现是**java space heap**,也就是java内存溢出。== ### 解决方案: 1. 配置yarn集群的资源分配。 - 由于是本地计算,因此container一定是申请在本地的,限制AM申请container容器资源的大 ......
模式 问题 Hive

【HIVE系列】01-HIVE 常用操作

title: 【HIVE系列】01-HIVE 常用操作 date: 2018-11-13 20:20:31 update: 2018-11-15 17:10:43 categories: - 大数据技术 - hive tags: [hive] >> 参考资料: https://blog.csdn.n ......
HIVE 常用 01

关于hive的字段注释乱码解决

今天我发现我的DBeaver执行完sql后,表的注释乱码,深究下来是要去设置hive的编码,要不注释是乱码。 教程:hive设置中文编码格式utf-8_hive建表指定字符集_2021xyz666的博客-CSDN博客 ......
乱码 字段 注释 hive

hive如何提高查询性能

本文会通过四个方面介绍Hive性能调优,主要包括: √性能调优工具 √设计优化策略 √数据存储优化 √作业优化技巧 ## 1.合并中间表 一个日志文件中,每一行记录,会有很多很多字段,四五十个字段很正常。实际分析中,常常使用少数几个字段将原始的表中数据,依据业务需求提取出要分析的字段,数据放入到对应 ......
性能 hive

hadoop 简介

[TOC] ## hadoop 的三大组件和关系 ### 1. HDFS:分布式文件系统 > #### hdfs 的特点和不适用使用场景 >> 1.1 HDFS文件系统可存储超大文件(不适用有大量小文件场景和小量场景,默认块大小是MB,资源浪费) >> 1.2 一次写入,多次读取(不适用多用户更新, ......
简介 hadoop