hadoop3 hadoop hive3 hive

Hive执行计划详解

## 什么是Hive SQL执行计划 Hive SQL执行计划描绘了SQL实际执行的整体轮廓，即**SQL转化为对应计算引擎的执行逻辑**；毫无疑问，这一块对于Hive SQL的优化是非常重要的。 Hive SQL早期是基于规则的方式生成执行计划，在Hive 0.14及之后，集成了Apache Ca ......

Hive更新时间 2023-08-22

解密Hadoop生态系统的工作原理 - 大规模数据处理与分析

在当今的数字时代，大规模数据处理和分析已经成为了企业和组织中不可或缺的一部分。为了有效地处理和分析海量的数据，Hadoop生态系统应运而生。本文将深入探讨Hadoop生态系统的工作原理，介绍其关键组件以及如何使用它来处理和分析大规模数据。 ## 什么是Hadoop？ Hadoop是一个开源的分布式计 ......

数据处理大规模原理生态数据更新时间 2023-08-22

基于Hive数仓实现需求开发

# 1、建库建表与加载数据 ![](https://img2023.cnblogs.com/blog/2808014/202308/2808014-20230822101522516-97193522.png) 上传到HDFS，即加载数据，可以使用命令行进行上传，还可以直接在网页里面进行上传；在D ......

需求 Hive更新时间 2023-08-22

Hadoop部署HDFS集群启动后只有node1有进程，node2和node3没有反应

最近有人向我询问说：为什么他的HDEF集群一键启动时只有node1进程有反应，node2和node3没有反应我看完他的问题之后，想到了自己在部署时也遇到了同样的问题，现在来分享一下自己的解决方案出现这种情况的主要原因是：workers文件没有配置好解决方法：输入：vim /export/se ......

node 集群进程只有 Hadoop更新时间 2023-08-22

hadoop开发案例

本次基于陌陌数据案例实现可视化数据分析数据准备:两个tsv文件，总计包含14w条数据，数据字段包括发送人，接收人账号，性别，GPS坐标等20多个字段，这些字段利用制表符进行分隔开，其中有为null的杂乱数据，需要将这些数据过滤，时间数据格式为年月日时分秒，需要substr()进行截取，GPS坐标 ......

案例 hadoop更新时间 2023-08-21

Hive相关学习

# 1、服务启动 ![](https://img2023.cnblogs.com/blog/2808014/202308/2808014-20230821161258541-1598369060.png) ![](https://img2023.cnblogs.com/blog/2808014/20 ......

Hive更新时间 2023-08-21

hive sql运行时候reduce 只有2个问题解决

我们在explan sql 时候发现 width 是负数，事实上原因 width是通过data Size / rowNum计算出来的，这两个参数都是在执行计划中根据每个operator通过stats计算出来的。对于select query来说，data size是根据column stats、尤其是 ......

只有时候 reduce 问题 hive更新时间 2023-08-21

hbase报错 ERROR: org.apache.hadoop.hbase.ipc.ServerNotRunningYetException: Server is not running yet

hbase报错：hbase shell能打开网页也能打开但是一执行命令就开始报错。原因：hadoop的安全模式打开。解决方法：关闭安全模式，再重新启动HBase就可以了。具体的命令： 1、查看namenode是否是安全状态 hadoop dfsadmin -safemode get Sa ......

ServerNotRunningYetException hbase running apache Server更新时间 2023-08-20

ambari-hadoop集群中timeline和ams-hbase几种服务之间的调用关系

最近经常碰到ambari集群timeline server和ams-hbase 服务的一些问题，梳理了下这些服务之间的调用关系，留作笔记方便后续查阅 #1. 目前笔者用到的hadoop组件版本如下 ![](https://img2023.cnblogs.com/blog/1648386/202308 ......

集群 ambari-hadoop ams-hbase timeline 之间更新时间 2023-08-20

Hive 刷题——查看每件商品的售价涨幅情况

题目描述从商品价格变更明细表（sku_price_modify_detail），得到最近一次价格的涨幅情况，并按照涨幅升序排序。结果如下： sku_id<string>（商品id）price_change<decimal(16,2)>（涨幅） 8 -200.00 9 -100.00 2 -70. ......

涨幅售价情况商品 Hive更新时间 2023-08-19

8.14-8.20学习总结博客五：Hive进阶与复杂查询

博客题目：学习总结五：Hive进阶与复杂查询实践内容概要：学习Hive进阶的使用方法，包括复杂查询、数据转换和性能优化等方面的知识。学习资源：推荐的Hive进阶教程、实践案例和性能优化技巧。实践内容：通过编写复杂的Hive查询语句，探索Hive的高级功能和性能优化方法，并分享实践中的挑战和解决方案。 ......

博客 8.14 8.20 Hive 14更新时间 2023-08-19

Hadoop3.3.0--Linux编译安装

### Hadoop3.3.0--Linux编译安装本实验内容教程来源于“黑马程序员”如有侵权请联系作者删除基础环境：Centos 7.7 编译环境软件安装目录 ``` mkdir -p /export/server ``` #### 一、Hadoop编译安装（选做） > ==可以直接使用课程提 ......

Hadoop3 Hadoop Linux 3.0更新时间 2023-08-18

MYSQL与Hive配置的相关步骤

# 1、配置元数据到MYSQL #### 1、新建Hive元数据库登录Mysql： ``` mysql -uroot -p //不加分号 ``` ![](https://img2023.cnblogs.com/blog/2808014/202308/2808014-2023081715275115 ......

步骤 MYSQL Hive更新时间 2023-08-17

Apache hive安装配置的相关步骤

# 1、Hive下载地址http://archive.apache.org/dist/hive/ 我选择的是Hive的这个版本： ![](https://img2023.cnblogs.com/blog/2808014/202308/2808014-20230817095816544-1154047 ......

步骤 Apache hive更新时间 2023-08-17

hive排序函数 rank、dense_rank、row_number

rank函数：对有序序列编号，当排序字段取值相同时编号相同，且下一条取值不同记录的编号不连续。如序列为：13,13,13,13,13,14,…对应的排序编号为1,1,1,1,1,6,… dense_rank函数：对有序序列编号，当排序字段相同时编号相同，且下一条记录的编号仍连续。如序列为：13,13 ......

rank dense_rank row_number 函数 number更新时间 2023-08-17

hadoop 问题集

1.Hadoop "Cannot create directory .Name node is in safe mode."解决方案 hadoop dfsadmin -safemode leave 2.本地eclipse连接外网Hadoop 通过查询发现，外网中的hadoop如果想要被外网访问，需要 ......

hadoop 问题更新时间 2023-08-16

初识Hadoop

Hadoop生态系统资源调试系统YARN HDFS写入数据流程图 HDFS原理漫画结语学习没有捷径，一步一个脚印！ ......

Hadoop更新时间 2023-08-16

Apache Hive相关基础学习

# 1、Hive概念 ![](https://img2023.cnblogs.com/blog/2808014/202308/2808014-20230816141336599-82360523.png) 使用Hive处理数据的好处： ![](https://img2023.cnblogs.com/ ......

基础 Apache Hive更新时间 2023-08-16

HIve 刷题——同一时刻异地登录问题

题目描述从登录明细表（user_login_detail）中查询在相同时刻，多地登陆（ip_address不同）的用户题目需求从登录明细表（user_login_detail）中查询在相同时刻，多地登陆（ip_address不同）的用户期望结果如下： user_id<string>(用户id ......

异地时刻问题 HIve更新时间 2023-08-15

HIVE带中括号的列名取数

某次取数，某表中有奇怪的字段名：pointchange_ygz_[yyyy]，带了个中插号，用简单查询出错 select pointchange_ygz_[yyyy] as p from t 出错信息： Error while compiling statement: FAILED: Semanti ......

HIVE更新时间 2023-08-15

Hadoop - WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform...

# Hadoop - WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... 配置完hadoop启动的时候出现如下警告信息： ```shell WARN util.NativeCode ......

NativeCodeLoader native-hadoop platform library Hadoop更新时间 2023-08-15

Hive SQL 的 ntile 分组切片函数

Hive SQL 的 ntile 函数用于将分组数据按照顺序切分成n组，并返回当前切片值。如果切片不均匀，默认增加第一个切片的分布。它把有序的数据集合「平均分配」到指定的数量（n）个桶中, 将桶号分配给每一行。如果不能平均分配，则优先分配较小编号的桶，并且各个桶中能放的行数最多相差 1。语法 Hi ......

函数 ntile Hive SQL更新时间 2023-08-14

[42000][3] Error while processing statement: FAILED: Execution Error, return code 3 from org.apache.hadoop.hive.ql.exec.spark.SparkTask.

[42000][3] Error while processing statement: FAILED: Execution Error, return code 3 from org.apache.hadoop.hive.ql.exec.spark.SparkTask. Spark job fai ......

Error processing Execution SparkTask statement更新时间 2023-08-14

共760篇 :13/26页 首页上一页10111213141516下一页尾页

526互联