hadoop3 hadoop hive3 hive

Hive SQL如何获取(YYYYMM)格式年月的前1个月

如果当前年月为202301,前一个月就是202212,使用如下SQL可以将年月字段(YYYYMM格式)向前平移1个月: date_format(add_months(from_unixtime(unix_timestamp(concat(年月字段,'01'),'yyyyMMdd'),'yyyy-MM ......
年月 格式 YYYYMM Hive SQL

hive客户端启动

1.sart-all.sh 2. 3.实现在其他虚拟机访问客户端 scp -r /export/server/apache-hive-3.1.2-bin root@node3:/export/server/ 4.在node3上面输入: /export/server/apache-hive-3.1.2 ......
客户端 客户 hive

hive-metastore服务启动方式

1.前台启动hive命令: /export/server/apache-hive-3.1.2-bin/bin/hive --service metastore 2.后台启动hive命令: ......
hive-metastore metastore 方式 hive

Hive处理json数组

思路:使用正则替换json数组内部json串之间的逗号。"},{" > "}|{",再使用炸裂函数lateral view explod(split(col,"|"))将列转行,最后使用get_json_object()单独处理每个展开行的数据。 SELECT explode(split( rege ......
数组 Hive json

hive-explode 和 lateral view

### explode&lateral view explode与lateral view在关系型数据库中本身是不该出现的,因为他的出现本身就是在操作不满足第一范式的数据(每个属性都不可再分),本身已经违背了数据库的设计原理(不论是业务系统还是数据仓库系统),不过大数据技术普及后,在业务系统中是存贮 ......
hive-explode explode lateral hive view

HIVE-最大连续登陆天数

### 一、背景 在网站平台类业务需求中用户的「最大登陆天数」,需求比较普遍。原始数据: ```plsql u0001 2019-10-10 u0001 2019-10-11 u0001 2019-10-12 u0001 2019-10-14 u0001 2019-10-15 u0001 2019- ......
天数 HIVE

hive-拉链表

**工作中的拉链表是使用spark程序开发的,因为一些业务需求单纯使用sql解决不了,以下是使用纯sql写的拉链表**拉链表是针对数据仓库设计中表存储数据的方式而定义的,顾名思义,所谓拉链,就是记录历史。**记录一个事物从开始,一直到当前状态的所有变化的信息。**下面就是一张拉链表,存储的是用户的最 ......
拉链 hive

Flink-读Kafka写Hive表

1. 目标 使用Flink读取Kafka数据并实时写入Hive表。 2. 环境配置 EMR环境:Hadoop 3.3.3, Hive 3.1.3, Flink 1.16.0 根据官网描述: https://nightlies.apache.org/flink/flink-docs-release-1 ......
Flink Kafka Hive

HDFS的shell命令(Hadoop fs [参数])

hadoop fs -ls file:/// 操作linux本地文件系统 hadoop fs -ls hdfs://node1:8020/ 操作HDFS分布式文件系统 hadoop fs -ls / 直接根目录,没有指定协议 将加载读取fs.defaultFS值 标准的hadoop上传文件命令: h ......
命令 参数 Hadoop shell HDFS

Hive LAG函数分析

含义:LAG(col,n,DEFAULT) 用于统计窗口内往上第n行值 第一个参数为列名,第二个参数为往上第n行(可选,默认为1),第三个参数为默认值(当往上第n行为NULL时候,取默认值,如不指定,则为NULL) https://blog.csdn.net/weixin_43291055/arti ......
函数 Hive LAG

hive-四种排序

![](https://img2023.cnblogs.com/blog/2228562/202308/2228562-20230829151201512-712306250.png) #### 数据准备 ```plsql 2008 32.0 2008 21.0 2008 31.5 2008 17. ......
hive

hive-表的操作

### 创建表 create table语句遵从sql语法习惯,只不过Hive的语法更灵活。例如,可以定义表的数据文件存储位置,使用的存储格式等。 ```plsql create table if not exists test.user1( name string comment 'name', ......
hive

hive-同比环比

HIVE-同比环比 定义 详情: (1)同比:本期与同期做对比。(2)环比:本期与上期做对比。 同比:通常是指今年第n月与去年第n月比。同比发展速度主要是为了消除季节变动的影响,用以说明本期发展水平与去年同期发展水平对比而达到的相对发展速度。常用于分析数据的长期趋势。环比:通常是指表示连续2个单位周 ......
hive

hive函数

运算函数 1、取整函数: round 语法: round(double a) 返回值: BIGINT 说明: 返回double类型的整数值部分 (遵循四舍五入) hive> select round(3.1415926) from iteblog; 3 hive> select round(3.5) ......
函数 hive

技术实践|Hive数据迁移干货分享

导语 Hive是基于Hadoop构建的一套数据仓库分析系统,可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能。它的优点是可以通过类SQL语句快速实现简单的MapReduce统计,不用再开发专门的MapReduce应用程序,从而降低学习成本,十分适合对数据仓库进行统计分析。 近几年 ......
干货 数据 技术 Hive

Spring Boot集成Mybatis-plus+hive

运行环境 jdk1.8 springboot:2.7.15 1.在pom.xml文件中加入 <dependency> <groupId>com.baomidou</groupId> <artifactId>mybatis-plus-boot-starter</artifactId> <version ......
Mybatis-plus Mybatis Spring Boot plus

hive SQL案例

上个月用户连续n天登录天数 用户登录记录表user_login,包括用户id(user_id)、日期(login_date) user_id login_date 12333256 2021-01-03 84272916 2021-01-03 94038271 2021-01-02 20193401 ......
案例 hive SQL

使用hadoop进行单词统计

# 1、启动hadoop ![](https://img2023.cnblogs.com/blog/2808014/202308/2808014-20230826104105334-529863994.png) 启动成功! # 2、将result.txt文件放到/root/software/hado ......
单词 hadoop

Hadoop 和 Spark 简介

# Hadoop 和 Spark 简介 Hadoop 是一个由 Apache 基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop 过去一直是大数据的经典解决方案,它包含两个部分:Hadoop HDFS 和 Ha ......
简介 Hadoop Spark

Hive 刷题——银行可以支付监测

场景说明 有一个支付流水表,关键字段:用户,交易时间,交易金额,现在规定:两个小时内交易此时大于2且交易总结金大于100000的用户为可疑用户,现在需要使用HiveSQL 进行监测 数据准备 CREATE TABLE transfer_log ( log_id INTEGER, log_ts TIM ......
银行 Hive

Hive服务部署相关步骤

# 一、hiveserver2服务部署 # 1、配置hadoop下面的core-site.xml文件 进入到相应的目录下: ``` cd /root/software/hadoop-3.0.0/etc/hadoop ``` 编辑core-site.xml文件,将下面的语句补充到里面: ``` had ......
步骤 Hive

spingboot集成hive

因为开学要考就是把数据库换成hive那些做个web网站,所有提前做个小demo测试下。 首先呢就是pom文件 <?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns ......
spingboot hive

org.apache.hadoop.hive.metastore.HiveMetaException: Schema initialization FAILED! Metastore state would be inconsistent !!问题的解决

# 问题描述 上次还是初始化很快,这次直接出错,我觉得可能是已经初始化一次的原因; ![](https://img2023.cnblogs.com/blog/2808014/202308/2808014-20230824183000271-327012060.png) # 问题解决 进入到mysql ......

hive整个服务启动流程

首先是 start-all.sh 然后打开历史服务器: mapred --daemon start historyserver 最后首先启动metastore服务,然后启动hiveserver2服务 nohup bin/hive --service metastore >> logs/metasto ......
流程 hive

Hadoop概念地图

## Hadoop 发展史及生态圈 1,hadoop 的发展史,基于GFS,MAPREDUCE,BIGDATA >Hive 2,hadoop 生态圈。core,hdfs,mapreduce,hive,zookeeper.hbase,kafka,Flume,Sqoop,Mahout,Pig等 3,ha ......
概念 地图 Hadoop

Hadoop概述

# Hadoop 作用 解决分布式存储和分布式计算的可靠的,可扩展的,高容错的开源框架 其下面有四个模块的内容: Hadoop Common:支持其他Hadoop模块的常用工具。 Hadoop分布式文件系统(HDFS™):提供对应用程序数据的高吞吐量访问的分布式文件系统。 Hadoop YARN:作 ......
Hadoop

Hadoop集群环境安装

### 1,集群环境准备 ``` 准备jdk 环境,本文用的版本是,java version "1.8.0_102" 为机器准备ssh 客户端和服务端,ubuntu 环境下默认安装了客户端,那么,请安装服务端, apt-get install openssh-server 可以的话尽量不要用root ......
集群 环境 Hadoop

Hadoop知识点

### 1,概念 ``` Hadoop是一个开源的、可运行于大规模集群上的分布式并行编程框架,它实现了 Map/Reduce计算模型。 ``` ### 2,核心所在。 ``` 1,Hadoop分布式文件系统(HDFS,Hadoop Distributed File System) datanode ......
知识点 知识 Hadoop

WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable问题的解决

# 问题描述 使用**start-dfs.sh**命令开启hdfs服务时,爆出这样的警告信息 ![](https://img2023.cnblogs.com/blog/2808014/202308/2808014-20230823232839118-954209712.png) # 问题解决 可以先 ......