Hive

Hive查看所有表/分区更新时间

业务需求: 开始环境可能不太稳定, 需要每天手动检查 Hive 里面的数据是否同步 ```shell ## 步骤 1. 查看分区 show partitions table_name; 2.查看分区更新时间 - 获取hdfs路径 desc formatted table_name; 3. 通过dfs ......
时间 Hive

Hive SQL之表与建表

数据类型: 建表 create database itheima; --1.创建一张表 -- 表名 --字段 名称 类型 顺序 --字段之间的分隔符 create table itheima.t_archer( id int, name string , hp_max int, mp_max int ......
Hive SQL

Hive架构组件

架构图 Hive组件 ......
架构 组件 Hive

Hive

什么是Hive 为什么使用Hive Hive和Hadoop的关系 ......
Hive

数据仓库——Hive

数据仓库:是一个用于储存,分析,报告的数据系统 数据仓库的目的是构建面向分析的集成化数据环境,分析结果为企业提供决策支持 数仓专注分析 数据仓库仓库为何而来,解决什么问题的? 为了分析数据而来,分析结果给企业决策提供支撑。 ......
仓库 数据 Hive

hadoop hive hbase

公司报表是基于数仓开发的,分层是ods>dwd>dwm>dm,sqoop再同步到传统数据库,帆软展示,或tableau展示,这块涉及的是离线计算。 记录下大数据开发设计的概念: 1、hadoop:分布式计算(MapReduce)+分布式文件系统(HDFS),后者可以独立运行,前者可以选择性使用,也可 ......
hadoop hbase hive

HIVE中对于时间变换的处理

### 一、获取月份第一天/最后一天 ``` --需求一:获取月份第一天/最后一天 --方式一:last_day --获取当月第一天 select date_add(last_day(add_months('2020-06-14',-1)),1); --获取当月最后一天 select last_da ......
时间 HIVE

hive表数据导出

第二种,是放到了本地的不是放在HFDS里的 ......
数据 hive

Hive安装与启动

## 一、mysql安装 在配置Hive之前一般都需要安装和配置MySQL,因为Hive为了能操作HDFS上的数据集,那么他需要知道数据的切分格式,如行列分隔符,存储类型,是否压缩,数据的存储地址等信息。 为了方便以后操作所以他需要将这些信息通过一张表存储起来,然后将这张表(元数据)存储到mysql ......
Hive

史上最全Hive面试题,高薪必备,架构必备

文章很长,且持续更新,建议收藏起来,慢慢读![**疯狂创客圈总目录 博客园版**](https://www.cnblogs.com/crazymakercircle/p/9904544.html) 为您奉上珍贵的学习资源 : 免费赠送 :[**《尼恩Java面试宝典》**](https://www. ......
架构 高薪 Hive

sql 练习(hive,spqrk)

# 数据准备 ## 表1 课程表(course) | ***\*字段名\**** | ***\*数据类型\**** | | | | | 课程编号(CNO) | string | | 课程名称(CNAME) | string | | 教室编号(TNO) | string | ## 表2 成绩表(sco ......
spqrk hive sql

spark-HIVE

什么是数仓 hive特性 结构化查询语言 ......
spark-HIVE spark HIVE

Sqoop 数据导入hive size大小如何控制?

描述:sqoop 从 hana 导入数据到 hive,数据量1300万,当 设置参数 -m 7 时,产生7个文件,但只有 3 个有数据,且大小不一,600多m,300dm,40m,修改参数为 -m 5,文件变成了5个,但是有数据的还是那三个,奇怪 该如何控制文件大小接近块大小。 修改 -m 1时,倒 ......
大小 数据 Sqoop hive size

Hive分区/分桶

# 分区 hive的分区的是针对于数据库的分区,将原来的数据(有规律的数据)分为多个区域,数据和表的信息是不会有变化的,但是会增加namenode的压力 分区的目的是提升查询效率,将原来的文件进行多层次的管理 分区有三种,静态分区,动态分区,混合分区 关键字:**partitioned by(字段) ......
Hive

Hive列值转换为列名处理方案

1.背景 最近有个朋友问了一个问题,如何把列值转换为列名进行展示,比如一个表有销售名称,销售日期,销售金额,他想统计这个销售每个月的销售额,然后每个月作为列字段。 2.实施 方法1使用case when: select t1.sale_name ,sum(case when t1.month_id= ......
方案 Hive

2023 Hive 面试大纲

#### 先说一些废话 总结一下Hive面试大纲,方便读者快速过一遍Hive面试所需要的知识点 ## Hive的介绍 ### Hive和Hadoop的关系 1. Hive利用hdfs存储数据,利用MapReduce查询数据 2. Hive的数据存储在hdfs上,简单的说Hive就是hdfs的简单一种 ......
大纲 2023 Hive

基于CDH环境下的Hive数仓配置及优化

# 基于CDH环境下的Hive数仓配置及优化 原文连接地址:https://blog.csdn.net/sinat_31854967/article/details/127274575 ## YARN的基础配置 ### NodeManager CPU配置 - 在YARN界面中,点击配置,然后搜索配置 ......
环境 Hive CDH

未安装HBase时Hive on Spark任务卡顿处理如何解决

操作场景 此功能适用于Hive组件。 按如下操作步骤设置参数后,在未安装HBase的环境执行Hive on Spark任务时,可避免任务卡顿。 说明:Hive on Spark任务执行Hive on Spark任务。如果没有安装HBase,默认在执行Spark任务时,会尝试去连接Zookeeper访 ......
任务 HBase Spark Hive on

Hive SQL 之 date()函数

当使用Hive SQL中的 date 函数时,你可以从时间戳中提取日期部分,或将日期的字符串表示转换为日期数据类型。 date 函数的语法如下: ``` date(date_string) ``` 这里, date_string 是表示日期或时间戳的输入字符串。 date 函数将输入的日期部分作为日 ......
函数 Hive date SQL

HIVE sql 初识笔记

一、sql 1. 向hive里的某张表添加数据load data local inpath '/home/ocdp/hfb/sex.txt' OVERWRITE into table TD_NP_ENUM_COC_BATCH1_DAY_COLUMN_013; 2. 查询 select * from ......
笔记 HIVE sql

Hive 的执行优化问题小结

hive 的谓词下推和optimize优化功能的讨论 sql 核心的大概结构为 with user_table as ( select user_id from user ) select t1.user_id from ( select t1.user_id, .... from ( select ......
小结 问题 Hive

hive执行truncate table报错堆栈信息

Caused by: org.apache.hadoop.hive.ql.metadata.HiveException: MetaException(message:Got exception: org.apache.hadoop.ipc.RemoteExcepti on The directory ......
堆栈 truncate table 信息 hive

Hadoop中hive的使用

启动元数据管理服务(必须启动,否则无法工作) 前台启动:bin/hive --service metastore 后台启动:nohup bin/hive --service metastore >> logs/metastore.log 2>&1 & 启动客户端 Hive Shell方式(可以直接写 ......
Hadoop hive

Hive初体验

首先,确保启动了Metastore服务。jps下,如何有如下则启动了Metastore服务 可以执行:bin/hive,进入到Hive Shell环境中,可以直接执行SQL语句。创建表CREATE TABLE test(id INT, name STRING, gender STRING);插入数据 ......
Hive

hadoop2.7.2上安装hive

hive版本1.21 mysql版本5.6.24 1.解压hive tar -zxf apache-hive-1.2.1-bin.tar.gz -C ../app/ cd ../app/ ln -s apache-hive-1.2.1-bin hive 2.安装mysql 注:参考Linux安装My ......
hadoop2 hadoop hive 7.2

Hive 组件(进阶中级)

## Hive 组件(进阶中级) ### 1. 实验一:Hive 组件部署 #### 1. 实验任务一:环境需求 ##### 1.1. 步骤一:解压安装文件 ~~~bash [root@master ~]# ls anaconda-ks.cfg jdk-8u152-linux-x64.tar.gz ......
组件 Hive

mac spark+hive+hadoop 数据分析环境搭建(单机简版)

apache产品下载地址: http://archive.apache.org/dist/ mysql5.6 brew方式安装配置: Icon mysql做为元数据存储使用。 brew search mysql brew install mysql@5.6 配置mysqlhome: export M ......
数据分析 单机 环境 数据 hadoop

Hive中怎样创建和查询视图信息?

视图是从数据库的数据表中选取出来的数据组成的逻辑窗口,它是一个虚拟机表。引入视图后,用户可以将注意力集中在关心的数据上,如果数据来源于多个基本表结构,并且搜索条件比较复杂时,需要编写的查询语句就会比较烦琐,此时可以使用视图将数据查询语句变得简单可行。 Hive中的视图是一种无关底层存储的逻辑对象,也 ......
视图 信息 Hive

在VMware虚拟机集群中,完成Hive的安装部署

# 更新密钥 rpm --import https://repo.mysql.com/RPM-GPG-KEY-mysql-2022 # 安装Mysql yum库 rpm -Uvh http://repo.mysql.com//mysql57-community-release-el7-7.noarc ......
集群 VMware Hive

Apache Hive

Apache Hive是一个基于Hadoop的数据仓库基础设施。它提供了一种类似于SQL的查询语言,称为HiveQL,用于处理和分析存储在Hadoop分布式文件系统(HDFS)或其他支持Hadoop的文件系统中的大规模数据集。Hive的设计目标是使用户能够执行复杂的分析查询,而无需编写复杂的MapR ......
Apache Hive