spark-hive spark hive

hive架构

Hive的架构原理及组成_hive架构_hunter95671的博客-CSDN博客 ......
架构 hive

hive考试总结

这次测试的流程主要分为五个步骤。 1、数据导入 2、数据清洗 3、数据分析处理 4、Sqoop导入Hive数据到MySQL 5、通过javaweb+echarts进行数据可视化 一、数据导入: 建表: create table sales_sample_20170310 ( `day_id` str ......
hive

hive string, map, struct类型的建表和导入数据语句

本文转载于 https://blog.51cto.com/u_14405/6419362,https://blog.csdn.net/tototuzuoquan/article/details/115493697 和 https://blog.csdn.net/weixin_43597208/art ......
语句 类型 数据 string struct

hive数据分析

HIVE数据分析实验报告 信2105-3 20213728杨申龙 数据导入 将csv文件导入到虚拟机的hive数据库中,并通过datagrip软件实现对数据库的可视化操作 数据清洗 在datagrip中进行如下操作,将数值清洗为真实日期 insert overwrite table test2 se ......
数据分析 数据 hive

hive

hive测试步骤 1.在hive中建表,一个表存放原始数据,一个表存放清洗后的数据 create table sales_initial ( day_id varchar(30), sale_nbr varchar(30), buy_nbr varchar(30), cnt varchar(30), ......
hive

软件工程测试--hive数据分析,步骤

![](https://img2023.cnblogs.com/blog/2913863/202309/2913863-20230925134737420-1341675633.png) ![](https://img2023.cnblogs.com/blog/2913863/202309/2913... ......

hive测试

这次的hive测试的流程主要分为以下几个步骤 1、数据导入到hive数据库里 2、对数据清洗 3、数据分析处理 4、将处理后的数据导出到MySQL 5、 通过网页进行数据可视化 一.数据导入到hive数据库里 1)建立初始表 create table sales_sample_20214044 ( ......
hive

本地测试Spark的逻辑回归算法

本地小数据量测试了一下Spark的LogisticRegressionWithSGD算法,效果不尽如人意。 数据样例如下,竖杠前的0,1代表两种类型,后面逗号隔开的是两个特征,两个特征只要有一个大于等于0.6就会被分为1这一类,否则就是0。 1|0.3,0.6 0|0.2,0.1 1|0.5,0.6 ......
算法 逻辑 Spark

hive极限测试2

......
极限 hive

hadoop和hive的兼容问题

本人之前搭建的集群是hadoop3.3.5+hive3.1.3版本,后来发现这两个版本不兼容,虽然官方文档里面说hive3.1.3版本兼容hadoop3.x.y版本,但是当我在使用hive 执行插入语句时发现一直报同一个错误 java.lang.ClassCastException: org.apa ......
hadoop 问题 hive

HIVE增量同步方案2

SELECT student_temp.id ,coalesce(student_temp.age,student.age) as age ,student_temp.name ,coalesce(student_temp.dt,student.dt) as dt FROM student_temp ......
增量 方案 HIVE

Could not open client transport with JDBC Uri: jdbc:hive2://node1:10000: java.net.ConnectException: 拒绝连接 (Connection refused) (state=08S01,code=0)

今天发现连接beeline是时候连接不上,不应该啊昨晚还可以的qaq 破案了,我启动了metastore之后忘记去启动hiveserver2 hiveserver2都没启动能连上就怪了 一定一定要记得启动顺序!!! hadoop+metastore+hiveserver2+beeline ......

使用sqoop export命令将hive数据导入mysql

描述一下 因为我前两天的测试里面,用的是另外一种方法,所以今天想要尝试一下sqoop export的方法,这个方法我之前也试过,但是一直报错,但是!我又来啦!!! 相关步骤 自己设置一个数量不多的csv文件: 然后按照之前的步骤:上传,导入数据库: 然后在mysql里面同时创建一个与hive数据库中 ......
命令 数据 export sqoop mysql

hive的一些操作(防忘)

create database test_1; 创建数据库 drop database test_1; 删除数据库 show databases; 查看数据库 ......
hive

关于Hadoop和hive启动关闭的一些命令

Hadoop启动/关闭:start-all.sh / stop-all.sh HDFS:start-dfs.sh / stop-dfs.sh YARN:start-yarn.sh / stop-yarn.shhive 启动metastore服务: 前台启动 /export/server/apache ......
命令 Hadoop hive

Hive的使用以及如何利用echarts实现可视化在前端页面展示(四)---连接idea使用echarts可视化界面

说来惭愧,我的javaweb烂得一批,其他步骤我还是很顺利地,这个最简单的,我遇到了一系列问题。只能说,有时候失败也是一种成功吧 这一步其实就是正常的jdbc,没什么可说明的,但是关于使用echarts我还是遇到了一些困难,如果有高手能指正一二,感激不尽 echarts获取前端数据要使用Ajax,我 ......
echarts 前端 界面 页面 Hive

Hive的使用以及如何利用echarts实现可视化在前端页面展示(三)---hive数据利用sqoop导出到mysql数据库里

1、安装sqoop 我的版本 jdk1.8 hadoop3.1.3 sqoop1.4.6 基本上就安装这个版本都没问题,如果是执行连接数据库命令时报错:java.lang.NoClassDefFoundError;报错,在lib下再放一个commons-lang-2.6.jar即可, sqoop安装 ......
数据 前端 echarts 页面 数据库

Hive的使用以及如何利用echarts实现可视化在前端页面展示(二)---hive部分的实现

1、利用远程连接器上传csv文件 2、进入hive创建表结构: 创建一个Hive表的SQL语句:这个表名为 "sales",包含了五个列:day_id、sale_nbr、buy_nbr、cnt 和 round。此表的数据格式为逗号分隔的文本文件,每一行都用逗号分隔字段。 create table s ......
前端 echarts 页面 部分 Hive

Hive

Hive简介 Hive 是一种大数据处理工具,使用类SQL 的HiveQL 语言实现数据查询,它底层封装了Hadoop ,所有Hive 的数据都存储在Hadoop 兼容的HDFS中。 更官方的描述: Hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和 ......
Hive

Hive学习3(数据库操作DML、join、hive函数)

1.对数据库操作 数据定义语言 (Data Definition Language, DDL),是SQL语言集中对数据库内部的对象结构进行创建,删除,修改等的操作语言,这些数据库对象包括database、table等。 DDL核心语法由CREATE、ALTER与DROP三个所组成。DDL并不涉及表内 ......
函数 数据库 数据 Hive join

HIVE数据分析-处理结果入库

1、navicat远程连接Hive数据库 1、打开navicat里的mysql连接 2、使用SSH隧道 出现上面这个显示连接就是成功 3、设置常规连接 显示成功后点击确定,navicat远程连接Hive数据库成功 问题 4、处理结果入库: 将上述统计分析的结果数据保存到mySQL数据库中。 1、通过 ......
数据分析 结果 数据 HIVE

HIVE数据分析-数据清洗

题目:2、数据清洗: 要求将day_id一列中的数值清洗为真实的日期格式,可用字符串表示。 数据1对应日期2023-09-01,依次类推,15对应日期2023-09-15 二、数据清洗 (2)创建表格存放清洗后的数据: create table sales_y(day_id string,sale_ ......
数据 数据分析 HIVE

Hive学习2(hive部署启动,DataGrip连接hiveserver2)

1.Hive部署: hive部署:09-Apache hive安装部署--与Hadoop整合、MySQL安装_哔哩哔哩_bilibili 10-Apache hive安装部署--配置文件修改编辑_哔哩哔哩_bilibili 2.Hive启动 hadoop启动后。 node1上: nohup /exp ......
hiveserver2 hiveserver DataGrip Hive hive

navicat链接虚拟机上hive环境下的MySQL

一:启动虚拟机 二,finallshell上进入hive,(具体进入参照上一个博客) 三,进入成功后,打开Navicat 点击左上角链接选择MySQL 按照上面的步骤: 1.起一个名字,能分辨就行 2.这里非常重要,必须要填IP地址,IP地址不知道的同学打开虚拟机中hive的服务端(就是你final ......
navicat 链接 环境 MySQL hive

Hive学习1(数据仓库及Hive基础学习)

1.数据仓库 1.1什么是数据仓库 数据仓库(英语:Data Warehouse,简称数仓、DW),是一个用于存储、分析、报告的数据系统。 数据仓库本身并不“生产”任何数据,其数据来源于不同外部系统; 同时数据仓库自身也不“消费”任何的数据,其结果开放给各个外部应用使用; 数据仓库是为了分析数据的。 ......
Hive 仓库 基础 数据

datagrip链接hive

首先在官网下载datagrip直接点击安装选择30天免费试用 直接进项下一步,进去之后,新建project 起个名字完成即可: 右上角或左边有一个database点击 】 点击加号 选择Apache hive ......
datagrip 链接 hive

HIVe的启动以及datagrip配置

之前已经被治好所需要的HIVe环境,治理需要启动他,才可以进行下面的链接datagrip操作 首先进到finallshell里面然后启动zookeeper 然后再启动hadoop:start-all.sh 启动完成之后看上一个博客先关闭防火墙; 根据黑马教程中提到的有两种方式启动HIVe: 一,先启 ......
datagrip HIVe

HIVE数据分析-导入数据库

首先,启动hadoop以及hive 出现以上进程,显示成功 将改名后的文件上传到虚拟机 在hive里面的defaul数据库创建表格 use default; show tables; load data local inpath '/export/server/apache-hive-3.1.2-b ......
数据 数据分析 数据库 HIVE

将hive数据库中的数据导入到mysql数据库中时需要注意到的问题

在hive中使用jdbc将hive与mysql连接起来时 一定要注意到每个数据库不同的字段个数,在打算直接复制时,不能只是修改表的名称和字段名称,还要记得修改几个? 那里,个数要与字段名称保持一致!!! 不然就会报错(比如我); ......
数据 数据库 问题 mysql hive

启动hive报错:Cannot create directory /tmp/hive. Name node is in safe mod

在使用:start-all.sh 命令启动完hadoop之后再启动metastore服务使用 /export/server/hive/bin/hive --service metastore 启动远程连接服务再输入命令 /export/server/hive/bin/hive 启动hive 但是无法 ......
hive directory Cannot create Name