hadoop3 hadoop hive3 hive

Hadoop大数据2

HDFS 文件系统 overview9870 8088 shell操作 echo如果，没有它会自己创建上传不必加本地和外部前缀他会根据默认自动识别 echo 输入的内容和cin要各有空格，否则它不会生效文件夹只有用门槛低而或者递归创建文件夹是没有大小的，只存储具体的一个个文件文件夹后面不用 ......

数据 Hadoop更新时间 2023-07-15

Hadoop初步学习之VM虚拟机的配置

经过半个小时的努力我的vm虚拟机终于不蓝屏了，也是成功安装了centos linux 实际上如果出现蓝屏下载一个vm16就可以了 ......

Hadoop更新时间 2023-07-15

启动Hadoop时需要进行的操作

首先切换到hadoop用户 su - hadoop 启动hdfs集群 start-dfs.sh 启动yarn集群 start-yarn.sh 启动hive 首先切换到hive文件夹 cd /export/server/hive 然后再运行下述命令 #先启动metastore服务然后启动hivese ......

Hadoop更新时间 2023-07-15

hadoop学习笔记第一次

这周学习了大数据之hadoop，这一周的学习主要围绕在hadoop集群配置及其华宁的搭建，hadoop是采用多态服务器的分布式系统，主要的核心就是hdfs,mapreduce,yarn等等，hadoop配置时候在主机上遇到了蛮多的问题现在就来记录一下。 1.首先是一些基础命令：回退/进入目录命令： ......

第一次笔记 hadoop更新时间 2023-07-15

Hadoop大数据

Apache基金会项目从角色每个节点都要有主角色只有一个打开虚拟机一定要以管理员权限打开，不然有些文件它无法访问恢复内容开始 Apache基金会项目从角色每个节点都要有主角色只有一个打开虚拟机一定要以管理员权限打开，不然有些文件它无法访问配置集群虚拟机首先配置vmnet8网卡修改 ......

数据 Hadoop更新时间 2023-07-14

Python使用hdfs上传文件至hadoop报错

报错代码： from hdfs.client import Client hdfs_client = Client('http://IP:端口') hdfs_client.makedirs(hdfs_dir) 在与hadoop创建链接后建文件夹时报错报错信息： requests.exception ......

文件 Python hadoop hdfs更新时间 2023-07-14

万字长文 | Hadoop 上云：存算分离架构设计与迁移实践

一面数据原有的技术架构是在线下机房中使用 CDH 构建的大数据集群。自公司成立以来，每年都保持着高速增长，业务的增长带来了数据量的剧增。在过去几年中，我们按照每 1 到 2 年的规划扩容硬件，但往往在半年之后就不得不再次扩容。而每次扩容都需要花费大量精力。 **为了解决包括扩容周期长、计算存储资源 ......

长文架构 Hadoop更新时间 2023-07-14

2023 Hive 面试大纲

#### 先说一些废话总结一下Hive面试大纲，方便读者快速过一遍Hive面试所需要的知识点 ## Hive的介绍 ### Hive和Hadoop的关系 1. Hive利用hdfs存储数据，利用MapReduce查询数据 2. Hive的数据存储在hdfs上，简单的说Hive就是hdfs的简单一种 ......

大纲 2023 Hive更新时间 2023-07-13

Scala连接Hbase集群出现异常tried to access method com.google.common.base.Stopwatch.<init>()V from class org.apache.hadoop.hbase.zookeeper.MetaTableLocator

总结/朱季谦在新项目上创建以下Scala代码去连接Hbase集群，用来判断Hbase是否存在某张表。 ``` //离线Hbase val conf: Configuration = HBaseConfiguration.create() conf.set("hbase.zookeeper.quor ......

MetaTableLocator 集群 Stopwatch zookeeper access更新时间 2023-07-13

Hadoop MapReduce编写实现序列化统计各学生的总分

Map类 package org.example.score; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.Text; i ......

总分序列 MapReduce Hadoop 学生更新时间 2023-07-12

安装Hadoop单节点伪分布式集群

[toc] # 安装Hadoop单节点伪分布式集群操作系统：Ubuntu server 20.04 参考文档：`http://apache.github.io/hadoop/hadoop-project-dist/hadoop-common/SingleCluster.html` ## 系统准备 ......

分布式节点集群 Hadoop更新时间 2023-07-12

基于CDH环境下的Hive数仓配置及优化

# 基于CDH环境下的Hive数仓配置及优化原文连接地址：https://blog.csdn.net/sinat_31854967/article/details/127274575 ## YARN的基础配置 ### NodeManager CPU配置 - 在YARN界面中，点击配置，然后搜索配置 ......

环境 Hive CDH更新时间 2023-07-12

hadoop基础-hadoop启动脚本分析及常见命令

进程 [hdfs]start-dfs.sh NameNode NN DataNode DN SecondaryNamenode 2NN [yarn]start-yarn.sh ResourceMananger RM NodeManager NM 脚本分析 sbin/start-all.sh libe ......

hadoop 脚本命令常见基础更新时间 2023-07-12

未安装HBase时Hive on Spark任务卡顿处理如何解决

操作场景此功能适用于Hive组件。按如下操作步骤设置参数后，在未安装HBase的环境执行Hive on Spark任务时，可避免任务卡顿。说明：Hive on Spark任务执行Hive on Spark任务。如果没有安装HBase，默认在执行Spark任务时，会尝试去连接Zookeeper访 ......

任务 HBase Spark Hive on更新时间 2023-07-11

Hive SQL 之 date()函数

当使用Hive SQL中的 date 函数时，你可以从时间戳中提取日期部分，或将日期的字符串表示转换为日期数据类型。 date 函数的语法如下： ``` date(date_string) ``` 这里， date_string 是表示日期或时间戳的输入字符串。 date 函数将输入的日期部分作为日 ......

函数 Hive date SQL更新时间 2023-07-11

HIVE sql 初识笔记

一、sql 1. 向hive里的某张表添加数据load data local inpath '/home/ocdp/hfb/sex.txt' OVERWRITE into table TD_NP_ENUM_COC_BATCH1_DAY_COLUMN_013; 2. 查询 select * from ......

笔记 HIVE sql更新时间 2023-07-11

Hive 的执行优化问题小结

hive 的谓词下推和optimize优化功能的讨论 sql 核心的大概结构为 with user_table as ( select user_id from user ) select t1.user_id from ( select t1.user_id, .... from ( select ......

小结问题 Hive更新时间 2023-07-11

hive执行truncate table报错堆栈信息

Caused by: org.apache.hadoop.hive.ql.metadata.HiveException: MetaException(message:Got exception: org.apache.hadoop.ipc.RemoteExcepti on The directory ......

堆栈 truncate table 信息 hive更新时间 2023-07-11

Hadoop中hive的使用

启动元数据管理服务（必须启动，否则无法工作）前台启动：bin/hive --service metastore 后台启动：nohup bin/hive --service metastore >> logs/metastore.log 2>&1 & 启动客户端 Hive Shell方式（可以直接写 ......

Hadoop hive更新时间 2023-07-11

Hadoop on k8s 快速部署进阶精简篇

[TOC] ## 一、概述前面一篇文章已经很详细的介绍了Hadoop on k8s部署了，这里主要针对部署时可能会调整的地方和注意事项进行讲解，想详细了解详细部署过程可参考我上一篇文章：[Hadoop on k8s 编排部署进阶篇](https://www.cnblogs.com/liugp/p/ ......

Hadoop k8s 8s on k8更新时间 2023-07-10

大数据面试题集锦-Hadoop面试题(四)-YARN

> 你准备好面试了吗?这里有一些面试中可能会问到的问题以及相对应的答案。如果你需要更多的面试经验和面试题，关注一下"**张飞的猪大数据分享**"吧，公众号会不定时的分享相关的知识和资料。 [TOC] ## 1、为什么会产生 yarn,它解决了什么问题，有什么优势？ 1）Yarn最主要的功能就是解决运 ......

试题集锦集锦试题数据 Hadoop更新时间 2023-07-10

Hadoop中YARN集群启停命令

一键启停脚本 # 一键启动yarn集群 start-yarn.sh # 一键关闭yarn集群 stop-yarn.sh 单进程启停 start和stop决定启动和停止可控制resourcemanager、nodemanager、proxyserver三种进程 yarn --daemon start| ......

集群命令 Hadoop YARN更新时间 2023-07-10

hadoop3.3.5完全分布式搭建live nodes只有一个的情况

在我配置完所有结点启动后发现存活的结点只有一个，一开始我以为是主机或者配置的问题，但是都没有用后来终于找到了问题所在，问题的关键就是xsync脚本分发后再使得三台主机的datanode id一样修改这个使得三个主机的uuid不同即可 ......

分布式只有 hadoop3 情况 hadoop更新时间 2023-07-10

Hadoop3.3.5完全分布式搭建

首先在之前的伪分布基础上克隆两台机器这样一共三台虚拟机为这三台虚拟机设置三个不同的静态ip地址和主机名我的是 billsaifu 192.168.15.130 hadoop1 192.168.15.131 hadoop2 192.168.15.132 静态IP设置 #先进入root vim / ......

分布式 Hadoop3 Hadoop 3.5更新时间 2023-07-10

hadoop2.7. 序列化对象

1.在hadoop中必须序列化对象后，才能进行网络传输,不使用java序列化的原因是：java序列化对象会添加很多信息，造成对象的字节数变大，hadoop序列化为一种高效的序列化如果在实际生产中，BooleanWrite、IntWrite，Text，FloatWrite等数据类型无法满足要求，就需 ......

序列对象 hadoop2 hadoop更新时间 2023-07-09

Hadoop on k8s 编排部署进阶篇

[TOC] ## 一、概述 `Hadoop` 是一个开源的分布式计算框架，用于处理大规模数据集的存储和处理。它使用了 `Hadoop` 分布式文件系统`（Hadoop Distributed File System，HDFS）`来存储数据，并通过 `MapReduce` 编程模型进行数据处理。 ![ ......

Hadoop k8s 8s on k8更新时间 2023-07-09

hadoop2.7.2 wordcount案例

1.配置pom.xml  <dependencies> <dependency> <groupId>junit</groupId> <artifactId>junit</artifactId> <version>4.12</version> </dependency> <depen ......

wordcount 案例 hadoop2 hadoop 7.2更新时间 2023-07-09

Hive初体验

首先，确保启动了Metastore服务。jps下，如何有如下则启动了Metastore服务可以执行：bin/hive，进入到Hive Shell环境中，可以直接执行SQL语句。创建表CREATE TABLE test(id INT, name STRING, gender STRING);插入数据 ......

Hive更新时间 2023-07-09

Hadoop 伪分布模式配置

etc/hadoop/core-site.xml <configuration>  <property> <name>fs.defaultFS</name> <value>hdfs://hadoop01:9000</value> </property ......

模式 Hadoop更新时间 2023-07-08

hadoop2.7.2上安装hive

hive版本1.21 mysql版本5.6.24 1.解压hive tar -zxf apache-hive-1.2.1-bin.tar.gz -C ../app/ cd ../app/ ln -s apache-hive-1.2.1-bin hive 2.安装mysql 注：参考Linux安装My ......

hadoop2 hadoop hive 7.2更新时间 2023-07-08

共760篇 :16/26页 首页上一页13141516171819下一页尾页