集群hadoop hive

EMR-hive集成ranger

hive集成ranger：https://help.aliyun.com/zh/emr/emr-on-ecs/user-guide/enable-hive-in-ranger-and-configure-related-permissions ......

EMR-hive ranger hive EMR更新时间 2023-12-13

SAP-APP-服务器组-pacemaker集群的基础环境的安装部署-001

1、安装 pacemaker 相关的软件及可能会用到的软件，两台主机都需要安装 [root@app01 qq-5201351]# yum install nmap-ncat -y [root@app01 qq-5201351]# yum install pcs -y [root@app01 qq-5 ......

集群 pacemaker SAP-APP 环境服务器更新时间 2023-12-13

kubeadm安装k8s集群

1.机器准备部署k8s集群的节点按照用途可以划分为如下2类角色： master：集群的master节点，集群的初始化节点，基础配置不低于2c 4g slave：集群的slave节点，可以多台，基础配置不低于1c 2g 这里教程是基于非高可用版本的k8s集群，高可用是指有多个k8s-master主节 ......

集群 kubeadm k8s k8 8s更新时间 2023-12-13

教你使用Prometheus-Operator进行K8s集群监控

本文分享自华为云社区《Promethues-operator入门使用指导》，作者：可以交个朋友。一、背景在非operator配置的普罗中我们监控k8s集群都是通过配置configmap进行服务发现和指标拉取。切换到prometheus-operator难免会有些使用问题。不少用户已经习惯底层配 ......

Prometheus-Operator 集群 Prometheus Operator K8s更新时间 2023-12-13

prometheus监控k8s集群node节点/linux操作系统

prometheus监控k8s集群node节点/linux操作系统一、监控linux操作系统 1、下载二进制包 wget https://github.com/prometheus/node_exporter/releases/download/v1.7.0/node_exporter-1.7.0 ......

节点集群 prometheus 系统 linux更新时间 2023-12-13

Hadoop MapReduce编程规范

用户编写的程序分为三个部分:Mapper、Reducer和Driver 1.Mapper阶段用户自定义的Mapper要继承自己的父类 Mapper的输入数据是KV对的形式（KV的类型可自定义） Mapper中的业务逻辑写在map()方法中 Mapper的输出数据是KV对的形式（KV的类型可自定义） ......

MapReduce Hadoop更新时间 2023-12-13

四、Hive优化

1.1 hive的随机抓取策略理论上来说，Hive中的所有sql都需要进行mapreduce，但是hive的抓取策略帮我们省略掉了这个过程，把切片split的过程提前帮我们做了。 set hive.fetch.task.conversion=none; (一旦进行这么设置，select字段名也是 ......

Hive更新时间 2023-12-13

三、Hive学习之SQL、函数

SQL练习 1、count(*)、count(1) 、count('字段名') 区别从执行结果来看 count(*)包括了所有的列，相当于行数，在统计结果的时候，不会忽略列值为NULL 最慢的 count(1)包括了忽略所有列，用1代表代码行，在统计结果的时候，不会忽略列值为NULL 最快的 co ......

函数 Hive SQL更新时间 2023-12-13

Kafka集群搭建、注意事项及示例

1. 安装Zookeeper： Kafka依赖于Zookeeper来进行集群协调。确保安装了Zookeeper，并配置好。 2.下载和解压Kafka：从官方网站下载Kafka，并解压到所需的目录。 3.配置Kafka：修改Kafka的配置文件以适应集群环境。主要修改server.properti ......

示例集群注意事项事项 Kafka更新时间 2023-12-12

centos7搭建kubernetes-v1.25.1集群（Containerd作为运行时）

集群配置节点名称内存硬盘处理器内核总数ip master 6GB 40GB 6 192.168.67.166 node1 6GB 40GB 6 192.168.67.167 node2 6GB 40GB 6 192.168.67.168 一、所有节点更改镜像源 curl -o /etc/yum.r ......

集群 kubernetes-v Containerd kubernetes centos7更新时间 2023-12-12

elasticsearch安装-集群

下载安装包国内镜像，速度非常快 https://mirrors.huaweicloud.com/elasticsearch/ https://mirrors.huaweicloud.com/kibana/ wget https://mirrors.huaweicloud.com/elasticse ......

集群 elasticsearch更新时间 2023-12-12

Hadoop NameNode(SecondaryNameNode) Fsimage和Edits解析

NameNode被格式化之后，将在NameNode目录下产生一些文件 1.Fsimage文件 Fsimage文件是HDFS文件系统元数据的一个永久性的检查点，其中包含HDFS文件系统的所有目录和文件inode的序列化信息 2.Edits文件 Edits文件存放了HDFS文件系统的所有更新操作的路径， ......

SecondaryNameNode NameNode Fsimage Hadoop Edits更新时间 2023-12-12

数据库集群主键为什么不用uuid

主键用数字还是UUID？ UUID 是通用唯一识别码的缩写，其目的是让分布式系统中的所有元素，都能有唯一的辨识信息，而不需要通过中央控制端来做辨识信息的指定。在数据库集群中，为了避免每个MySQL各自生成的主键产生重复，所以有人考虑采用UUID方式。使用UUID的好处使用UUID，分布式生成主键 ......

集群不用数据库数据 uuid更新时间 2023-12-12

DataX vs 腾讯云COS对象存储 -> StarRocks集群

本文将介绍使用DataX读出Cos的Orc文件往StarRocks里面写。需求: 需要将腾讯云cos上84TB的数据, 同步到StarRocks某个大表。正常每个分区数据量20~30亿，600GB。工具：DataX插件：hdfsreader、starrockswriter对象存储COS：非融合 ......

集群 StarRocks 对象 DataX COS更新时间 2023-12-11

docker swarm 部署一主两从的redis集群

docker-compose文件准备 docker-compose-redis-cluster.yml version: '3.8' services: redis-master: image: redis command: redis-server --requirepass your_passw ......

集群 docker swarm redis更新时间 2023-12-11

超算集群安装OpenFOAM-LIGGGHTS-CFDEM(普通用户权限-以CSU HPC CentOS7.9为例)

普通用户权限超算集群安装OpenFOAM-LIGGGHTS-CFDEM，由于缺少root权限，无法根据CFDEM官方instruction进行安装。本文以CSU超算平台为例，利用普通用户权限进行编译安装。文章修正了已有教程中部分问题，特别感谢希望先生与记得小蘋初见教程。 1. 安装必要依赖包此部 ......

OpenFOAM-LIGGGHTS-CFDEM 集群 OpenFOAM LIGGGHTS 权限更新时间 2023-12-11

Hadoop 配置的优先级

从低到高 1.默认配置默认文件文件存放在Hadoop的jar包中的位置 core-default.xml hadoop-common-3.3.6.jar/core-default.xml hdfs-default.xml hadoop-hdfs-3.3.6.jar/hdfs-default.xm ......

优先级 Hadoop更新时间 2023-12-11

Ranther管理K8S集群

什么是Ranther Rancher 是一个 Kubernetes 管理工具，让你能在任何地方和任何提供商上部署和运行集群。 Rancher 可以创建来自 Kubernetes 托管服务提供商的集群，创建节点并安装 Kubernetes，或者导入在任何地方运行的现有 Kubernetes 集群。 R ......

集群 Ranther K8S K8 8S更新时间 2023-12-11

集群参数调优

一、关键参数设置 1、HDFS 参数值描述文件大小文件大小 2、腾讯CHDS(对象大数据存储) 参数值描述最大访问频次 ......

集群参数更新时间 2023-12-11

C++聊天集群服务器6

一、客户端开发代码如下： #include "json.hpp" #include <iostream> #include <thread> #include <string> #include <vector> #include <chrono> #include <ctime> #includ ......

集群服务器更新时间 2023-12-10

Java实现对Hadoop HDFS的API操作

1.配置Hadoop的Windows客户端 Hadoop 配置Windows 客户端 2.新建Maven项目[略] 3.添加依赖  <dependen ......

Hadoop Java HDFS API更新时间 2023-12-10

Hadoop 配置Windows 客户端

1.根据Hadoop版本下载Windows依赖，并放置到非中文目录下 https://github.com/cdarlint/winutils 2.配置环境变量 HADOOP_HOME -> 放置的目录地址 PATH -> 追加%HADOOP_HOME%\bin 3.测试环境双击winutils. ......

客户端 Windows 客户 Hadoop更新时间 2023-12-10

Hadoop HDFS 文件块大小

HDFS中的文件在物理上是分块存储(Block),块的大小可以通过配置参数(dfs.blocksize)来配置，默认大小在Hadoop2.x/3.x版本中是128M，1.x版本中是64M. 建议配置为物理机硬盘每秒的读取速度,如机械硬盘则建议为128M，SSD则配置为256M。 ......

大小文件 Hadoop HDFS更新时间 2023-12-10

基于Docker容器搭建hadoop完全分布式集群环境

简介物理机：windows10 宿主机：Centos7虚拟机，需要安装Docker服务 hadoop集群节点：3个centos7的容器，hadoop1、hadoop2、hadoop3 组件：容器镜像：Centos7 Docker CE 24.0.7 JDK1.8.0_181 Hadoop3.1. ......

分布式集群容器环境 Docker更新时间 2023-12-10

kubeadm更新k8s集群证书(1.23.14版本)

1、更新证书 [root@k8s-master01 kubernetes-1.23.14-0]# kubeadm certs renew all --config=kubeadm-config.yaml certificate embedded in the kubeconfig file for ......

集群证书 kubeadm 版本 k8s更新时间 2023-12-09

Hadoop 常用端口号

端口名称 Hadoop2.x Hadoop3.x HDFS NameNode内部通信端口 8020 / 9000 8020 / 9000 / 9820 HDFS NameNode HTTP UI 50070 9870 YARN MapReduce查看执行任务端口 8088 8088 历史服务器通信端 ......

口号常用 Hadoop更新时间 2023-12-09

kubeadm续期k8s集群证书

1、备份 mkdir /opt/2023-12-09-k8s-backup cp -a /etc/kubernetes /opt/2023-12-09-k8s-backup cp -a /var/lib/etcd /opt/2023-12-09-k8s-backupcp -a /root/.kube ......

集群证书 kubeadm k8s k8更新时间 2023-12-09

k8s:通过 kubectl 插件 Kubepug 实现集群升级检查(废弃API资源检查)

背景:k8s 的版本迭代很快，虽然主要版本一直没有变化，但是次要版本一直在迭代，2022年一年就发布了三个次要版本，同时不同的次要版本之间 API 资源一直在变化，有新加入的，也有废弃删除的。不同版本的 api 资源版本也有不同，往往不是向下兼容的，比如在低版本中 API 资源版本为 v1beta1 ......

集群插件 Kubepug kubectl 资源更新时间 2023-12-09

二、Hive学习

1、Hive分区(十分重要！！) 在大数据中，最常见的一种思想就是分治，我们可以把大的文件切割划分成一个个的小的文件，这样每次操作一个个小的文件就会很容易了，同样的道理，在hive当中也是支持这种思想的，就是我们可以把大的数据，按照每天或者每小时切分成一个个小的文件，这样去操作小的文件就会容易很多了 ......

Hive更新时间 2023-12-08

一、Hive概述与安装部署

1、Hive基本概念 1.1 Hive简介 Hive本质是将SQL转换为MapReduce的任务进行运算，底层由HDFS来提供数据存储，说白了hive可以理解为一个将SQL转换为MapReduce的任务的工具，甚至更近一步说hive就是一个MapReduce客户端。思考：计算文件user.txt中 ......

Hive更新时间 2023-12-08

共2030篇 :8/68页 首页上一页567891011下一页尾页