spark3 spark 3.2

Spark 3.5.0 高可用部署

1.下载Spark 3.5.0 https://spark.apache.org/downloads.html 2.安装JDK Linux 安装Openjdk 3.安装Hadoop Hadoop-3.3.6分布式集群搭建步骤 4.安装Zookeeper ZooKeeper 3.9.1 集群模式安装 ......

Spark更新时间 2024-01-02

Spark与RDD是什么

大数据框架可不是只有Hadoop哦，还有一个非常厉害的框架，它就是——Spark。一：什么是Spark Apache Spark是一个快速通用的集群计算系统，是一种与Hadoop相似的开源集群计算环境，但是Spark在一些工作负载方面表现得更加优越。它提供了Java、Scala、Python和R的 ......

Spark RDD更新时间 2024-01-02

Spark 3.5.0 独立部署(Standalone)模式

1.下载Spark 3.5.0 https://spark.apache.org/downloads.html 2.安装JDK Linux 安装Openjdk 3.安装Hadoop Hadoop-3.3.6分布式集群搭建步骤 4.解压 mkdir /usr/spark tar -zxvf spark ......

Standalone 模式 Spark更新时间 2023-12-31

spark与scala版本对应查看

https://mvnrepository.com/artifact/org.apache.spark/spark-core ......

版本 spark scala更新时间 2023-12-31

为什么Spark比MapReduce快？

1、内存和磁盘使用方面 Spark vs MapReduce不等于内存 vs 磁盘，Spark和MapReduce的计算都发生在内存中，区别在于： MapReduce需要将每次计算的结果写入磁盘，然后再从磁盘读取数据，从而导致了频繁的磁盘IO。 Spark通常不需要将计算的结果写入磁盘，可以在内存中 ......

MapReduce Spark更新时间 2023-12-30

Spring Boot 2.x 到 3.2 的全面升级指南

Spring Framework 是一种流行的开源企业级框架，用于创建在 Java Virtual Machine (JVM) 上运行的独立、生产级应用程序。而Spring Boot 是一个工具，可以让使用 Spring 框架更快、更轻松地开发 Web 应用程序和微服务。随着 Spring Boot ......

升级指南指南 Spring Boot 3.2更新时间 2023-12-29

spark 3.0新特性

一、Adaptive Query Execution 自适应查询 https://blog.51cto.com/u_12865/7338853 二、Dynamic Partion Pruning 动态裁剪分区 Apache Spark 3.0 动态分区裁剪（Dynamic Partition Pru ......

特性 spark 3.0更新时间 2023-12-28

详解Java编写并运行spark应用程序的方法WordCount_tyt2023

SparkContext：通往Spark集群的入口点，用于创建RDD和广播变量等 RDD：弹性分布式数据集，Spark应用程序的核心抽象 Transformation：操作RDD生成新的RDD，如map、filter等 Action：对RDD的操作，如count、collect等环境：Spark ......

WordCount_tyt 应用程序 WordCount 程序方法更新时间 2023-12-28

Spark 开发与应用_tyt2023

本实验基于MRS环境，主要介绍如何利用Spark RDD的常用算子进行简单统计分析，以及如何利用SparkSQL进行结构化批处理。购买弹性公网IP 购买MRS集群选择“自定义购买” 区域：华北—北京四计费模式：按需计费集群名称：mrs-bigdata 版本类型：普通版集群版本：MRS 3. ......

Spark 2023 tyt更新时间 2023-12-27

Spark写hive insertInto和saveAsTable的差别和错误

insertInto必须保证源表字段顺序和hive表字段顺序一致，不然会插入乱序，如果字段数不一致，会报错 saveAsTable append模式下，如果字段数不一致，会报错，overwrite模式下，会重建表如果是外部表，已经存在了数据，saveAsTable会报错 org.apache.sp ......

saveAsTable insertInto 差别错误 Spark更新时间 2023-12-23

Hago 的 Spark on ACK 实践

长期以来，Hago 都是在 IDC 里运行大数据任务，以支撑上面的许多产品，从 2022 年开始，Hago 开始将大数据业务迁移上云，并以 Spark on ACK 的形式来运行，本文主要针对迁移过程进行介绍。 ......

Spark Hago ACK on更新时间 2023-12-23

Spark常用Sql

一、日期处理 1、查询当前日期 SELECT current_date() 2023-12-22 2、查询当前时间戳 select current_timestamp() 2023-12-22 14:50:19.213 3、查询当前时间戳-1小时 select current_timestamp() ......

常用 Spark Sql更新时间 2023-12-22

Hive和Spark生产集群搭建

1.环境准备 1.1 版本选择序号 bigdata-001 bigdata-002 bigdata-003 bigdata-004 bigdata-005 MySQL-8.0.31 mysql Datax Datax Datax Datax Datax Datax Spark-3.3.1 Spar ......

集群 Spark Hive更新时间 2023-12-21

Spring Boot 3.2 + CRaC = 王炸！

原文：https://foojay.io/today/springboot-3-2-crac/ 前段时间发布了 Spring 6.1 和 SpringBoot 3.2，它们都完全支持 CRaC（检查点协调恢复）。如果你想了解有关 CRaC 的更多信息，请随时阅读此处： https://docs.a ......

Spring Boot CRaC 3.2更新时间 2023-12-21

安装spark启动及遇到的问题

参考博主：Ubuntu下安装Spark3.2.0教程_ubuntu火狐浏览器怎么下载spark-CSDN博客在这个博主的内容中安装spark，要注意滴是：这里同时修改了spark-evn.sh的文件名称记得修改，然后下面运行的时候我啥结果也没有，后面直接不管了打算执行命令：spark-shel ......

问题 spark更新时间 2023-12-18

Linux_3.2 Shell语法

1 循环语句 1.1 for…in…do…done 命令格式： for var in val1 val2 val3 #类似于枚举 do 语句1 语句2 ... done 示例1，输出a 2 cc，每个元素一行： for i in a 2 cc do echo $i done 示例2，输出当前路径下的 ......

语法 Linux Shell 3.2更新时间 2023-12-14

[spark] coalesce() 和 repartition()的区别

coalesce(1) 的主要作用是将数据合并到尽可能少的分区中，而 repartition(1) 则是将数据随机重分区为一个分区。这使得 coalesce(1) 相对而言更加高效，因为它减少了数据移动的次数，只需要在当前 Executor 上将所有分区的数据都收集到当前应用程序的单个 Execut ......

repartition coalesce spark更新时间 2023-12-13

Iceberg Spark存储过程-表治理工具

一、简介存储过程（Procedure）是数据库领域的概念，类似于编程语言中的方法或函数，是对实现特定操作的封装，原生的 Spark SQL 中是不支持存储过程的，Iceberg 0.11.0版本之后对其进行了扩展，并提供了部分存储过程的实现。Iceberg 中提供的所有存储过程都在system n ......

过程 Iceberg 工具 Spark更新时间 2023-12-08

Spring Boot 3.2项目中使用缓存Cache的正确姿势！！!

你是否曾想过为什么在 Spring Boot 应用中缓存是如此重要？答案在于它通过减少数据检索时间来提高性能。在本文中，我们将深入探讨缓存对微服务模式的影响，并探讨根据操作易用性、速度、可用性和可观测性等因素选择正确缓存的重要性。我们还将探讨如何最大程度地提高缓存性能和可用性。 1 缓存实现 1.1 ......

缓存姿势项目 Spring Cache更新时间 2023-12-06

spark-sql查询Iceberg时处理流程

1、查询表结构 show create table data_lake_ods.test CREATE TABLE spark_catalog.data_lake_ods.test ( `user_number` BIGINT NOT NULL, `subclazz_number` BIGINT N ......

spark-sql 流程 Iceberg spark sql更新时间 2023-12-05

day09 Helm开发与实践-基于Helm的方式运维管理应用（3.2-3.3）

一、Helm开发与实践 1、Helm Chart详解 1.1 Chart 目录结果 # helm create nginx Creating nginx # tree nginx nginx ├── charts ├── Chart.yaml ├── templates │ ├── deployme ......

Helm 方式 day 3.2 3.3更新时间 2023-12-02

Thinkphp 3.2 Cookie丢失导致中英文混排

问题关键： CheckLangBehavior.class.php文件中，使用cookie保存语言版本，如果cookie数据被清或者丢失，导致页面出现非预期版本解决办法：不使用cookie保存数据，使用session保存数据，但会出现另外一个问题，CheckLangBehavior.class. ......

中英 Thinkphp Cookie 3.2更新时间 2023-12-01

spark提交文件支持路径类型

spark-submit 提交文件支持的路径类型类似以下参数 --files --jars --archives --conf spark.yarn.jars --conf spark.yarn.archive --conf spark.yarn.dist.archives --conf spar ......

路径类型文件 spark更新时间 2023-11-30

spark提交参数 [spark.yarn.dist.jars] 和 [spark.yarn.jars ]区别

spark.yarn.dist.jars 作用用于指定分发到集群节点上的 JAR 包的路径。工作原理 Spark 应用程序的执行器会将这些 JAR 包分发到它们的本地文件系统上。这样，应用程序可以在执行期间访问这些 JAR 包。使用场景适用于应用程序的依赖项，这些依赖项不需要在整个集群中共享 ......

spark jars yarn 参数 dist更新时间 2023-11-30

spark离线分析--本地Spark1.6版本读写hive表

1. 搭建好hive环境，并将hive-site.xml文件放到本地工程的resources目录下 2. java测试代码 public class SparkHiveTest{ public static void main(String[] args){ JavaSparkContext jav ......

版本 Spark1 spark Spark hive更新时间 2023-11-28

spark的shuffle和mapreduce的shuffle的区别

功能上，MR的shuffle和Spark的shuffle是没啥区别的，都是对Map端的数据进行分区，要么聚合排序，要么不聚合排序，然后Reduce端或者下一个调度阶段进行拉取数据，完成map端到reduce端的数据传输功能。方案上，有很大的区别，MR的shuffle是基于合并排序的思想，在数据进入 ......

shuffle mapreduce spark更新时间 2023-11-26

spark的excutor是动态的资源分配吗，还是写死的？

在Apache Spark中，Executor的资源分配可以是动态的，而不是写死的。Apache Spark提供了一种称为动态资源分配（Dynamic Allocation）的机制，允许根据应用程序的实际需求动态调整Executor的数量。动态资源分配的主要思想是根据当前应用程序的工作负载来增加或 ......

资源分配 excutor 还是动态资源更新时间 2023-11-26

3.2 Windows驱动开发：内核CR3切换读写内存

CR3是一种控制寄存器，它是CPU中的一个专用寄存器，用于存储当前进程的页目录表的物理地址。在x86体系结构中，虚拟地址的翻译过程需要借助页表来完成。页表是由页目录表和页表组成的，页目录表存储了页表的物理地址，而页表存储了实际的物理页框地址。因此，页目录表的物理地址是虚拟地址翻译的关键之一。在操作系... ......

内核内存 Windows 3.2 CR3更新时间 2023-11-24

Spring Boot 3.2发布：大量Java 21的支持上线，改进可观测性

就在今天凌晨，Spring Boot 3.2正式发布了！该版本是在Java 21正式发布之后的重要支持版本，所以在该版本中包含大量对Java 21支持的优化。下面，我们分别通过Spring官方发布的博文和Josh Long长达80+分钟的介绍视频，一起认识一下Spring Boot 3.2最新版本 ......

Spring Boot Java 3.2更新时间 2023-11-24

3.2 实现ILP的基本编译技巧

3.2 实现ILP的基本编译技巧指令调度和循环展开为了尽可能避免流水线的停滞，可以寻找指令间的依赖关系并重叠不相关指令序列。循环展开可以减少分支指令次数，使用不同的寄存器来避免不必要的约束，更多的指令也可以更方便进行指令调度。但是需要调整循环终止和迭代代码。所有这些转换背后的关键需求是理解一 ......

技巧 3.2 ILP更新时间 2023-11-23

共277篇 :2/10页 首页上一页12345下一页尾页