cloudcanal starrocks doris emr

CloudCanal x Redis 数据同步指令集丰富与细节优化

简述 CloudCanal 前一段时间支持了 Redis 到 Redis 数据迁移同步能力,并支持其双向同步,但是支持的指令种类有限。 随着用户使用,指令支持不全面成为一个比较大的问题,所以最近的版本,我们对此能力,结合用户实际碰到的问题,进行了新一轮优化。 此轮优化的特点是: 增加数据初始化的类型 ......
指令 CloudCanal 细节 数据 Redis

docker部署starRocks

docker run -p 9030:9030 -p 8030:8030 -p 8040:8040 --name starRocks -itd starrocks/allin1-ubuntu:latest docker exec -it starRocks bash docker restart s ......
starRocks docker

StarRocks 技术内幕:查询原理浅析

一条查询 SQL 在关系型分布式数据库中的处理,通常需要经过 3 大步骤: 1. 将 SQL 文本转换成一个 “最佳的”分布式物理执行计划 2. 将执行计划调度到计算节点 3. 计算节点执行具体的物理执行计划 本文将详细解释在 StarRocks 中如何完成一条查询 SQL 的处理。 首先来了解 S ......
内幕 StarRocks 原理 技术

DataSophon集成StarRocks分析数据库

DataSophon集成StarRocks分析数据库 StarRocks官方文档: StarRocks | StarRocks StarRocks下载地址: Download StarRocks Free | StarRocks 选择自己要安装的版本下载,StarRocks-3.2.1.tar.gz ......
DataSophon StarRocks 数据库 数据

CloudCanal x Debezium 打造实时数据流动新范式

本文主要介绍 CloudCanal 从 Kafka 订阅消费 Debezium 格式数据同步到 10 几种主流数据库和数仓的技术和使用示例 ......
范式 数据流 CloudCanal 实时 Debezium

测试 doris stream load 数据流

root@tc-doris-fe-1:~# vim data.csv root@tc-doris-fe-1:~# curl --location-trusted -u root -T ./data.csv -H "label:label_example" -H "column_separator:, ......
数据流 数据 stream doris load

doris用户权限管理

Doris 用户权限和MySQL相差不多,在Doris中,GRANT 命令用于赋予指定用户或角色指定的权限。 使用语法如下: GRANT privilege_list ON db_name[.tbl_name] TO user_identity [ROLE role_name] GRANT priv ......
权限 用户 doris

doris创建用户

创建用户,赋予所有权限 CREATE USER 'sysdba' IDENTIFIED BY 'Tsl@142536'; GRANT ALL ON *.*.* TO 'sysdba'@'%'; ......
用户 doris

EMR-hive集成ranger

hive集成ranger:https://help.aliyun.com/zh/emr/emr-on-ecs/user-guide/enable-hive-in-ranger-and-configure-related-permissions ......
EMR-hive ranger hive EMR

DataX vs 腾讯云COS对象存储 -> StarRocks集群

本文将介绍使用DataX读出Cos的Orc文件往StarRocks里面写。 需求: 需要将腾讯云cos上84TB的数据, 同步到StarRocks某个大表。正常每个分区数据量20~30亿,600GB。 工具:DataX插件:hdfsreader、starrockswriter对象存储COS:非融合 ......
集群 StarRocks 对象 DataX COS

EMR-hive集成openldap

LDAP认证:https://help.aliyun.com/zh/emr/emr-on-ecs/user-guide/use-ldap-authentication?spm=a2c4g.11186623.0.i4 OpenLDAP试用说明参考:https://help.aliyun.com/zh/ ......
EMR-hive openldap hive EMR

用 CloudCanal 快速验证阿里云 EMR for StarRocks 和 Doris

背景 StarRocks 和 Doris 是近两年来相当流行的、国产的、开源的实时数仓,不仅数据检索、分析能力出众,而且数据准备实时性好、准确度高、使用丝滑,可如同在线数据库般使用。 CloudCanal 在早期即支持此两种实时数仓,并且经过多次迭代,无论功能、性能、稳定性都趋于成熟。 不过正儿八经 ......
CloudCanal StarRocks Doris EMR for

聊聊分布式 SQL 数据库Doris(九)

优化器的作用是优化查询语句的执行效率,它通过评估不同的执行计划并选择最优的执行计划来实现这一目标。 CBO: 一种基于成本的优化器,它通过评估不同查询执行计划的成本来选择最优的执行计划。CBO会根据数据库系统定义的统计信息以及其他因素,对不同的执行计划进行评估,并选择成本最低的执行计划。CBO的目标 ......
分布式 数据库 数据 Doris SQL

聊聊分布式 SQL 数据库Doris(八)

稀疏索引 密集索引:文件中的每个搜索码值都对应一个索引值,就是叶子节点保存了整行. 稀疏索引:文件只为索引码的某些值建立索引项. 稀疏索引的创建过程包括将集合中的元素分段,并给每个分段中的最小元素创建索引。在搜索时,先定位到第一个大于搜索值的索引的前一个索引,然后从该索引所在的分段中从前向后顺序遍历 ......
分布式 数据库 数据 Doris SQL

聊聊分布式 SQL 数据库Doris(七)

LSM-Tree Doris的存储结构是类似LSM-Tree设计的,因此很多方面都是通用的,先阅读了解LSM相关的知识,再看Doris的底层存储与读取流程会清晰透彻很多,如下是几个关键的设计: SSTable: Sorted Strings Table; 一般由一组数据block和一组元数据bloc ......
分布式 数据库 数据 Doris SQL

UData+StarRocks在京东物流的实践

数据服务与数据分析场景是数据团队在数据应用上两个大的方向,行业内大家有可能会遇到很多问题,数据服务和数据分析系统也是无法统一,分析产生的数据结果往往是离线的,需要额外开发数据服务,无法快速转化为线上服务赋能外部系统,使得分析和服务之间难以快速形成闭环。而且在以往数据加工过程中存储往往只考虑了当时的需... ......
StarRocks 物流 UData

聊聊分布式 SQL 数据库Doris(六)

负载均衡 此处的负载均衡指的是FE层的负载均衡. 当部署多个 FE 节点时,用户可以在多个 FE 之上部署负载均衡层来实现 Doris 的高可用。官方文档描述: 负载均衡 。 实现方式 实现方式有多种,如下列举。 开发者在应用层自己进行重试与负载均衡。 JDBC Connector 发现一个连接挂掉 ......
分布式 数据库 数据 Doris SQL

聊聊分布式 SQL 数据库Doris(五)

阅读 Doris SQL 原理解析,总结下Doris中SQL解析流程: 词法识别:解析原始SQL文本,拆分token 语法识别:将token转换成AST 单机逻辑查询计划:将AST经过一系列的优化(比如,谓词下推等)成查询计划,提高执行性能与效率。 分布式逻辑查询计划:根据分布式环境(数据分布信息、 ......
分布式 数据库 数据 Doris SQL

聊聊分布式 SQL 数据库Doris(四)

FE层的架构都能在网上找到说明. 但BE层的架构模式、一致性保障、与FE层之间的请求逻辑,数据传输逻辑等,我个人暂时没有找到相应的博客说明这些的。当然这些是我个人在学习与使用Doris过程中,对内部交互逻辑与实现感兴趣才有这些疑问. 还好现在有GPT这类大模型,有了疑问,只要问题描述得当,大多可以解 ......
分布式 数据库 数据 Doris SQL

聊聊分布式 SQL 数据库Doris(三)

详细内容阅读: Apache Doris 分区分桶新功能 与 数据划分. 在此基础上做总结与延伸. 在 Doris 的存储引擎规则: 表的数据是以分区为单位存储的,不指定分区创建时,默认就一个分区. 用户数据首先被划分成若干个分区(Partition),划分的规则通常是按照用户指定的分区列进行范围划 ......
分布式 数据库 数据 Doris SQL

聊聊分布式 SQL 数据库Doris(二)

Doris中,Leader节点与非Leader节点和Observer节点之间的元数据高可用和一致性,是通过bdbje(全称:Oracle Berkeley DB Java Edition)的一致性和高可用实现的。 元数据与同步流程 元数据主要存储四类数据: 用户数据信息. 包括数据库, 表的sche ......
分布式 数据库 数据 Doris SQL

聊聊分布式 SQL 数据库Doris(一)

MPP MPP:Massively Parallel Processing, 即大规模并行处理. 一般用来指多个SQL数据库节点搭建的数据仓库系统. 执行查询的时候, 查询可以分散到多个SQL数据库节点上执行, 然后汇总返回给用户. Doris Doris 作为一款开源的 MPP 架构 OLAP 高 ......
分布式 数据库 数据 Doris SQL

陈长城:NineData面向Doris实时数仓集成的技术实践

在刚刚过去的北京Doris Summit Asia 2023,玖章算术技术副总裁陈长城受邀参加并做了《NineData面向Doris实时数仓集成的技术实践》报告。 ......
实时 NineData Doris 技术

ODBC 连接 Doris数据库

前言 主要测试通过ODBC方式来连接Doris 数据 一、环境 1、Cntos7 1、Doris 2.0.2 2、Mysql-connector-odbc-5.3.7 二、使用步骤 1.安装 odbc驱动 Mysql ODBC驱动下载地址 https://downloads.mysql.com/ar ......
数据库 数据 Doris ODBC

StarRocks 新一代极速全场景MPP数据库

StarRocks 介绍 1.StarRocks介绍 StarRocks是新一代极速全场景MPP数据库。 StarRocks充分吸收关系型OLAP数据库和分布式存储系统在大数据时代的优秀研究成果,在业界实践的基础上,进一步改进优化、升级架构,并增添了众多全新功能,形成了全新的企业级产品。 StarR ......
新一代 StarRocks 场景 数据库 数据

doris

## doris ### Partition & Tablet - Partition 逻辑分区往往根据业务通过用户指定的分区列进行范围划分,可以视为逻辑上最小的管理单元,好比导入和删除操作就是partition。 - list partition ![1652779895992](https:// ......
doris

doris FE启动异常:org.yaml.snakeyaml.representer.Representer: method <init>()V not found

doris FF启动异常,异常信息如下: 2023-11-01 09:53:22,691 INFO (main|1) [PaloFe.start():124] Palo FE starting... 2023-11-01 09:53:22,699 INFO (main|1) [FrontendOpt ......

StarRocks+prometheus+grafana 监控

StarRocks + prometheus+grafana 监控 StarRocks提供两种监控报警的方案,第一种是使用内置的StarRocks Manager,其自带的Agent从各个Host采集监控信息上报到Center Service然后做可视化展示,也提供了邮件和Webhook的方式发送报 ......
prometheus StarRocks grafana

Apache Doris 使用指南

欢迎参观我的博客,一个Vue 与 SpringBoot结合的产物:https://poetize.cn 博客:https://gitee.com/littledokey/poetize-vue2.git 聊天室:https://gitee.com/littledokey/poetize-im-vue ......
使用指南 指南 Apache Doris

ambari集成starrocks

ambari集成starrocks 创建服务目录 cd /var/lib/ambari-server/resources/stacks/HDP/3.1/services/ mkdir SERVERNAME # 服务名称目录必须大写 整体目录结构 . ├── configuration │ └── s ......
starrocks ambari
共112篇  :1/4页 首页上一页1下一页尾页