火山

挖掘优质短视频超百万条,火山引擎DataLeap助力电商平台生态治理

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 在人们的日常生活中,网购已经成为人们生活中不可或缺的购物形式。 根据《中国社交电商行业发展白皮书(2022)》的数据显示,2022年社交电商市场交易规模达到28542.8亿元,预计2023年中国社交电商行业交易规模 ......
万条 火山 DataLeap 生态 引擎

火山引擎ByteHouse:一套方案,让OLAP引擎在精准投放场景更高效

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 由于流量红利逐渐消退,越来越多的广告企业和从业者开始探索精细化营销的新路径,取代以往的全流量、粗放式的广告轰炸。精细化营销意味着要在数以亿计的人群中优选出那些最具潜力的目标受众,这无疑对提供基础引擎支持的数据仓库能 ......
引擎 火山 ByteHouse 场景 方案

火山引擎DataLeap的Data Catalog系统公有云实践

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 Data Catalog是一种元数据管理的服务,会收集技术元数据,并在其基础上提供更丰富的业务上下文与语义,通常支持元数据编目、查找、详情浏览等功能。目前Data Catalog作为火山引擎大数据研发治理套件Dat ......
火山 DataLeap Catalog 引擎 系统

如何精准预测天气?火山引擎ByteHouse与大地量子这么做

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 伴随着气象技术的发展以及城市气象设施的完善,气象监测服务能力在不断提高,实现短期甚至中长期的气象预测成为可能。 短期、长期的天气形势预测,不仅能帮助相关行业、有关部门针对性地进行极端天气防范准备,降低气象灾害带来的 ......
量子 火山 ByteHouse 大地 天气

字节跳动基于火山引擎DataLeap的一站式数据治理架构实践

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 在7月22日举行的 ArchSummit 全球架构师峰会(深圳站)上,来自火山引擎DataLeap的技术专家为大家带来了字节跳动基于火山引擎DataLeap的全域数据治理方案分享。 本次分享共分为机遇挑战、字节数据 ......
字节 火山 架构 DataLeap 引擎

火山引擎开发者社区一周资讯精选(8.5-8.11)

🔥直播回放 1. 从云基础设施到上层云应用的火山引擎边缘云技术探索与实践|火山引擎开发者社区 Meetup 第 11 期 2. 讲师 PPT|火山引擎开发者社区 Meetup 第 11 期 🔥技术干货 1. Katalyst:字节跳动云原生成本优化实践 2. ByteFUSE的演进与落地 3. ......
开发者 火山 引擎 社区 资讯

收钱吧与火山引擎VeDI合作一年后 有了哪些新变化?

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 收钱吧正在和火山引擎数智平台(VeDI)跑出一条业务提效新通路。 相关数据显示,收钱吧的日服务人次就近5000万,累计服务人次超过500亿次。惊人的数字背后,收钱吧通过自建和与第三方厂商合作等方式,不断提升的企业数 ......
火山 引擎 VeDI

火山引擎DataLeap数据质量动态探查及相关前端实现

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 需求背景 火山引擎DataLeap数据探查上线之前,数据验证都是通过写SQL方式进行查询的,从编写SQL,到解析运行出结果,不仅时间长,还会反复消耗计算资源,探查上线后,只需要一次探查,就可以得到整张表的探查报告, ......
前端 火山 DataLeap 质量 引擎

火山引擎DataLeap:更强数据目录搜索能力,做到一步找数

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 随着数据管理变得更加复杂,元数据的重要性呈指数级增加。 如今,Data Catalog(数据目录)被看成是元数据管理的最佳工具,而一个通用的Data Catalog平台,通常包含元数据管理,搜索,血缘,标签,术语等 ......
火山 DataLeap 能力 引擎 目录

火山引擎DataLeap的Data Catalog系统搜索实践 (上)

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 摘要 火山引擎大数据研发治理套件 DataLeap的Data Catalog系统通过汇总和组织各种元数据,解决了数据生产者梳理数据、数据消费者找数和理解数的业务场景,其中搜索是Data Catalog的主要功能之一 ......
火山 DataLeap Catalog 引擎 系统

火山引擎ByteHouse:云原生数据库如何提升MySQL兼容性?

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 当前各类软件层出不穷,单独某一款软件往往难以满足企业应用需求,一般都需要与各类软件组合使用,这时软件生态兼容性就显得格外重要。作为关系数据库管理系统的代表之一,MySQL支持大多数操作系统、编程语言、程序语言,具备 ......
兼容性 火山 ByteHouse 数据库 引擎

火山引擎数智平台旗下DataWind升级半年报 6大功能助力企业数据消费

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 “以数据消费促数据生产”——是火山引擎提出的数据飞轮的核心理念,在这一理念的指导下,智能数据洞察作为数据消费环节的重要工具,从数据与业务之间的互动关系出发,一直在迭代产品能力。2023年上半年,智能数据洞察发布了3 ......
半年报 大功 火山 旗下 DataWind

打通数据治理全链路,火山引擎DataLeap数据治理平台公有云版本正式发布

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 近日,火山引擎DataLeap正式对外发布数据治理平台公有云版。DataLeap是火山引擎大数据研发治理套件,随着其子套件数据治理平台与CDH引擎底座成功适配,火山引擎决定通过公有云,进一步对外开放从规划、诊断到经 ......
数据 链路 火山 DataLeap 版本

火山引擎AB测试:广告实验深度打通巨量引擎,高效测试广告素材

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 近期,火山引擎AB测试DataTester上线了新版的广告AB实验,还推出了与巨量引擎深度打通的能力。用户可以在DataTester中直接进行广告落地页的创建,并可以完成与巨量2.0广告投放的适配,企业广告主及广告 ......
引擎 广告 巨量 火山 素材

活动回顾|火山引擎 DataLeap 分享:DataOps、数据治理、指标体系最佳实践(文中领取 PPT)

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 在 7 月 21 日至 22 日举行的 ArchSummit 全球架构师峰会(深圳站)及 DataFunCon.数据智能创新与实践大会(北京站)上,来自火山引擎 DataLeap 的三位专家分别就 DataOps、 ......

火山引擎VeDI最新分享:消费行业的数据飞轮从“四更”开始

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 数据飞轮,正在为消费行业的数字化升级提供一套全新模式。 在刚刚结束的《全链路增长:数据飞轮转动消费新生力》专场活动上,火山引擎数智平台(VeDI)为消费行业带来了数据飞轮实践的最新分享。 数据飞轮是火山引擎今年4月 ......
飞轮 火山 引擎 数据 行业

火山引擎DataLeap的Data Catalog系统公有云实践 (下)

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 Data Catalog公有云遇到的挑战 Data Catalog经历了一个从0到1在火山引擎公有云部署并逐步优化和迭代发布10+版本的过程,在这个过程中经历不少挑战,下面将介绍其中比较典型的问题以及我们探索并实践 ......
火山 DataLeap Catalog 引擎 系统

火山引擎DataLeap的Data Catalog系统公有云实践 (上)

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 前言 Data Catalog 通过汇总技术和业务元数据,解决大数据生产者组织梳理数据、数据消费者找数和理解数的业务场景。本篇内容源自于火山引擎大数据研发治理套件DataLeap中的Data Catalog 功能模 ......
火山 DataLeap Catalog 引擎 系统

火山引擎DataLeap如何解决SLA治理难题(三): 平台架构与未来展望

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 平台架构总结 火山引擎 DataLeap SLA平台整体主要分为基础组件、规划式治理服务、响应式治理服务三大块,系统组件架构图如下: 规划式治理服务 所谓“规划式治理”,即在问题发现前治理,通过主动规划约定SLA的 ......
火山 架构 难题 DataLeap 引擎

火山引擎DataTester:三类AB实验,让企业营销拥有灵敏“网感”

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 作者:火山引擎AB测试 近日,火山引擎数智平台举办了“走进火山-全链路增长:数据飞轮转动消费新生力”的活动,其中火山引擎AB测试DataTester产品负责人分享了AB测试在消费行业的应用实践。 AB测试是科学设计 ......
火山 DataTester 引擎 企业

火山引擎DataLeap如何解决SLA治理难题(二):申报签署流程与复盘详解

申报签署流程详解 火山引擎DataLeap SLA保障的前提是先达成SLA协议。在SLA保障平台中,以申报单签署的形式达成SLA协议。平台核心特点是优化了SLA达成的流程,先通过“系统卡点计算”减少待签署任务的数量,再通过“SLA推荐计算”自动签署部分任务,最后为剩下的待签署任务智能提供合适的SLA ......
火山 难题 DataLeap 流程 引擎

火山引擎DataLeap如何解决SLA治理难题(一):应用场景与核心概念介绍

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 基于火山引擎分布式治理的理念,数据平台数据治理团队自研了火山引擎DataLeap SLA保障平台,目前已在字节内部得到广泛使用,并支持了绝大部分数据团队的SLA治理需求,每天保障的SLA链路数量过千,解决了数据SL ......
火山 难题 DataLeap 场景 核心

火山引擎 DataLeap 构建Data Catalog系统的实践(三):关键技术与总结

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 关键技术 构建一个好的Data Catalog系统,需要考虑的核心产品设计和技术设计有很多。篇幅所限,本文只概要介绍技术设计中最核心重要的部分,更多细节展开可参照后续的文章。 数据模型统一 将不同元数据的数据模型统 ......
火山 DataLeap Catalog 关键 引擎

北京汽车牵手火山引擎数智平台,探寻车企数字化升级新通路

“北京汽车正在为车企数字化升级跑出一条新通路。” 汽车行业的竞争向来激烈,随着数字化浪潮的持续推进,特别是一大批互联网背景的人物和企业入场,各大车企加速在数据智能应用上发力,以打破如今“用户越来越懂车,但车企却越来越难懂用户”的市场僵局。 作为国内领先的车企之一,北京汽车对此早有感知,并积极拥抱变化 ......
火山 牵手 引擎 数字 汽车

火山引擎 DataLeap 构建Data Catalog系统的实践(二):技术与产品概览

技术与产品概览 架构设计 元数据的接入 元数据接入支持T+1和近实时两种方式 上游系统:包括各类存储系统(比如Hive、 Clickhouse等)和业务系统(比如数据开发平台、数据质量平台等) 中间层: ETL Bridge:T+1方式运行,通常是从外部系统拉取最新元数据,与当前Catalog系统的 ......
概览 火山 DataLeap Catalog 引擎

火山引擎 DataLeap 套件下构建数据目录(Data Catalog)系统的实践

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 摘要 Data Catalog 产品,通过汇总技术和业务元数据,解决大数据生产者组织梳理数据、数据消费者找数和理解数的业务场景,并服务于数据开发和数据治理的产品体系。本文介绍了火山引擎 DataLeap 套件下Da ......
套件 火山 DataLeap Catalog 引擎

火山引擎VeDI落地消费行业数据飞轮,提出“四更”新主张

7月6日,火山引擎数智平台(VeDI)《全链路增长:数据飞轮转动消费新生力》主题活动在北京举办,会上分享了行业、企业、产品视角下的数据飞轮实践,并针对消费行业提出业务应用“四更”新主张:“更懂业务”、“更会决策”、“更准触达”和“更快行动”。 数据飞轮,是火山引擎基于字节跳动10年数据驱动理念沉淀而 ......
飞轮 火山 引擎 数据 行业

火山引擎开发者社区一周资讯精选(7.1-7.7)

🔥技术干货 1. 字节跳动开源KubeAdmiral:基于 K8s 的新一代多集群编排调度引擎 2. 使用Redis-Shake迁移AWS Elasticache Redis到火山引擎Redis操作指南 3. 火山引擎DataLeap数据质量解决方案和最佳实践(二):解决方案 4. 火山引擎Dat ......
开发者 火山 引擎 社区 资讯

多领域应用落地,火山引擎ByteHouse加速云数仓升级

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 近日,火山引擎数智平台VeDI直播活动「超话数据」在线举办,来自火山引擎的产品及解决方案专家分享了以ByteHouse为代表的云数仓产品在字节跳动的演进过程、关键技术以及最佳实践,并通过五个步骤拆解,带领开发者快速 ......
火山 ByteHouse 引擎

火山引擎DataLeap数据质量解决方案和最佳实践(三):最佳实践

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 最佳实践 前面介绍了DataLeap数据质量平台的一些实现方式,下面为大家介绍一些我们在数据量和资源这两个方面的最佳实践。 表行数信息-优先 HMS 获取 内部的离线监控中,表行数的监控占比非常大,可能至少 50% ......
火山 DataLeap 解决方案 质量 引擎