概况
⼤数据概况及⽣态
1、⼤数据 ⼤数据:是指⽆法在⼀定时间内⽤常规软件⼯具对其内容进⾏抓取、管理和处理的数据集合 主要解决海量的数据存储和分析计算的问题。 2、数据单位 按⼤小: bit Byte KB MB GB TB PB EB ZB YB BB NB DB 1Byte=8bit 1KB=1024Byte 1MB= ......
Databend 源码阅读: Storage 概况和 Read Partitions
作者:张祖前 Databend Labs 成员,数据库研发工程师 https://github.com/zhyass ❤️ 友情提示:代码演进较快,请注意文档的时效性哦! 引言 Databend 将存储引擎抽象成一个名为 Table 的接口,源码位于 query/catalog/src/table. ......
数据及报表概况
# 数据及报表概况 ## 数据概况 由于是模拟日志,因此日志包含的信息是已知可控的。如果是生产场景的话,是需要进行ETL的,即需要从多个业务系统抽取数据到数仓。ETL的工作包含:数据探索、ETL策略、数据映射和存储过程开发。 - 数据探索:从技术上看,业务系统的数据库信息、库表信息、字段信息可能是模 ......
项目概况与技术方案
# 项目概况与技术方案 ## 概述 该项目是一个针对用户行为日志分析的T+1离线数仓项目;通过构建数仓分析,了解用户的活跃情况、交互情况、流量概况等信息。数仓通过云服务器集群进行部署,开发后端程序提供服务接口。参考《大数据之路:阿里巴巴大数据实践》,该数仓构建了ODS层、DWD层、DWS层、AD ......
软件过程模型概况
软件过程模型就是软件开发过程中遵循的流程、方法、标准、规范、思想等等所形成的模板。 目前的常用的软件过程模型有以下几种: 瀑布模型 V模型(瀑布模型的变种) 原型模型 螺旋模型(原型+瀑布) 构件组装模型/基于构件的开发方法 快速应用开发RAD(瀑布+构件组装) 统一过程/统一开发方法 敏捷开发方法 ......