碎片 物理 数据库 文件

关于大数据平台上任务管理的思考

本文于2019年7月16日完成,发布在个人博客网站上。 考虑个人博客因某种原因无法修复,于是在博客园安家,之前发布的文章逐步搬迁过来。 作业,比如提交一个hive脚本到计算平台上运行,这个脚本宏观上称为一个作业。 任务,比如mapper,reducer等。 资源,比如CPU时间,内存,硬盘IO,网络 ......
任务 数据 平台

Python Pandas 数据可视化

​ 1、Pandas 的绘图功能 Pandas 内置的绘图功能进行数据可视化是一种快速且有效的方法,它主要依赖于 Matplotlib 库。Pandas 提供了多种绘图类型,适用于不同的数据分析和可视化需求。 1)折线图 使用plot()绘制拆线图,常用参数如下, 参数 描述 x 一维数组或列表,表 ......
数据 Python Pandas

【Application Insights】使用CURL命令向Application Insgihts发送测试数据

问题描述 在使用App Service或者Kubernetes等服务时,需要收集一些日志数据并且发送到Application Insights中,当使用SDK或者是服务自带的Application Insights配置时遇见问题,有没有快速的调试方式能验证App Service是否与Applicat ......
Application Insights Insgihts 命令 数据

MyBatis—Spring 动态数据源事务的处理

在一般的 Spring 应用中,如果底层数据库访问采用的是 MyBatis,那么在大多数情况下,只使用一个单独的数据源,Spring 的事务管理在大多数情况下都是有效的。然而,在一些复杂的业务场景下,如需要在某一时刻访问不同的数据库,由于 Spring 对于事务管理实现的方式,可能不能达到预期的效果 ......
数据源 事务 MyBatis 动态 数据

高级数据结构笔记

树套树 顾名思义,就是一个树套一个树。。。 广义的树套树是指嵌套多层的数据结构。常见的有:线段树套线段树(二维线段树),线段树套平衡树(“二逼平衡树”),分块套平衡树,树状数组套线段树(带修主席树)等等。 在这里,由于 set,map 等 STL 内部实现是平衡树,因此将这些 STL 的嵌套也算作树 ......
数据结构 结构 笔记 数据

[python]沪深龙虎榜数据导入通达信的自选板块,并标注于K线图上

1 #coding=utf-8 2 3 #读取'[paint]'开头的csv文件 4 #copyright @ WangXinsheng 5 #http://www.cnblogs.com/wangxinsheng/ 6 import os 7 import struct 8 import time ......
线图 龙虎榜 板块 数据 python

文件批量拷贝的脚本(尤其适用于大小写敏感向不敏感的磁盘拷贝时发生冲突的情形)

在Linux系统下,NTFS可以支持文件名大小写区分;但在MaxOS的exFAT格式中,则无法区分大小写。 当从NTFS向exFAT拷贝文件时,当同一个目录下而在文件名相同但大小写不同的两个及以上文件时,向exFAT写入会中断,使得文件拷贝操作无法完成。 因此,特别编写了下面这个脚本,用来解决这个问 ......
拷贝 磁盘 脚本 情形 大小

深度学习图像复原之去雨:常用数据集介绍

可能有帮助的链接:https://paperswithcode.com/task/single-image-deraining 合成数据集 Rain100H 出自 CVPR 2017 论文 Deep Joint Rain Detection and Removal from a Single Ima ......
深度 图像 常用 数据

Oracle、达梦:☆获取数据库对象、获取对象的DDL定义语句(达梦)

一、获取数据库对象(Oracle、达梦) 以下方式在达梦DM数据库中都能跑通,Oracle未测试所有的方式。 1、获取对象(表、视图、函数等……) 1.1、获取所有对象——所有模式下的 ①、ALL_OBJECTS视图 数据库所有对象表:包括表、视图、物化视图、函数、存储过程……等 -- 查询所有对象 ......
对象 语句 数据库 数据 Oracle

PA0:安装ubuntu物理机+其他操作

参考以下网页: 1) 制作启动U盘:使用Rufus制作Ubuntu启动盘 - 知乎 (zhihu.com) 使用官网下载的ubuntu22.04.3 iso 2) 在主机上安装ubuntu :windows11安装ubuntu22.04双系统教程(亲测) - 知乎 (zhihu.com) 我在已经安 ......
物理 ubuntu PA0 PA

QFile::exists()判断文件是否存在的注意事项

1、当判断的文件名为一个目录时,返回也为true存在(注意:当拼接文件路径时,文件名为空,则结果为一个目录,则会判断为该文件也是存在的,应该判断该文件是否为一个文件,使用QFileInfo判断) 2、如果文件名是一个不存在的文件的快捷方式,返回false ......
注意事项 事项 文件 exists QFile

44python 删除 linux 系统中的文件夹或文件

# 删除文件 import os os.remove('/path') # 删除文件夹(不为空也可以删除) import shutil shutil.rmtree('path') ......
文件 文件夹 python 系统 linux

k8s 对接 cephfs 文件系统

创建资源池 ceph osd pool create cephfs_data 128 ceph osd pool create cephfs_metadata 128 文件系统需要两个资源池,一个用于存储数据体,一个用于存放索引信息及其他数据相关信息。 创建文件系统 ceph fs new ceph ......
文件 cephfs 系统 k8s k8

KQL如何写和表示 winodws的文件路径

在 Kusto Query Language (KQL) 中表示 Windows 文件路径时,需要特别注意路径分隔符和转义字符。Windows 文件系统通常使用反斜杠 \ 作为路径分隔符,但在 KQL 查询中,反斜杠是一个特殊字符,用作转义字符。因此,当你在 KQL 查询中写入 Windows 路径 ......
路径 winodws 文件 KQL

C# 使用protobuf序列化反序列化数据

protobuf是谷歌的一个序列化数据结构的协议,性能高,存储占用小 经过我的测试对比 1,最慢的是C#内置的BinaryFormatter,这个玩意能不用则不用 2,然后是json,用起来很方便,比BinaryFormatter快了1-2倍 3,接下来就是protobuf,不过需要给类的成员加上特 ......
序列 protobuf 数据

拥有root权限却无法修改文件内容

一、故障现象 E45: 'readonly' option is set (add ! to override)当前登录用户为root,修改文件时提示"W10: Warning: Changing a readonly file",保存时提示'E45 ‘readonly‘ option is set ......
权限 文件 内容 root

Hive文件存储格式

结论: Text File,Parquet ,ORC Files结合使用,优先使用前两种,对存储及查询性能有极高要求时使用ORC。 存储格式 使用场景 Text File 数据直观,便于查看和编辑,数据量较小的维表可以使用. Parquet 支持深度嵌套,可用于多种数据处理框架(Hive/Spark ......
格式 文件 Hive

Hive 数据写入流程

概念简介 外部表:删除表时,外部表只删除元数据,不删除数据。适用于数据源被多处使用的场景,便于数据共享。 内部表:删除表时,内部表的元数据和数据会被一起删除。适用于不需要共享的原始数据或中间数据。 分区表:数据较多,为提高计算速度时使用。 内部表&外部表写入流程图 具体流程Demo 以外部表为例: ......
流程 数据 Hive

hive分区表数据导入

数据库分区的主要目的是为了在特定的SQL操作中减少数据读写的总量以缩减响应时间,主要包括两种分区形式:水平分区与垂直分区。水平分区是对表进行行分区。而垂直分区是对列进行分区,一般是通过对表的垂直划分来减少目标表的宽度,常用的是水平分区. 1. hive建立分区表 create external ta ......
数据 hive

Hive 复杂数据类型Array,Map,Struct

建表语句,支持嵌套 CREATE TABLE parquet_test ( id int, str string, mp MAP<STRING,STRING>, lst ARRAY<STRING>, strct STRUCT<A:STRING,B:STRING>) PARTITIONED BY (p ......
类型 数据 Struct Array Hive

Hive写入JSON数据

优缺点: 1.JsonSerDe对json数据格式有严格要求,创建的表结果必须与json结构能对应上,否则会报错。 配置 org.openx.data.jsonserde.JsonSerDe 能解决格式异常报错导致整个任务终止的问题。 必须定义好详细字段嵌套的规则类型,不适合提取ODS原文。 2.g ......
数据 Hive JSON

Hive Array数据处理

建表 CREATE TABLE IF NOT EXISTS default.array_test( id String COMMENT 'id', name Array<String> COMMENT '名称' ) COMMENT 'array测试' ROW FORMAT DELIMITED FIE ......
数据处理 数据 Array Hive

vue实现虚拟滚动(面试题:后端给你十万条数据,你怎么处理?)

<template> <div class="viewport" @scroll="scroll"> <div class="list-phantom" :style="{height: totalHeight+'px'}"></div> <div class="list-area" :style= ......
万条 数据 vue

Flink写文件

简介 StreamingFileSink 提供了将数据分桶写入文件系统的功能。 如何分桶是可以配置,默认使用基于时间的分桶策略,每个小时创建一个新的桶,也可以自定义分桶策略。 文件滚动策略支持两种方式,基于时间和文件大小的DefaultRollingPolicy策略和基于Flink检查点的OnChe ......
文件 Flink

超大日志文件分割工具和方法

来源:https://blog.csdn.net/sangser/article/details/123169275 1. 直接运行:MobaXterm1_CHS1.exe,如下画面: 2. 点击:Start local terminal: 切换到大文件所在目录,执行命令:split -l 6000 ......
文件 工具 方法 日志

scrapy使用文件管道FilesPipeline下载视频

1.爬虫文件 class MeiShiSpider(scrapy.Spider): name = 'meishi' allowed_domains = ['baidu.com'] start_urls = ['https://tieba.baidu.com/f?kw=美食'] def parse(s ......
FilesPipeline 管道 文件 scrapy 视频

Power BI - 5分钟学习修改数据类型

每天5分钟,今天介绍Power BI修改数据类型 Power BI加载数据时,会尝试将源列的数据类型转换为更高效的存储、计算和数据可视化的数据类型。例如,如果从Excel导入的值的列没有小数值,Power BI Desktop会将整个数据列转换为整数数据类型,这能更好地优化存储提高计算效率。 但是某 ......
类型 数据 Power BI

文件加密解密工具类

:需求:文件上传到系统后,只能通过系统预览或者下载,其他方式下载下来的文件,对方看不了, 实现思路:上传文件时,对文件进行加密处理,数据库存放文件名,把加密文件存到指定目录下 预览、下载文件时,通过指定目录+文件名,找到该文件,并进行解密处理,根据前端需求,对解密后的文件进行处理(下载到指定目录/直 ......
加密解密 文件 工具

安防视频云平台/可视化监控云平台ARM版EasyCVR无法下载录像文件,如何解决?

视频集中存储/云存储/视频监控管理平台EasyCVR能在复杂的网络环境中,将分散的各类视频资源进行统一汇聚、整合、集中管理,实现视频资源的鉴权管理、按需调阅、全网分发、智能分析等。GB28181视频监控/AI智能大数据视频分析EasyCVR平台已经广泛应用在工地、工厂、园区、楼宇、校园、仓储等场景中 ......
平台 录像 EasyCVR 文件 视频
共33000篇  :15/1100页 首页上一页15下一页尾页