实战rust

ASR项目实战-任务队列在文件转写特性中的应用

转写时长超出60秒的语音文件,业界的竞品通常会使用创建异步转写任务的方式来提供支持。 一个简单、直接的实现方案,即: 网关服务接收到来自客户的转写请求时,将任务信息持久化至任务队列中。 由算法服务的实例从任务队列中提取任务,并执行转写操作。 待执行完毕之后,将转写结果保存至DB中,供调用方查询。 本 ......
队列 实战 特性 任务 文件

【xss实战】BurpSuite-XssValidator插件 -xss自动化测试

所需软件: 1、burpsuite 2、xssvalidator 源码:https://github.com/nVisium/xssValidator(按照编译指导编译) burpsuite_BApp:https://portswigger.net/bappstore/bapps/download/ ......

ASR项目实战-方案设计

对于语音识别产品的实施方案,给出简易的业务流程,仅供参考。 如下流程图,可以使用如下两个站点查看。 web chart Web Sequence Diagrams 文件转写 创建文件转写任务 客户应用->接入网关: 发送创建文件转写的请求 接入网关->安全网关: 转发请求 安全网关->安全网关: 对 ......
方案设计 实战 方案 项目 ASR

ASR项目实战-决策点

针对语音识别的产品,分别记录设计、开发过程中的决策点。 实时语音识别 对于实时语音识别来说,客户端和服务端之间实时交换语音数据和识别的结果。 客户端在启动识别时,即开始发送语音数据,期望在等待较短的时间后,即收到最初的识别结果。第一段语音数据和第一个识别结果之间的时延,一般称为首字时延。 客户端在停 ......
实战 项目 ASR

AutoGPT实战

1.概述 人工智能(AI)的能力持续在全球范围内引起轰动,并对我们日常生活和职业生涯带来重大变革。随着像ChatGPT这样的先进生成型AI模型以及从GPT-3到GPT-4的加速,我们在高级推理、理解更长上下文和输入设置方面看到了重大改进。像ChatGPT这样的工具要求用户编写Prompt,以获得所需 ......
实战 AutoGPT

ASR项目实战-架构设计

一般而言,业务诉求作为架构设计的输入。 需求清单 对于语音识别产品而言,需满足的需求,举例如下: 功能需求 文件转写。 长文件转写,时长大于60秒,小于X小时,X可以指定为5。 短文件转写,时长小于60秒。 实时语音识别。 长语音识别,时长大于60秒,小于Y小时,Y可以指定为5。 短语音识别,时长小 ......
架构 实战 项目 ASR

ASR项目实战-项目交付历程

本文记录,作为项目主要负责人,完整参与语音识别项目的交付历程。 2019年12月中旬 接到项目交付任务,收集基本知识,启动业务分析工作。 2020年1月 完成竞品分析的整理。 梳理合作伙伴的清单,整理项目计划,启动和各合作伙伴的沟通工作。 启动架构方案、设计方案的准备工作。 2020年2月 和合作伙 ......
项目 实战 历程 ASR

ASR项目实战-交付团队的分工

对于通常的软件项目,参与角色,比如可以有用户,消费者,产品团队,研发团队(研发团队包括开发和测试),运营团队,运维团队,管理团队。 通常认为,用户,负责购买服务的群体,而消费者,负责使用业务的群体。这两个群体,不在本文的讨论范围之内,因此后续的介绍中,除非明确说明,否则默认均不涉及。 产品团队,研发 ......
实战 团队 项目 ASR

ASR项目实战-产品分析

分析Google、讯飞、百度、阿里、QQ、搜狗等大厂的ASR服务,可以罗列出一款ASR服务所需要具备的能力。 产品分类 ASR云服务产品,从用户体验、时效性、音频时长,可以划分为如下几类: 实时短音频转写,可以用于支撑输入法、搜索、导航等场景。 实时长音频转写,可以用于支撑视频字幕、图文直播、会议直 ......
实战 项目 产品 ASR

ASR项目实战-前处理

本文深入探讨前处理环节。 首先介绍一些基本的名词,比如 文件名后缀 文件格式 音频格式 采样率和位深 预备知识 文件名后缀、文件格式和音频格式 常见的音频文件,比如.wav、.mp3、.m4a、.wma等,这些都代表什么? 仅仅是这类音频文件的后缀而已,不一定和音频文件的编码、音频数据的编码相关。 ......
前处理 实战 项目 ASR

ASR项目实战-后处理

本文深入探讨后处理环节。 在本环节要处理的重要特性有分词、断句、标点符号、大小写、数字等的格式归一等。 分词 和NLP、搜索等场景下的分词含义不同。对于拼音类的语言,比如英语、法语等,句子由多个单词组成,语音输出的结果,需要按需在各个单词之间补充或者去掉空格。对于中文来说,字和词之间不以空格作为边界 ......
实战 项目 ASR

ASR项目实战-数据

使用机器学习方法来训练模型,使用训练得到的模型来预测语音数据,进而得到识别的结果文本,这是实现语音识别产品的一般思路。 本文着重介绍通用语音识别产品对于数据的诉求。 对数据的要求 训练集 相关要求,如下: 地域,需要覆盖使用人群所在的地域,且数据的比例适中。 口音,需要覆盖典型的口音。 年龄,从18 ......
实战 项目 数据 ASR

ASR项目实战-构建Kaldi

准备工作 安装构建时依赖的基础软件 软件清单如下: bzip2 python3 automake libtool cmake gcc g++ gfortran git subversion 不同平台安装软件的方式不同,比如可以使用yum或者apt-get等。 下载开源软件 软件清单如下: Libun ......
实战 项目 Kaldi ASR

ASR项目实战-语音识别

本文深入探讨语音识别处理环节。 本阶段的重点特性为语音识别、VAD、热词、文本的时间偏移、讲话人的识别等。 语音识别 业界流派众多,比如Kaldi、端到端等,具体选择哪一种,需要综合考虑人员能力、训练数据量和质量、硬件设施、交付周期等,作出相对合理的交付规划。 基于Kaldi的方案,优点在于其发挥稳 ......
实战 语音 项目 ASR

JVM-实战篇-GC调优

1 GC调优 GC调优指的是对垃圾回收进行调优。GC调优的主要目标是避免由垃圾回收引起的程序性能下降。 GC调优的核心分为三部分: 通过JVM参数的设置; 特定垃圾回收器的JVM参数的设置; 解决由频繁的FULLGC引起的程序性能问题。 GC调优没有唯一的标准答案,重点学习调优的工具和方法。 2 G ......
实战 JVM GC

JVM-实战篇-内存调优

1 内存溢出和内存泄漏 概念:内存泄漏:在Java中如果不在使用一个对象,但是该对象依然在GC ROOT的引用链上,这个对象就不会被垃圾回收器回收,这种情况就称之为内存泄漏。 内存泄漏绝大多数情况都是由堆内存泄漏引起的,所以后续没特殊说明讨论的均为堆内存泄漏。 若持续发生内存泄漏,不管有多大的内存迟 ......
实战 内存 JVM

记一次对某杀猪盘站点的实战渗透

前言昨天半夜看到一篇文章 某菠菜网站渗透实战就想着自己也练一练手,打到一半发现,大师傅们对这类站点已经狠狠的蹂躏了,所以借鉴师傅们的经验,本着锻炼一下,想到哪就记一下,所以写的比较杂乱,其中有没有解决的地方也记录下来的,然后又换了个站点接着走了下去信息收集前台这样看一下其他的信息端口查询80为主页面 ......
实战 站点

【工具篇】Kali下beef实战详细教程

一、beef安装 第一步:安装beef 1.首先输入命令进行安装. apt-get install beef-xss 发现安装不了,但是有提示. 2.根据提示进行输入命令. apt-get update 3.再输入命令进行安装. apt-get install beef-xss 4.直接运行Beef ......
实战 工具 教程 Kali beef

盘点一个Python自动化办公实战案例(四)

大家好,我是皮皮。 一、前言 前几天在Python最强王者交流群【钟爱一生】问了一个Python自动化办公的问题,一起来看看吧。 【温馨提示】 遇到表达不清的,能稍微描述下,想要达成的结果吗?在excel上,或者画图也行。最好是把你想要的结果展示在excel中,另外,你展示的这个表格最好做个小的de ......
实战 案例 Python

高楼《性能测试实战30讲》笔记整理

注意:因为是笔记,我也结合了具体工作中遇到的情况,穿插了很多自己的理解,所以某些点并非完全和原作者的结构、描述一样。 【性能测试的分类】 1、压力测试:关注点在于系统在峰值负载或超出最大负荷时的处理能力如何。如果继续加压,性能应该按预期缓慢下降,但不应直接崩溃;如果崩溃,找到它的临界点,从而了解系统 ......
高楼 实战 性能 笔记

短小精悍(5) - Rust内存清零库zeroize介绍

title: 短小精悍(5) - Rust内存清零库zeroize介绍 zhihu-url: https://zhuanlan.zhihu.com/p/674976137 今天带来的是一个“短小精悍”的库:zeroize。zeroize可以在确保不被编译器优化的前提下安全高效地清空一段内存,适合在保 ......
短小精悍 内存 zeroize Rust

mrml mjml 的rust 实现

mrml 是mjml 的rust 实现,同时还提供了webassembly 的支持,当然比较强大的是mrml 同时也实现了python binding webassembly 使用 代码 const { Engine } = require("mrml"); const engine = new E ......
mrml mjml rust

[记]在rust中使用xml,xml的序列化与反序列化

序 在rust中有好几个xml库,但我个人比较推荐的是quick_xml库,这个库的序列化和反序列化使用体验比较好。 启用quick_xml的feature quick-xml = { version = "0.31.0",features=["serde","serialize"] } serde ......
序列 xml rust

Rust中的12中整数类型

长度 有符号 无符号 8-bit i8 u8 16-bit i16 u16 32-bit i32 u32 64-bit i64 u64 128-bit i128 u128 arch isize usize ......
整数 类型 Rust

短小精悍(4) - Rust操作系统随机数getrandom库介绍

今天带来的是另一个“短小精悍”的库:getrandom。它的作用是从操作系统提供的随机数源获得一段随机数。 用法 getrandom的用法很简单,唯一需要了解的就是它内部的同名函数: pub fn getrandom(dest: &mut [u8]) -> Result<(), Error> 它将会 ......
随机数 短小精悍 getrandom 系统 Rust

Go sync 包解析与实战

在并发世界中,Go语言以其原生的并发特性脱颖而出。Go的sync包提供了基本的同步原语,如互斥锁(sync.Mutex)、等待组(sync.WaitGroup)等,能够帮助开发者在并发环境下编写更安全、更可靠的代码。本文将深入剖析sync包的核心组件,并通过实例演示其在Go并发程序中的实际应用。 从 ......
实战 sync Go

Rust爬取大A股票数据.rs

extern crate simple_excel_writer as excel; use excel::*; fn main() -> Result<(), Box<dyn std::error::Error>> { let url: &str = "http://94.push2.eastmo ......
股票 数据 Rust rs

爬虫实战-微博评论爬取

简介 最近在做NLP方面的研究,以前一直在做CV方面。最近由于chatgpt,所以对NLP就非常感兴趣。索性就开始研究起来了。 其实我们都知道,无论是CV方向还是NLP方向的模型实现,都是离不开数据的。哪怕是再先进的代码,都是需要数据支撑的。但是我们的数据都来自哪里呢。无非就两个方面,一方面是来自于 ......
爬虫 实战

Rust error : usize 类型不能进行 - 操作

return (- low - 1 as isize) as isize; cannot apply unary operator - Rust编写程序时候 usize 类型 进行-1 运算时报的错误 写了下BinarySearch, 对于if 判断修正为平衡版本,同时解决了 取得的midVal 已 ......
类型 error usize Rust

阿里云 ACK 云上大规模 Kubernetes 集群高可靠性保障实战

本文基于 ACK 稳定性保障实践经验,帮助用户全面理解 ACK 稳定性理论和优化策略,并了解如何使用相应的工具和服务进行稳定性保障。 ......
集群 可靠性 Kubernetes 实战 大规模
共2112篇  :4/71页 首页上一页4下一页尾页