算法 实战 机器 森林

ASR项目实战-交付团队的分工

对于通常的软件项目,参与角色,比如可以有用户,消费者,产品团队,研发团队(研发团队包括开发和测试),运营团队,运维团队,管理团队。 通常认为,用户,负责购买服务的群体,而消费者,负责使用业务的群体。这两个群体,不在本文的讨论范围之内,因此后续的介绍中,除非明确说明,否则默认均不涉及。 产品团队,研发 ......
实战 团队 项目 ASR

算法学习Day17二叉树迭迭迭迭代

Day17迭迭迭迭代 By HQWQF 2023/12/28 笔记 110.平衡二叉树 给定一个二叉树,判断它是否是高度平衡的二叉树。 本题中,一棵高度平衡二叉树定义为: 一个二叉树_每个节点_ 的左右两个子树的高度差的绝对值不超过 1 。 示例 1: 输入: root = [3,9,20,null ......
算法 Day 17

ASR项目实战-产品分析

分析Google、讯飞、百度、阿里、QQ、搜狗等大厂的ASR服务,可以罗列出一款ASR服务所需要具备的能力。 产品分类 ASR云服务产品,从用户体验、时效性、音频时长,可以划分为如下几类: 实时短音频转写,可以用于支撑输入法、搜索、导航等场景。 实时长音频转写,可以用于支撑视频字幕、图文直播、会议直 ......
实战 项目 产品 ASR

ASR项目实战-前处理

本文深入探讨前处理环节。 首先介绍一些基本的名词,比如 文件名后缀 文件格式 音频格式 采样率和位深 预备知识 文件名后缀、文件格式和音频格式 常见的音频文件,比如.wav、.mp3、.m4a、.wma等,这些都代表什么? 仅仅是这类音频文件的后缀而已,不一定和音频文件的编码、音频数据的编码相关。 ......
前处理 实战 项目 ASR

ASR项目实战-后处理

本文深入探讨后处理环节。 在本环节要处理的重要特性有分词、断句、标点符号、大小写、数字等的格式归一等。 分词 和NLP、搜索等场景下的分词含义不同。对于拼音类的语言,比如英语、法语等,句子由多个单词组成,语音输出的结果,需要按需在各个单词之间补充或者去掉空格。对于中文来说,字和词之间不以空格作为边界 ......
实战 项目 ASR

复杂算法分析(后续实时更新)

复杂算法总结 1.dfs 模板样例 //走河卒(适用低数据复杂度) #include<iostream> using namespace std; int n,m,ans,mx,my; int vis[26][26]; int dx[]={0,1},dy[]={1,0},dX={1,-1},dY={ ......
实时更新 算法 实时

ASR项目实战-数据

使用机器学习方法来训练模型,使用训练得到的模型来预测语音数据,进而得到识别的结果文本,这是实现语音识别产品的一般思路。 本文着重介绍通用语音识别产品对于数据的诉求。 对数据的要求 训练集 相关要求,如下: 地域,需要覆盖使用人群所在的地域,且数据的比例适中。 口音,需要覆盖典型的口音。 年龄,从18 ......
实战 项目 数据 ASR

ASR项目实战-构建Kaldi

准备工作 安装构建时依赖的基础软件 软件清单如下: bzip2 python3 automake libtool cmake gcc g++ gfortran git subversion 不同平台安装软件的方式不同,比如可以使用yum或者apt-get等。 下载开源软件 软件清单如下: Libun ......
实战 项目 Kaldi ASR

代码随想录算法训练营第十七天 | 110.平衡二叉树,257. 二叉树的所有路径,404.左叶子之和

一、110.平衡二叉树 题目链接: LeetCode 110.平衡二叉树 学习: 思路: 后序遍历。实际上是由叶结点到根结点,若有一颗子树不是平衡二叉树,则直接返回给根结点 二、257.二叉树的所有路径 题目链接: LeetCode 257.二叉树的所有路径 学习: 思路: 递归+回溯。因为是线=先 ......
随想录 之和 训练营 随想 算法

基于Redis的简单漏桶算法

下列代码是限制每秒10QPS的简单算法,需要修改频率请修改Duration.ofMillis(100)处 public class LimitationManage { private static final String VALUE = "A"; @Resource private Rediss ......
算法 Redis

RSA算法学习

RSA算法学习 介绍: RSA 加密算法是一种非对称加密算法。在公开密钥加密和电子商业中 RSA 被广泛使用。RSA 是 1977 年由罗纳德 · 李维斯特(Ron Rivest)、阿迪 · 萨莫尔(Adi Shamir)和伦纳德 · 阿德曼(Leonard Adleman)一起提出的。RSA 就是 ......
算法 RSA

ASR项目实战-语音识别

本文深入探讨语音识别处理环节。 本阶段的重点特性为语音识别、VAD、热词、文本的时间偏移、讲话人的识别等。 语音识别 业界流派众多,比如Kaldi、端到端等,具体选择哪一种,需要综合考虑人员能力、训练数据量和质量、硬件设施、交付周期等,作出相对合理的交付规划。 基于Kaldi的方案,优点在于其发挥稳 ......
实战 语音 项目 ASR

day02 代码随想录算法训练营 209. 长度最小的子数组

题目: 209. 长度最小的子数组 我的感悟: 滑动窗口, 每次计算当前位置的值, 满足要求就缩小, 这样左右两个指针都不回退。一直右走。 这个原理,还没太理解,感觉要在看看左神的视频。 理解难点: 为什么可以不回退。 代码难点: for 循环右边界 里面while判断是否满足要求 总结概括: 无 ......
随想录 训练营 数组 随想 算法

方案:智能分析网关V4区域人数超员AI算法模型的应用场景介绍

我们将以TSINGSEE青犀智能分析网关V4为例,深入探讨区域人数超员AI算法的工作原理及其应用场景。智能分析网关v4的区域人数统计/人员超限算法是基于计算机视觉和深度学习技术,通过训练深度神经网络模型实现对视频中人数统计的任务。 ......
网关 算法 模型 场景 人数

【Python机器学习课程设计】基于卷积神经网络的动物图像分类+数据分析

一、选题背景 在现代社会中,图像分类是计算机视觉领域的一个重要任务。动物图像分类具有广泛的应用,例如生态学研究、动物保护、农业监测等。通过对动物图像进行自动分类,可以帮助人们更好地了解动物种类、数量和分布情况,从而支持相关领域的决策和研究。本研究的目标是使用卷积神经网络(CNN)对动物图像进行分类。 ......

day02 代码随想录算法训练营 977. 有序数组的平方

题目: 977. 有序数组的平方 我的感悟: 这道题,仔细观察,平方后两头的大。 用双指针,取两头,放到新的数组里。 新数组要求排序 所以,新的数组从后往前放 理解难点: 无他,多练习。 代码难点: 无 总结概括: 双指针 代码示例: class Solution: def sortedSquare ......
随想录 训练营 数组 随想 算法

JVM-实战篇-GC调优

1 GC调优 GC调优指的是对垃圾回收进行调优。GC调优的主要目标是避免由垃圾回收引起的程序性能下降。 GC调优的核心分为三部分: 通过JVM参数的设置; 特定垃圾回收器的JVM参数的设置; 解决由频繁的FULLGC引起的程序性能问题。 GC调优没有唯一的标准答案,重点学习调优的工具和方法。 2 G ......
实战 JVM GC

【Python机器学习课程设计】基于卷积神经网络的动物图像分类

恢复内容开始 一、选题背景 在现代社会中,图像分类是计算机视觉领域的一个重要任务。动物图像分类具有广泛的应用,例如生态学研究、动物保护、农业监测等。通过对动物图像进行自动分类,可以帮助人们更好地了解动物种类、数量和分布情况,从而支持相关领域的决策和研究。本研究的目标是使用卷积神经网络(CNN)对动物 ......
卷积 神经网络 图像 神经 机器

文心一言 VS 讯飞星火 VS chatgpt (167)-- 算法导论13.1 7题

七、用go语言,试描述一棵含有 n 个关键字的红黑树,使其红色内部结点个数与黑色内部结点个数的比值最大。这个比值是多少? 该比值最小的树又是怎样呢?比值是多少? 文心一言: 红黑树是一种自平衡的二叉查找树,它满足以下性质: 每个节点或是红色,或是黑色。 根节点是黑色。 每个叶节点(NIL或空节点)是 ......
文心 导论 算法 chatgpt VS

羚通视频智能分析平台视频监控汇聚平台AI智能算法识别危险地区行人入侵算法识别预警

羚通视频智能分析平台是一款基于人工智能技术的先进智能视频监控系统。它具备实时监控和分析视频数据的能力,通过运用先进的人工智能算法,能够对视频中的人、车、物等进行精确识别和跟踪,从而实现对异常行为的预警和报警。 首先,羚通视频智能分析平台的视频监控汇聚功能非常强大。它可以将来自不同摄像头的视频数据汇聚 ......
算法 智能 视频监控 平台 视频

day01 代码随想录算法训练营 27. 移除元素

题目: 27. 移除元素 感悟: 用快慢指针。 本题是要原地删除。 而删除这个行为在真实的计算机的数组里,是覆盖。 所以,就用两个指针,(人) 一个跑的快,一个跑的慢。他们身上带了个对讲机。 跑的快的那个人负责检测后面的数字符合要求不,比如,要不等于3的,遇到一个2,告诉跑的慢的说2符合要求。遇到一 ......
随想录 训练营 随想 算法 元素

【GC】Java中常见的垃圾回收算法

Java 中常见的垃圾回收算法有以下几种: 标记-清除算法(Mark-and-Sweep):该算法分为两个阶段,标记阶段和清除阶段。在标记阶段,垃圾回收器会遍历堆中的对象,并标记所有可达对象。在清除阶段,垃圾回收器会遍历堆中的对象,清除所有未被标记的对象。 复制算法(Copying):该算法将堆分成 ......
算法 垃圾 常见 Java

【算法】Java版

二分查找算法 二分查找算法(Binary Search Algorithm)是一种在有序数组中查找特定元素的搜索算法。该算法的基本思想是将数组从中间分成两部分,然后与目标元素进行比较,进而确定目标元素位于左半部分还是右半部分,不断缩小搜索范围,直到找到目标元素或确定目标元素不存在。 以下是一个使用 ......
算法 Java

机器学习(1)概述

机器学习是人工智能的一个实现途径 深度学习是机器学习的一个方法发展而来的 人工智能的起点——达特茅斯会议,用机器来模仿人类学习 机器学习的应用场景非常多,涉及各个领域,如传统预测,图像识别,自然语言处理 机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测 那么用来分析的数据,从历史数据 ......
机器

JVM-实战篇-内存调优

1 内存溢出和内存泄漏 概念:内存泄漏:在Java中如果不在使用一个对象,但是该对象依然在GC ROOT的引用链上,这个对象就不会被垃圾回收器回收,这种情况就称之为内存泄漏。 内存泄漏绝大多数情况都是由堆内存泄漏引起的,所以后续没特殊说明讨论的均为堆内存泄漏。 若持续发生内存泄漏,不管有多大的内存迟 ......
实战 内存 JVM

图像识别的技术前沿:人工智能与机器学习的融合

图像识别的技术前沿在于人工智能(AI)与机器学习(ML)的融合。这种融合使得图像识别系统能够从大量数据中自动学习并识别出各种模式,从而在复杂和动态的环境中实现更高的准确性和鲁棒性。 机器学习在图像识别中发挥着越来越重要的作用。传统的图像识别方法通常依赖于手工制作的特征提取和特征匹配,而机器学习则通过 ......

记一次对某杀猪盘站点的实战渗透

前言昨天半夜看到一篇文章 某菠菜网站渗透实战就想着自己也练一练手,打到一半发现,大师傅们对这类站点已经狠狠的蹂躏了,所以借鉴师傅们的经验,本着锻炼一下,想到哪就记一下,所以写的比较杂乱,其中有没有解决的地方也记录下来的,然后又换了个站点接着走了下去信息收集前台这样看一下其他的信息端口查询80为主页面 ......
实战 站点

[转]编码算法(URL编码和Base64编码)

原文地址:编码算法 - 廖雪峰的官方网站 要学习编码算法,我们先来看一看什么是编码。 ASCII码就是一种编码,字母A的编码是十六进制的0x41,字母B是0x42,以此类推: 字母ASCII编码 A 0x41 B 0x42 C 0x43 D 0x44 … … 因为ASCII编码最多只能有128个字符 ......
编码 算法 Base URL 64

机器学习Machine Learning

附件5:课程教学大纲参考模板 (注:各学院可采用该模板,也可自设模板,但每个学院需使用统一模板) 《机器学习》教学大纲 Teaching(Course)Outline of Machine Learning 第一部分 大纲说明(宋体,四号加粗,居中) 1.课程代码:329021003 2.课程类型: ......
Learning 机器 Machine

机器人运行学逆解常用三角函数方程求解

\(sin\left(\theta\right)=a\), 求 \(\theta\) \[\Longrightarrow\theta=atan2\left(a,\pm\sqrt{1-{a}^{2}}\right) \] \(cos\left(\theta\right) = a\),求 \(\thet ......
方程 机器人 函数 机器 常用