实战 机器ruby

P4 机器学习的基本原则

训练神经网络的基本原则 当训练好了一个最初的神经网络 首先问 这个算法是否有高偏差??? 也就是是不是欠拟合 如果是高偏差: 解决高偏差,要么换更大的网络,要么延长训练的时间,(找更好的网络) 等到做完了这些,再判断这个算法是否有高偏差,直到在训练集上能够拟合好数据, 然后问 这个算法是否有高方差? ......
基本原则 机器 原则 P4

【积微成著】性能测试调优实战与探索(存储模型优化+调用链路分析)| 京东物流技术团队

一、前言 性能测试之于软件系统,是保障其业务承载能力及稳定性的关键措施。以软件系统的能力建设为主线,系统能力设计工作与性能测试工作,既有先后之顺序,亦有相互之影响。以上,在性能测试的场景决策,架构分析、流量分析、压测实施和剖解调优等主要环节中,引发对于系统能力底盘夯实和测试策略改进的诸多思考。 在性 ......

Ruby

多数人都拥有自己不了解的能力和机会,都有可能做到未曾梦想的事情。 Ruby -> Rubygems(gem) Ruby -> Ruby 环境 -> Rubygems(gem)-> 开源项目 Cocoapods -> rvm/rbenv Ruby 是一种面向对象的脚本语言,简单易用,功能强大。能跨平台 ......
Ruby

机器学习笔记(四)初识卷积神经网络

前言 第一次写卷积神经网络,也是照着paddlepaddle的官方文档抄,这里简单讲解一下心得。 首先我们要知道之前写的那些东西都是什么,之前写的我们称之为简单神经网络,也就是简单一层连接输出和输出,通过前向计算和逆向传播,以及梯度下降的方式让结果慢慢滑向我们期望的终点。 这种方法固然好,但是它的限 ......
卷积 神经网络 神经 机器 笔记

Rasa初始化聊天机器人的配置

本文详细介绍了使用 rasa init 初始化聊天机器人项目的配置,包括 nlu.yml、rules.yml、stories.yml、test_stories.yml、config.yml、credentials.yml、domain.yml、endpoints.yml 等文件。如下所示: │ co ......
机器人 机器 Rasa

DeepSpeed 学习 [2]: 从 0 开始 DeepSpeed 实战

从 0 开始 DeepSpeed 实战,Get Start 目录从 0 开始 DeepSpeed 实战,Get StartDDP 初探Minimum DDP ExampleMULTI GPU TRAINING WITH DDP (Single to Multi)Install初始化TrainingM ......
DeepSpeed 实战

2023CANN训练营第2季————Ascend C算子Tiling切分原理与实战

使用Ascend C进行昇腾AI芯片算子开发,开发者仅需要把关注点放在数据切分和计算逻辑实现上。固定shape算子切分相对简单,动态shape的算子需要如何去实现呢?本篇笔记从复习切分的基本概念出发,讲述了一种动态shape的切分方法,并编程进行了验证。 ......
算子 训练营 实战 原理 Ascend

全面对比 汇编、易语言、Shell、Lua、Ruby、Perl、Erlang、Rust、Scala、Python、Go、VB、PHP、C/C++、C#、.Net、Java、…… 等多种编程语言的区别

1. 语言类型:首先,C/C++、Java 、Python都是强类型的语言。强类型语言的定义如下: 强类型语言是一种强制类型定义的语言,即一旦某一个变量被定义类型,如果不经强制转换,那么它永远就是该数据类型。而弱类型语言是一种弱类型定义的语言,某一个变量被定义类型,该变量可以根据环境变化自动进行转换 ......
语言 编程语言 多种 Erlang Python

vue 2实战系列 —— 复习Vue

复习Vue 近期需要接手 vue 2的项目,许久未写,语法有些陌生。本篇将较全面复习 vue 2。 Tip: 项目是基于 ant-design-vue-pro ant-design-vue-pro 由于 cms 是基于这个项目开发的,所以笔者就将其下载下来。 下载后运行 // 按照依赖 yarn i ......
实战 vue Vue

评价机器学习模型的思路

这个标题不够严谨,不同业务领域下的模型,没有可比性。因此,应当增加一定的限定条件,才能对机器学习的模型进行比较。 当前可行的限定条件,如下: 模型 模型结构 参数的数量 训练算法 训练时长 数据 训练数据集 验证数据集 数据质量 基础平台 训练平台 硬件 软件 运行平台 硬件 软件 在给定上述条件时 ......
模型 思路 机器

ASR项目实战-任务队列在文件转写特性中的应用

转写时长超出60秒的语音文件,业界的竞品通常会使用创建异步转写任务的方式来提供支持。 一个简单、直接的实现方案,即: 网关服务接收到来自客户的转写请求时,将任务信息持久化至任务队列中。 由算法服务的实例从任务队列中提取任务,并执行转写操作。 待执行完毕之后,将转写结果保存至DB中,供调用方查询。 本 ......
队列 实战 特性 任务 文件

【xss实战】BurpSuite-XssValidator插件 -xss自动化测试

所需软件: 1、burpsuite 2、xssvalidator 源码:https://github.com/nVisium/xssValidator(按照编译指导编译) burpsuite_BApp:https://portswigger.net/bappstore/bapps/download/ ......

机器学习-无监督机器学习-LDA线性判别分析-25

目录1. Linear Discriminant Analysis 线性判别分析 1. Linear Discriminant Analysis 线性判别分析 经常被用于分类问题的降维技术,相比于PCA,LDA可以作为一种有监督的降维算法,降维的时候用到了y的真实值,有监督的降维。 在PCA中,算法 ......
机器 线性 LDA 25

ASR项目实战-方案设计

对于语音识别产品的实施方案,给出简易的业务流程,仅供参考。 如下流程图,可以使用如下两个站点查看。 web chart Web Sequence Diagrams 文件转写 创建文件转写任务 客户应用->接入网关: 发送创建文件转写的请求 接入网关->安全网关: 转发请求 安全网关->安全网关: 对 ......
方案设计 实战 方案 项目 ASR

ASR项目实战-决策点

针对语音识别的产品,分别记录设计、开发过程中的决策点。 实时语音识别 对于实时语音识别来说,客户端和服务端之间实时交换语音数据和识别的结果。 客户端在启动识别时,即开始发送语音数据,期望在等待较短的时间后,即收到最初的识别结果。第一段语音数据和第一个识别结果之间的时延,一般称为首字时延。 客户端在停 ......
实战 项目 ASR

AutoGPT实战

1.概述 人工智能(AI)的能力持续在全球范围内引起轰动,并对我们日常生活和职业生涯带来重大变革。随着像ChatGPT这样的先进生成型AI模型以及从GPT-3到GPT-4的加速,我们在高级推理、理解更长上下文和输入设置方面看到了重大改进。像ChatGPT这样的工具要求用户编写Prompt,以获得所需 ......
实战 AutoGPT

ASR项目实战-架构设计

一般而言,业务诉求作为架构设计的输入。 需求清单 对于语音识别产品而言,需满足的需求,举例如下: 功能需求 文件转写。 长文件转写,时长大于60秒,小于X小时,X可以指定为5。 短文件转写,时长小于60秒。 实时语音识别。 长语音识别,时长大于60秒,小于Y小时,Y可以指定为5。 短语音识别,时长小 ......
架构 实战 项目 ASR

ASR项目实战-项目交付历程

本文记录,作为项目主要负责人,完整参与语音识别项目的交付历程。 2019年12月中旬 接到项目交付任务,收集基本知识,启动业务分析工作。 2020年1月 完成竞品分析的整理。 梳理合作伙伴的清单,整理项目计划,启动和各合作伙伴的沟通工作。 启动架构方案、设计方案的准备工作。 2020年2月 和合作伙 ......
项目 实战 历程 ASR

ASR项目实战-交付团队的分工

对于通常的软件项目,参与角色,比如可以有用户,消费者,产品团队,研发团队(研发团队包括开发和测试),运营团队,运维团队,管理团队。 通常认为,用户,负责购买服务的群体,而消费者,负责使用业务的群体。这两个群体,不在本文的讨论范围之内,因此后续的介绍中,除非明确说明,否则默认均不涉及。 产品团队,研发 ......
实战 团队 项目 ASR

ASR项目实战-产品分析

分析Google、讯飞、百度、阿里、QQ、搜狗等大厂的ASR服务,可以罗列出一款ASR服务所需要具备的能力。 产品分类 ASR云服务产品,从用户体验、时效性、音频时长,可以划分为如下几类: 实时短音频转写,可以用于支撑输入法、搜索、导航等场景。 实时长音频转写,可以用于支撑视频字幕、图文直播、会议直 ......
实战 项目 产品 ASR

ASR项目实战-前处理

本文深入探讨前处理环节。 首先介绍一些基本的名词,比如 文件名后缀 文件格式 音频格式 采样率和位深 预备知识 文件名后缀、文件格式和音频格式 常见的音频文件,比如.wav、.mp3、.m4a、.wma等,这些都代表什么? 仅仅是这类音频文件的后缀而已,不一定和音频文件的编码、音频数据的编码相关。 ......
前处理 实战 项目 ASR

ASR项目实战-后处理

本文深入探讨后处理环节。 在本环节要处理的重要特性有分词、断句、标点符号、大小写、数字等的格式归一等。 分词 和NLP、搜索等场景下的分词含义不同。对于拼音类的语言,比如英语、法语等,句子由多个单词组成,语音输出的结果,需要按需在各个单词之间补充或者去掉空格。对于中文来说,字和词之间不以空格作为边界 ......
实战 项目 ASR

ASR项目实战-数据

使用机器学习方法来训练模型,使用训练得到的模型来预测语音数据,进而得到识别的结果文本,这是实现语音识别产品的一般思路。 本文着重介绍通用语音识别产品对于数据的诉求。 对数据的要求 训练集 相关要求,如下: 地域,需要覆盖使用人群所在的地域,且数据的比例适中。 口音,需要覆盖典型的口音。 年龄,从18 ......
实战 项目 数据 ASR

ASR项目实战-构建Kaldi

准备工作 安装构建时依赖的基础软件 软件清单如下: bzip2 python3 automake libtool cmake gcc g++ gfortran git subversion 不同平台安装软件的方式不同,比如可以使用yum或者apt-get等。 下载开源软件 软件清单如下: Libun ......
实战 项目 Kaldi ASR

ASR项目实战-语音识别

本文深入探讨语音识别处理环节。 本阶段的重点特性为语音识别、VAD、热词、文本的时间偏移、讲话人的识别等。 语音识别 业界流派众多,比如Kaldi、端到端等,具体选择哪一种,需要综合考虑人员能力、训练数据量和质量、硬件设施、交付周期等,作出相对合理的交付规划。 基于Kaldi的方案,优点在于其发挥稳 ......
实战 语音 项目 ASR

【Python机器学习课程设计】基于卷积神经网络的动物图像分类+数据分析

一、选题背景 在现代社会中,图像分类是计算机视觉领域的一个重要任务。动物图像分类具有广泛的应用,例如生态学研究、动物保护、农业监测等。通过对动物图像进行自动分类,可以帮助人们更好地了解动物种类、数量和分布情况,从而支持相关领域的决策和研究。本研究的目标是使用卷积神经网络(CNN)对动物图像进行分类。 ......

JVM-实战篇-GC调优

1 GC调优 GC调优指的是对垃圾回收进行调优。GC调优的主要目标是避免由垃圾回收引起的程序性能下降。 GC调优的核心分为三部分: 通过JVM参数的设置; 特定垃圾回收器的JVM参数的设置; 解决由频繁的FULLGC引起的程序性能问题。 GC调优没有唯一的标准答案,重点学习调优的工具和方法。 2 G ......
实战 JVM GC

【Python机器学习课程设计】基于卷积神经网络的动物图像分类

恢复内容开始 一、选题背景 在现代社会中,图像分类是计算机视觉领域的一个重要任务。动物图像分类具有广泛的应用,例如生态学研究、动物保护、农业监测等。通过对动物图像进行自动分类,可以帮助人们更好地了解动物种类、数量和分布情况,从而支持相关领域的决策和研究。本研究的目标是使用卷积神经网络(CNN)对动物 ......
卷积 神经网络 图像 神经 机器

机器学习(1)概述

机器学习是人工智能的一个实现途径 深度学习是机器学习的一个方法发展而来的 人工智能的起点——达特茅斯会议,用机器来模仿人类学习 机器学习的应用场景非常多,涉及各个领域,如传统预测,图像识别,自然语言处理 机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测 那么用来分析的数据,从历史数据 ......
机器

JVM-实战篇-内存调优

1 内存溢出和内存泄漏 概念:内存泄漏:在Java中如果不在使用一个对象,但是该对象依然在GC ROOT的引用链上,这个对象就不会被垃圾回收器回收,这种情况就称之为内存泄漏。 内存泄漏绝大多数情况都是由堆内存泄漏引起的,所以后续没特殊说明讨论的均为堆内存泄漏。 若持续发生内存泄漏,不管有多大的内存迟 ......
实战 内存 JVM
共3020篇  :5/101页 首页上一页5下一页尾页