实战 课程 笔记
【Python数据分析课程设计】大数据分析—科学家薪资分析
一、选题背景介绍及选题意义 本研究旨在探究影响数据科学家薪酬的因素,通过分析相关数据集来寻找这些因素与工资之间的关系。随着数据科学职业的不断发展,对于雇主和雇员来说,了解可能影响薪酬的因素非常重要。本分析将探讨各种因素,包括个人背景、工作经验、技能、地理位置等,以及这些因素对数据科学家薪酬的影响程度 ......
ASR项目实战-决策点
针对语音识别的产品,分别记录设计、开发过程中的决策点。 实时语音识别 对于实时语音识别来说,客户端和服务端之间实时交换语音数据和识别的结果。 客户端在启动识别时,即开始发送语音数据,期望在等待较短的时间后,即收到最初的识别结果。第一段语音数据和第一个识别结果之间的时延,一般称为首字时延。 客户端在停 ......
【Python数据分析课程设计】大数据分析—游戏销售额分析
一、选题背景介绍 游戏开发商面临着越来越多的竞争,需要制定合理的市场策略来保持竞争优势。 对游戏销售额进行分析是了解游戏市场和游戏产业状况的重要手段之一。通过对游戏销售额的分析,可以了解游戏市场规模和增长趋势,评估不同类型游戏的表现,发现新的商业机会,并为游戏开发商制定市场策略提供参考。 同时,游戏 ......
AutoGPT实战
1.概述 人工智能(AI)的能力持续在全球范围内引起轰动,并对我们日常生活和职业生涯带来重大变革。随着像ChatGPT这样的先进生成型AI模型以及从GPT-3到GPT-4的加速,我们在高级推理、理解更长上下文和输入设置方面看到了重大改进。像ChatGPT这样的工具要求用户编写Prompt,以获得所需 ......
ASR项目实战-架构设计
一般而言,业务诉求作为架构设计的输入。 需求清单 对于语音识别产品而言,需满足的需求,举例如下: 功能需求 文件转写。 长文件转写,时长大于60秒,小于X小时,X可以指定为5。 短文件转写,时长小于60秒。 实时语音识别。 长语音识别,时长大于60秒,小于Y小时,Y可以指定为5。 短语音识别,时长小 ......
Markdown学习笔记
Markdown学习 标题的运用 井号加空格后面输入要输入的标题内容 字体的运用 前后两个星号*中间是字体【是加粗】 前后三个星号中间是字体【是加粗并倾斜】* 废弃线的运用 前后是两个波浪线中间是字体 。 列:今天来学习养猪的知识 ~~ ~~ 引用的运通 大于号加空格,用于引用他人文章内容! 分割线 ......
ASR项目实战-项目交付历程
本文记录,作为项目主要负责人,完整参与语音识别项目的交付历程。 2019年12月中旬 接到项目交付任务,收集基本知识,启动业务分析工作。 2020年1月 完成竞品分析的整理。 梳理合作伙伴的清单,整理项目计划,启动和各合作伙伴的沟通工作。 启动架构方案、设计方案的准备工作。 2020年2月 和合作伙 ......
我的MySQL优化学习笔记
我的MySQL优化学习笔记 这是我自己的学习记录笔记,方便自己后续翻看,(如需要)也可共享出来供大家参考。 一、优化概述 1. 优化的目的是什么? 通过配置使现有的软件和硬件获得最佳性能【典型】 寻求机会该进MySQL软件本身 开发自己的存储引擎和硬件设备来扩展MySQL生态系统 2. 从哪里着手优 ......
《软件需求十步走》阅读笔记三
开发因需求而来,需求开发以需求规划的成果为主要依据。软件需求开发首先要做的是获取需求,得到目标、系统关联情况以及用例的分析;其次是需求分析,软件系统的可行性、用户接口、系统功能、数据、优先级等这些都在需求分析之列;然后汇总成需求分析规格说明书;最后在进行需求测评,制定具体的开发方案。 需求获取是确定 ......
ASR项目实战-交付团队的分工
对于通常的软件项目,参与角色,比如可以有用户,消费者,产品团队,研发团队(研发团队包括开发和测试),运营团队,运维团队,管理团队。 通常认为,用户,负责购买服务的群体,而消费者,负责使用业务的群体。这两个群体,不在本文的讨论范围之内,因此后续的介绍中,除非明确说明,否则默认均不涉及。 产品团队,研发 ......
ASR项目实战-产品分析
分析Google、讯飞、百度、阿里、QQ、搜狗等大厂的ASR服务,可以罗列出一款ASR服务所需要具备的能力。 产品分类 ASR云服务产品,从用户体验、时效性、音频时长,可以划分为如下几类: 实时短音频转写,可以用于支撑输入法、搜索、导航等场景。 实时长音频转写,可以用于支撑视频字幕、图文直播、会议直 ......
system笔记
system("pause") 可以实现冻结屏幕 system("CLS") 可以实现清屏操作 调用color函数可以改变控制台的前景色和背景,具体参数在下面说明。 例如,用 system("color 0A"); 其中color后面的0是背景色代号,A是前景色代号。各颜色代码如下: 0=黑色 1= ......
ASR项目实战-前处理
本文深入探讨前处理环节。 首先介绍一些基本的名词,比如 文件名后缀 文件格式 音频格式 采样率和位深 预备知识 文件名后缀、文件格式和音频格式 常见的音频文件,比如.wav、.mp3、.m4a、.wma等,这些都代表什么? 仅仅是这类音频文件的后缀而已,不一定和音频文件的编码、音频数据的编码相关。 ......
ASR项目实战-后处理
本文深入探讨后处理环节。 在本环节要处理的重要特性有分词、断句、标点符号、大小写、数字等的格式归一等。 分词 和NLP、搜索等场景下的分词含义不同。对于拼音类的语言,比如英语、法语等,句子由多个单词组成,语音输出的结果,需要按需在各个单词之间补充或者去掉空格。对于中文来说,字和词之间不以空格作为边界 ......
【Python大数据分析课程设计】——心血管疾病数据分析和预测模型
一、选题背景 心血管疾病是全球范围内主要健康威胁之一,而通过大数据分析揭示相关模式和趋势对于疾病预防和管理至关重要。社会上心血管疾病的不断增加与现代生活方式、不良饮食和缺乏运动等因素密切相关,对健康系统和经济造成巨大负担。在技术飞速发展的今天,大数据分析为深入挖掘潜在的健康信息提供了前所未有的机会, ......
[Python高级应用课程设计]大数据分析——二手房屋房价分析
一、选题背景介绍及选题意义 随着经济的发展和城市化进程的加快,房地产市场已成为我国经济增长的重要支撑。然而,房价的波动却成为了社会关注的焦点之一。因此,利用大数据分析方法对房价进行研究和预测已成为当前热门的研究方向。大数据分析技术可以从多维度、全方位地收集和分析相关数据,发现数据背后的规律,并进行预 ......
《重构:改善既有代码的设计》读书笔记三
7、Feature Envy(依恋情结) 函数对于某个类的兴趣高过对自己所处类的兴趣。 把这个函数移至另一个地点,移到它该去的地方。Move Method(搬移函数) 如果一个函数用到几个类的功能,则该判断哪个类拥有最多被此函数使用的数据,然后就把这个函数和那些数据摆在一起。Extract Meth ......
ASR项目实战-数据
使用机器学习方法来训练模型,使用训练得到的模型来预测语音数据,进而得到识别的结果文本,这是实现语音识别产品的一般思路。 本文着重介绍通用语音识别产品对于数据的诉求。 对数据的要求 训练集 相关要求,如下: 地域,需要覆盖使用人群所在的地域,且数据的比例适中。 口音,需要覆盖典型的口音。 年龄,从18 ......
读书笔记
《软件工程—实践者的研究方法》读书笔记 第三部分是质量管理。什么是质量?质量是一个复杂多面的概念,设计质量和符合质量两方面都需要软件工程师考虑。质量很重要,但是用户不满意,其他的事就都不重要了。这是Robert Glass给出的一个“直观的公式”:用户满意度=合格的产品+好的质量+按预算和进度安排交 ......
【Python爬虫课程设计】唐诗三百首——数据爬虫+数据可视化
一、选题背景介绍 中国古代文化中的唐诗是一颗璀璨的明珠,代表了中华民族的文化底蕴和艺术成就。唐诗以其深邃的意境、优美的语言和丰富的情感打动了世人。然而,要阅读和欣赏大量的唐诗作品并非易事。为了让更多人能够了解、感受和研究唐诗,利用爬虫技术和数据可视化手段对唐诗进行数字化处理是一种创新而有意义的尝试。 ......
ASR项目实战-构建Kaldi
准备工作 安装构建时依赖的基础软件 软件清单如下: bzip2 python3 automake libtool cmake gcc g++ gfortran git subversion 不同平台安装软件的方式不同,比如可以使用yum或者apt-get等。 下载开源软件 软件清单如下: Libun ......
zkq 数学听课笔记
线性代数 域 \(F\),OI 中常用的域是 \(\Z_{p^c}\)。 \(n\) 维向量 \(\vec x \in F^n\),其中 \(x_i \in F\),注意向量是列向量。 \(F^n\) 向量/线性空间,满足线性性 八个性质,\(u, v, w \in V\),\(c, d \in F ......
Cage 字符串听课笔记
困困困! KMP 注意到 KMP 的复杂度是均摊的,那么是否可以绕开? 注意到 KMP 实际上一个串的 ACAM,那么考虑可以类似的,在加入一个字符的同时维护 ACAM(考虑 ACAM 的构建过程,前面的点不会被影响)那么每次就可以通过 \(O(|\Sigma|)\) 的修改(或者利用可持久化数据结 ......
陈峻宇高级图论讲课笔记
离线哩! 竞赛图 竞赛图确实抽象,性质一堆一堆的,想不明白……而且多半都和强连通分量有关系。 兰道定理 考虑一共有 \(n \choose 2\) 条边,那么 \(\sum out_x = \binom n2\)。 兰道定理大致就是如果竞赛图强连通,那么: \[\not \exists k \in ......
【python爬虫课程设计】从懂球帝爬取中超联赛知名运动员数据+数据可视化
一、选题背景: 中超联赛作为中国顶级足球赛事,吸引了广泛的关注,其球员数据包含了丰富的信息,涵盖球员技术、表现和比赛策略等方面。随着数据科学技术的不断发展,对于足球俱乐部和教练来说,充分利用这些数据进行分析和挖掘,以制定更有效的战术和管理策略变得愈发重要。选题背景重点:1. 数据驱动的足球管理:中超 ......
【Python数据分析课程设计】大数据分析—Pokemon 1996-2022年各世代宝可梦数据集分析
一、选题背景宝可梦是一种受欢迎的媒体内容和游戏系列,由任天堂、Game Freak和Creatures等公司合作开发。它们是虚构的生物角色,具有各种不同的属性、技能和能力。自1996年首次推出以来,宝可梦已经成为全球范围内的文化现象。宝可梦不仅仅是娱乐产品,它们也在社会中产生了广泛的影响: 竞技游戏 ......
ASR项目实战-语音识别
本文深入探讨语音识别处理环节。 本阶段的重点特性为语音识别、VAD、热词、文本的时间偏移、讲话人的识别等。 语音识别 业界流派众多,比如Kaldi、端到端等,具体选择哪一种,需要综合考虑人员能力、训练数据量和质量、硬件设施、交付周期等,作出相对合理的交付规划。 基于Kaldi的方案,优点在于其发挥稳 ......
【彩虹六号】各个地图有意思的玩法笔记(自用)
【彩虹六号】各个地图有意思的玩法笔记(自用) 每次看到一些有趣的方法总是忘记,干脆做个笔记吧 运河 运河二楼外墙摔炮听切 运河二楼外墙摔炮听切实战 方向放大 需要注意这个地方可以收人头/被抓 站在钢琴房偷天窗 天窗偷人法 先给天窗标点 去钢琴房敲洞 仅限开局三十秒 木屋 ASH+FUZE清地下电 【 ......
splay学习笔记
二叉搜索树 定义以下变量 $fa[x] $ \(x\)的父亲节点 \(son[x][0/1]\) \(x\)的左/右儿子 \(key[x]\) \(x\)的键值,按照键值维护节点的位置 \(sz[x]\) \(x\)的子树大小 五种操作: insert操作 操作含义:将一个点插入 先令\(now=r ......
《大学计算机》课程简介 School of Computer Science and Engineering
《大学计算机》课程简介 School of Computer Science and Engineering 阅读量:1628 发布时间:2014-05-25 分享到: 《大学计算机》课程是大学计算机基础教学的最基本课程,是大学本科非计算机专业学生必修的公共基础课。计算机基础课程如同数学、外语一样, ......