双语faster-whisper字幕whisper
ffmpeg提取与合并音视频和字幕
提取 假设有一个视频文件名字叫demo.mkv,有两条音频,一条字幕。 # 打印视频信息 $ ffprobe -i demo.mkv # 以下是简化后的视频信息 视频1:Stream 0:0 hevc 音频1:Stream 0:1 eac3 音频2:Stream 0:2 aac 字幕1:Stream ......
使用推测解码 (Speculative Decoding) 使 Whisper 实现 2 倍的推理加速
Open AI 推出的 Whisper 是一个通用语音转录模型,在各种基准和音频条件下都取得了非常棒的结果。最新的 large-v3 模型登顶了 OpenASR 排行榜,被评为最佳的开源英语语音转录模型。该模型在 Common Voice 15 数据集的 58 种语言中也展现出了强大的多语言性能,在 ......
[OS] 在 Windows 11 中启用 "实时字幕 (Live captions)" 功能
打开实时字幕 实时字幕在 Windows 11 版本 22H2 及更高版本中提供。 选择 "开始 > 所有应用 > 辅助功能 > 实时字幕" 或按 Windows 徽标键 + Ctrl + L。 首次打开时,实时字幕将提示下载实时字幕语言文件,供设备语音识别使用。 如果你的语言不可用,则可以在设置过 ......
中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽
君不言语音识别技术则已,言则必称Whisper,没错,OpenAi开源的Whisper确实是世界主流语音识别技术的魁首,但在中文领域,有一个足以和Whisper相颉顽的项目,那就是阿里达摩院自研的FunAsr。 FunAsr主要依托达摩院发布的Paraformer非自回归端到端语音识别模型,它具有高 ......
安卓之视频智能字幕的应用场景以及各种技术优劣分析
一、文章摘要 随着技术的发展,智能字幕已经成为了安卓平台上一个重要的功能,特别是在视频播放方面。它为用户提供了一种更方便、更快捷的方式来理解视频内容,尤其是在多种语言环境下或者在没有声音的环境中。下面我们将详细探讨安卓平台上视频智能字幕的应用场景以及各种技术的优劣分析。 二、正文 2.1、应用场景 ......
pr 2020 导入歌词文件暨制作含字幕的MV
一、制作srt字幕文件 获取互联网上的lrc歌词文件; 将歌词文件用记事本打开,另存为UTF-8(含物料); 将lrc文件转换为srt文件; 可访问以下地址:https://gotranscript.com/subtitle-converter 将srt文件再用记事本打开,另存为UTF-8(含物料) ......
一个简单的QML滚动字幕实现
一个简单的QML滚动字幕实现 目录结构 configparam.h #ifndef CONFIGPARAM_H #define CONFIGPARAM_H #include <QObject> #include <QTypeInfo> class configParam : public QObje ......
【ffmpeg】使用 FFmpeg 给视频文件添加旁白和字幕
一、视频添加旁白 添加旁白需要将音频文件和视频文件的声音叠加在一起,可以使用 FFmpeg 的 amix 过滤器,以下是一个示例命令 ffmpeg -i a.mp4 -i a.mp3 -filter_complex "[0:a]volume=0.5[a0];[1:a]volume=3[a1];[a0 ......
win11上whisper安装
https://blog.csdn.net/zdm_0301/article/details/133854913#:~:text=UnicodeDecodeError%3A%20%27utf-8%27%20codec%20can%27t%20decode%20byte%200xb2%20in,9%3 ......
吴恩达最新短课,知识很硬核,附中英字幕
吴恩达最新短课,知识很硬核,附中英字幕 简介 大家好我是老章,吴恩达老师忠实粉丝 之前刷过他的很多课程: 吴恩达新课,1.25倍速刷完了 给吴恩达的最新短课加了中英文字幕 最近吴老师又限时免费开放了一个短课:《构建和评估高级 RAG 应用程序》 该课程由由 llama_index 和 truera_ ......
Amazon Code Whisperer 的正式使用,全新 AI 代码工具等你发现!(内附详细安装步骤图解)
Code Whisperer,亚马逊推出的实时 AI 编程助手,是一项基于机器学习的服务,它可以分析开发者在集成开发环境(IDE)中的注释和代码,并根据其内容生成多种代码建议。 ......
结合SK和ChatGLM3B+whisper+Avalonia实现语音切换城市
结合SK和ChatGLM3B+whisper+Avalonia实现语音切换城市 先创建一个Avalonia的MVVM项目模板,项目名称GisApp 项目创建完成以后添加以下nuget依赖 <PackageReference Include="Mapsui.Avalonia" Version="4.1 ......
强大的Nginx可视化管理平台 Nginx-Proxy-Manager中文入门指南(中英双语版后台)
强大的Nginx可视化管理平台 Nginx-Proxy-Manager中文入门指南(中英双语版后台) 今天给大家介绍一款 Nginx 可视化管理界面,非常好用,小白也能立马上手。 nginx-proxy-manager 是一个反向代理管理系统,它基于 NGINX,具有漂亮干净的 Web UI。还可以 ......
B站投稿 srt字幕【B站要求秒和毫秒间要求是逗号,而自动生成的确实点.】
正则处理 public class fsdafsdfe { public static void main(String[] args) { String ss = "1\n" + "00:00:00.320 --> 00:00:06.627\n" + "我只是想强调一下 Gumayusi\n" + ......
ChatGLM3-6B:新一代开源双语对话语言模型,流畅对话与低部署门槛再升级
ChatGLM3-6B:新一代开源双语对话语言模型,流畅对话与低部署门槛再升级 1.ChatGLM3简介 ChatGLM3 是智谱AI和清华大学 KEG 实验室联合发布的新一代对话预训练模型。ChatGLM3-6B 是 ChatGLM3 系列中的开源模型,在保留了前两代模型对话流畅、部署门槛低等众多 ......
PotPlayer如何外挂中英文双字幕及使用自动翻译功能[转]
文章来源:https://www.xiaoheiwoo.com/video-players-double-subtitle-setting/ 疯狂的小黑 • 2022年9月19日 上午1:27 • 软件/工具 • 阅读 10557 在口袋资源网下载过视频教程的同学都知道,我们的课程都是配中文字幕的。 ......
区块-自动自下向上移动(字幕滚动)
示例图 引入组件 import autoScroll from './components/autoMove.vue' 页面使用组件 <div class="pro-body"> <autoScroll :list="kzProData.specialCareList" :speed="kzProS ......
持续进化,快速转录,Faster-Whisper对视频进行双语字幕转录实践(Python3.10)
Faster-Whisper是Whisper开源后的第三方进化版本,它对原始的 Whisper 模型结构进行了改进和优化。这包括减少模型的层数、减少参数量、简化模型结构等,从而减少了计算量和内存消耗,提高了推理速度,与此同时,Faster-Whisper也改进了推理算法、优化计算过程、减少冗余计算等... ......
Windows11 实时字幕如何实现实时翻译?
Windows11 实时字幕如何实现实时翻译? 引言 2023 年 6 月 27 日 Windows11更新新增实用功能! 此更新添加了以下语言的实时字幕: 中文(简体和繁体) 法语(法国、加拿大) German 意大利语 日语 葡萄牙语(巴西、葡萄牙) Spanish 丹麦语 英语 (爱尔兰,其他 ......
DESTOON做中英双语言(多语言)切换版本具体详解
第一次发原创好激动,该注意点什么? 在开发过程中用户有许多要求,比如这个多语言切换就是一个需求。 首先讲解一下DESTOON(DT)后台系统如何做这个中英、甚至多语言切换的这个功能。 DT本身不自带多语言切换功能,但是强大的DT可以切换默认语言和默认模板的。 首先登陆后台 系统设置中-》网站设置-》 ......
554_AI自动识别生成srt字幕解决方案
这是一篇原发布于2021-03-28 08:51:00得益小站的文章,备份在此处。 前言 不知道大家在看视频的时候会不会觉得没有字幕就很难受,特别是学习教程类视频的时候。本就将使用一系列软件白嫖AI智能识别字幕功能。 识别效果如下: 识别字幕 目前市场上可以识别语音并转换为文字的服务有很多,网易见外 ......
Whisper + NemoASR + ChatGPT 实现语言转文字、说话人识别、内容总结等功能
引言 2023年,IT领域的焦点无疑是ChatGPT,然而,同属OpenAI的开源产品Whisper似乎鲜少引起足够的注意。 Whisper是一款自动语音识别系统,可以识别来自99种不同语言的语音并将其转录为文字。 如果说ChatGPT为计算机赋予了大脑,那么Whisper则为其赋予了耳朵。 想象一 ......
whisper/fast-whipser/baidu-aip-AipSpeech对比
是什么 whisper OpeanAI 推出的多语言语音识别模型,通过了68万小时的语音数据训练,支持99种语言,英文识别准确率非常惊艳。 更重要的是,它开源免费,在电脑上就能离线使用。 fast-whisper 处理速度更快的whisper,具有完全的 whsiper 模型参数,且自带 VAD 加 ......
Vue 文本字幕组件(Marquee Text Component)
简介及使用教程 Vue 文本字幕组件(Marquee Text Component)是一个Vue.js的字幕文本组件,具有CSS GPU动画、快速、功能强大等特点。 安装 Npm npm i vue-marquee-text-component Yarn yarn add vue-marquee-t ......
whisper安装
安装环境 官方使用的是Python 3.9.9 and PyTorch 1.10.1来训练和检验的程序,但兼容python 3.7以后的版本和pytorch近期更新版本。 大家在安装whisper的时候请尽量保证python版本与官方一致或更新版本,这样可以避免一些版本不同导致的莫名奇妙的错误。 1 ......
字幕播放器
最近磨耳朵,发现没有合适字幕播放器,于是用Flutter 3 写了一个。 虽然Flutter是跨平台,但是因为我只有一个三星平板S8,所以没在其他平台测试过~ 个人随手写的,但是希望能够帮助其他学英语的小盆友。 对软件有什么需求,欢迎留言,我随缘更新~ 使用说明截图,百度网盘链接,GitHub源代码 ......
whisper
OpeanAI 推出的 Whipser 语音识别模型,离线也可以使用。它和 ChatGPT 是同门师兄弟。 ### whisper Whipser 多语言语音识别模型,通过了68万小时的语音数据训练,支持99种语言,对英文的表现更是强无敌。 更重要的是,它开源免费,在电脑上就能离线使用。 地址:ht ......
【效率提升】手把手教你如何使用免费的 Amazon Code Whisperer 提升开发效率堪比 GitHub Copilot 平替
说明 GitHub copilot 虽然很强,但是一个月10美金的费用拿来吃个小火锅他不香吗?而身为云计算博主将向你推荐一款可以平替 GitHub copilot 并且免费的支持多种编程语言的 AI 编程助手 Amazon Code Whisperer。 亚马逊云科技开发者社区为开发者们提供全球的开 ......