paddlepaddle pp-ocrv serving文字

OpenXML-SDK 操作Word,PPT,提取文字

今天跟大家分享一款插件,OpenXML-SDK 实现对Word,PPT的操作。 今天仅介绍如何利用这个组件,从文件中提取文字。 OpenXML-SDK有个缺陷,不支持跨平台,即只能部署在windows系统 首先、nuget上引用包 然后,上代码,从PPT中提取文字,返回一个数组,及一段段的文字。 u ......
OpenXML-SDK OpenXML 文字 Word SDK

文字阴影、文本溢出、盒子模型的缩放、盒子阴影

文字阴影、文本溢出、盒子模型的缩放、盒子阴影 文字阴影 格式:text-shadow:value none,默认文本没有阴影。 color lrshadow tbshadow blur color,阴影的颜色,可选的。不写默认是文本颜色。 lrshadow,左右阴影(水平),正数阴影在文本右侧,负数 ......
盒子 阴影 模型 文本 文字

口播神器,基于Edge,微软TTS(text-to-speech)文字转语音免费开源库edge-tts实践(Python3.10)

不能否认,微软Azure在TTS(text-to-speech文字转语音)这个人工智能细分领域的影响力是统治级的,一如ChatGPT在NLP领域的随心所欲,予取予求。君不见几乎所有的抖音营销号口播均采用微软的语音合成技术,其影响力由此可见一斑,仅有的白璧微瑕之处就是价格略高,虽然国内也可以使用科大讯 ......

Kakao Brain 的开源 ViT、ALIGN 和 COYO 文字-图片数据集

最近 Kakao Brain 在 Hugging Face 发布了一个全新的开源图像文本数据集 COYO,包含 7 亿对图像和文本,并训练了两个新的视觉语言模型 ViT 和 ALIGN ViT 和 ALIGN。 这是 ALIGN 模型首次公开发布供开源使用,同时 ViT 和 ALIGN 模型的发布都 ......
文字 数据 图片 Kakao Brain

OpenAI Java SDK——chatgpt-java-v1.0.4更新支持GPT-3.5-Turbo,支持语音转文字,语音翻译。

简介 chatgpt-java是一个OpenAI的Java版SDK,支持开箱即用。目前以支持官网全部Api。支持最新版本GPT-3.5-Turbo模型以及whisper-1模型。增加chat聊天对话以及语音文件转文字,语音翻译。 开源地址:https://github.com/Grt1228/cha ......
语音 chatgpt-java-v chatgpt 文字 OpenAI

巧用视觉障眼法,还原 3D 文字特效

最近群里有这样一个有意思的问题,大家在讨论,使用 CSS 3D 能否实现如下所示的效果: 这里的核心难点在于,如何利用 CSS 实现一个立体的数字?CSS 能做到吗? 不是特别好实现,但是,如果仅仅只是在一定角度内,利用视觉障眼法,我们还是可以比较完美的还原上述效果的。 利用距离、角度及光影构建不一 ......
障眼 障眼法 特效 视觉 文字

带你读AI论文丨针对文字识别的多模态半监督方法

摘要:本文提出了一种针对文字识别的多模态半监督方法,具体来说,作者首先使用teacher-student网络进行半监督学习,然后在视觉、语义以及视觉和语义的融合特征上,都进行了一致性约束。 本文分享自华为云社区《一种针对文字识别的多模态半监督方法》,作者: Hint 。 摘要 直到最近,公开的真实场 ......
模态 文字 方法 论文
共547篇  :19/19页 首页上一页19下一页尾页