角色扮演 模型 角色 意识

将Transformer用于扩散模型,AI 生成视频达到照片级真实感

前言 在视频生成场景中,用 Transformer 做扩散模型的去噪骨干已经被李飞飞等研究者证明行得通。这可算得上是 Transformer 在视频生成领域取得的一项重大成功。 本文转载自机器之心 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪 ......
真实感 Transformer 模型 照片 视频

纯卷积BEV模型的巅峰战力 | BEVENet不用Transformer一样成就ADAS的量产未来(转)

近年来,在自动驾驶领域,鸟瞰视角(BEV)空间中的3D目标检测作为一种普遍的方法逐渐脱颖而出。尽管与视角视图方法相比,BEV方法在精度和速度估计方面得到了改进,但将BEV技术部署到实际自动驾驶车辆中仍然具有挑战性。这主要归因于它们依赖于基于视觉 Transformer (ViT)的架构,这使得相对于 ......
卷积 巅峰 Transformer 模型 成就

大模型那么火,教你一键Modelarts玩转开源LlaMA(羊驼)大模型

本文分享自华为云社区《大模型那么火,教你一键Modelarts玩转开源LlaMA(羊驼)大模型》,作者:码上开花_Lancer 。 近日, LlaMA(羊驼)这个大模型再次冲上热搜! LLaMA(Large Language Model Meta AI),由 Meta AI 发布的一个开放且高效的大 ......
模型 Modelarts LlaMA

重磅:谷歌发布最强大AI模型【Google Gemini】

https://www.cnblogs.com/eryueren/p/17901497.html 一、前言 北京时间 2023年12 月 13 日Google 发布了最新的 Gemini Pro模型,并且提供了 API 访问。 一个更好的消息是:Gemini Pro 可免费使用。赶紧体验起来吧~ 二 ......
重磅 模型 Google Gemini

倾斜摄影三维模型的根节点合并纹理匀色技术方法分析

三维工厂K3DMaker是一款三维模型浏览、分析、轻量化、顶层合并构建、几何校正、格式转换、调色裁切等功能专业处理软件。可以进行三维模型的网格简化、纹理压缩、层级优化等操作,从而实现三维模型轻量化。轻量化压缩比大,模型轻量化效率高,自动化处理能力高;采用多种算法对三维模型进行几何精纠正处理,精度高,... ......
纹理 节点 模型 方法 技术

实现漫反射光照模型

漫反射光照符合兰伯特定律(Lambert's law),基本光照模型中漫反射计算公式: \(C_{diffuse}=(C_{light} \cdot M_{diffuse})max(0,\hat{N} \cdot \hat{I} )\) 其中,\(C_{light}\) 是光源的颜色,\(M_{di ......
光照 模型

R语言结构方程模型SEM、路径分析房价和犯罪率数据、预测智力影响因素可视化2案例|附代码数据

原文链接:http://tecdat.cn/?p=25044 原文出处:拓端数据部落公众号 最近我们被客户要求撰写关于结构方程模型的研究报告,包括一些图形和统计输出。 1 简介 在本文,我们将考虑观察/显示所有变量的模型,以及具有潜在变量的模型。第一种有时称为“路径分析”,而后者有时称为“测量模型” ......
数据 犯罪率 方程 路径 智力

扩散模型初探

扩散模型的推导 主要是根据以下网址学习diffusion的数学形式:网址 首先使用\(q\)表示前向扩散过程,使用\(p\)表示逆向过程。 \[q(\mathbf{x}_t|\mathbf{x}_{t-1})=\mathcal{N}(\mathbf{x}_t;\sqrt{1-\beta}_t\mat ......
模型

AI浪潮下,大模型如何在音视频领域运用与实践?

视频云大模型算法「方法论」。 刘国栋|演讲者 在AI技术发展如火如荼的当下,大模型的运用与实践在各行各业以千姿百态的形式展开。音视频技术在多场景、多行业的应用中,对于智能化和效果性能的体验优化有较为极致的要求。如何运用好人工智能提升算法能力,解决多场景业务中的具体问题,需要创新地探索大模型技术及其应 ......
浪潮 模型 领域

重磅:谷歌发布最强大AI模型【Google Gemini】

能不能“吊打” GPT-4 北京时间 2023年12 月 13 日Google 发布了最新的 Gemini Pro模型,并且提供了 API 访问。 一个更好的消息是:Gemini Pro 可免费使用。 ......
重磅 模型 Google Gemini

HarmonyOS:使用MindSpore Lite引擎进行模型推理

场景介绍 MindSpore Lite是一款AI引擎,它提供了面向不同硬件设备AI模型推理的功能,目前已经在图像分类、目标识别、人脸识别、文字识别等应用中广泛使用。 本文介绍使用MindSpore Lite推理引擎进行模型推理的通用开发流程。 基本概念 在进行开发前,请先了解以下概念。 张量:它与数 ......
HarmonyOS MindSpore 模型 引擎 Lite

模型放置到3D场景中后模型位置与鼠标选中的位置不一致怎么办?

在线工具推荐:3D数字孪生场景编辑器 - GLTF/GLB材质纹理编辑器 - 3D模型在线转换 - Three.js AI自动纹理开发包 - YOLO 虚幻合成数据生成器 - 三维模型预览图生成器 - 3D模型语义搜索引擎 1、问题 从事3D建模相关工作的朋友们在工作中经常会遇到以下几种问题: 1、 ......
模型 位置 场景 鼠标 怎么办

如何创建逼真的3D模型

要实现逼真的 3D 视觉效果,需要关注细节并了解照明、纹理和材质的原理。要使 3D 场景看起来更逼真,请专注于精确的照明设置,使用高分辨率纹理和凹凸贴图来增加表面的深度,并合并逼真的着色器和材质。此外,请注意构图、摄像机角度和后期处理效果,以增强 3D 渲染的整体真实感。 ......
模型

如何删除/替换3D模型的材质贴图

GLTF 编辑器 -NSDT 不仅可以设置3D模型纹理贴图,还可以设置模型的几何原点、以及对有相同材质属性的mesh进行合并,实现模型轻量化,是一款不可多得的实用型在线模型编辑工具。 ......
材质 模型 贴图

GLB/GLTF 模型压缩轻量化

Draco 是用于网格压缩的 glTF 扩展,以及由 Google 开发的开源库,用于压缩和解压缩 3D 网格以显着减小 3D 内容的大小。它压缩顶点位置、法线、颜色、纹理坐标和任何其他通用顶点属性,从而提高通过 Web 传输 3D 内容的效率和速度。 ......
模型 GLTF GLB

ChatGLM2-6B模型的微调

概述 GLM模型底层还是基于Transformer,因此其设计、优化都是围绕Transformer的各个组件的。从注意力层的掩码、位置编码等方面优化与设计。 ChatGLM3/ChatGLM2的源码中,比如finetune、trainer等代码,其实是copy自HuggingFace,而且其使用流程 ......
ChatGLM2 模型 ChatGLM 6B

最强Pose模型RTMO开源 | 基于YOLO架构再设计,9MB+9ms性能完爆YOLO-Pose

https://mp.weixin.qq.com/s/4EJAKBcqlCzDXib1_TKJxw 点击下方卡片,关注「AI视界引擎」公众号 AI视界引擎 「AI视界引擎」公众号不仅致力于分享AI视觉与大语言模型的前沿科技,还将成为连接业界专家、学术界和广大读者的桥梁。我们将提供最新的研究进展、技术 ......
Pose YOLO 架构 YOLO-Pose 模型

三维模型的顶层合并构建的模型层级和块大小划分规则浅析

三维工厂K3DMaker是一款三维模型浏览、分析、轻量化、顶层合并构建、几何校正、格式转换、调色裁切等功能专业处理软件。可以进行三维模型的网格简化、纹理压缩、层级优化等操作,从而实现三维模型轻量化。轻量化压缩比大,模型轻量化效率高,自动化处理能力高;采用多种算法对三维模型进行几何精纠正处理,精度高,... ......
模型 层级 顶层 大小 规则

HanLP — HMM隐马尔可夫模型 -- 训练和预测

训练的过程,就是求三个矩阵的过程 初始概率矩阵 转移概率矩阵 发射矩阵 每个字有4种可能性,上图中有7个字,就是 4^7 种可能性 维特比算法,从众多路径中,挑出最优的那条,他和隐马尔可夫没有强关联 初始概率矩阵 根据频率得到概率 今天 天气 真 不错。 麻辣肥牛 好吃 ! 我 喜欢 吃 好吃 的! ......
模型 HanLP HMM

Diffusion Model扩散模型

1、扩散模型基本原理: 扩散模型包括两个步骤: 固定的(或预设的)前向扩散过程q:该过程会逐渐将高斯噪声添加到图像中,直到最终得到纯噪声。 2.可训练的反向去噪扩散过程pθ:训练一个神经网络,从纯噪音开始逐渐去噪,直到得到一个真实图像 。 正向过程首先,对于一张原始图片,我们给加一个高斯噪声,图片由 ......
Diffusion 模型 Model

一文带你了解LoRa微调语言大模型的实用技巧

微调定制化的大型语言模型需要投入大量时间和精力,但掌握恰当的微调方法和技巧能显著提高效率。比如用LoRa(LLM的低秩适配Low-Rank Adaptation)微调大模型,能够利用少量显卡和时间对大模型进行微调,降低成本。 ......
实用技巧 模型 语言 技巧 LoRa

大模型-向量数据库

向量数据库很多,先试试milvus。 1、安装:通过docker pull没搞定。使用官网的docker-compose搞定了。 2、运行:需要启动3个容器: docker start milvus-etcd docker start milvus-minio docker start milvus ......
向量 模型 数据库 数据

HanLP — HMM隐马尔可夫模型 -- 语料库

BMES => B:词语开始、M:词语中间、E:词语结束、S:单独成词 并非所有中文任务都需要分词 语料库 每行是一篇“文章” 每篇文章用空格分开 语料库的准确性,严重影响分词结果 理论上,语料库越大越好 每个字都有一个标识(隐藏状态),可以根据语料库得到所有标识 中文分词就是为了得到状态 麻 辣 ......
语料库 语料 模型 HanLP HMM

大语言模型LLM的核心技术及应用场景案例的分析

自注意力机制、位置编码和激活函数共同提高了模型对序列数据中重要信息的关注程度。通过自注意力机制,模型可以自动学会为序列中的关键部分分配更高的权重…… ......
模型 场景 核心 案例 语言

【论文解读】System 2 Attention提高大语言模型客观性和事实性

本文简要介绍了论文“System 2 Attention (is something you might need too) ”的相关工作。基于transformer的大语言模型(LLM)中的软注意很容易将上下文中的不相关信息合并到其潜在的表征中,这将对下一token的生成产生不利影响。为了帮助纠正... ......
事实性 客观性 Attention 模型 客观

训练一个目标检测模型

博客地址:https://www.cnblogs.com/zylyehuo/ (一)识别背景/目的 第十八届全国大学生智能汽车竞赛室外 ROS 无人车赛(高教组) 无人车在室外运行中, 需要探索未知环境, 识别障碍物, 停车标志牌、红绿灯等标志物。 比赛场地为不规则环形场地, 由红蓝两色锥桶搭建而成 ......
模型 目标

拆解全景,解锁未来——深度分析大模型六大领域及五大应用解决方案

在本篇文章中,将带您首先通过解读 LLM 的全景图,深入探讨了 LLM 的六个关键领域,随后提出五种主要方案以解决企业在这一技术领域面临的挑战。从商业模型到开源模型、微调、自定义构建,再到与 AI 提供商的合作,本文将引领您深入了解 LLM 的技术脉络,为探索和应用这一技术提供一些思考与指导。 ......

倾斜摄影三维模型重建高程偏差的因素及解决方法分析

三维工厂K3DMaker是一款三维模型浏览、分析、轻量化、顶层合并构建、几何校正、格式转换、调色裁切等功能专业处理软件。可以进行三维模型的网格简化、纹理压缩、层级优化等操作,从而实现三维模型轻量化。轻量化压缩比大,模型轻量化效率高,自动化处理能力高;采用多种算法对三维模型进行几何精纠正处理,精度高,... ......
高程 偏差 模型 因素 方法

Unity3D 第一人称角色控制器,第一人称相机,摄像机的关系详解

Unity3D是一款强大的游戏开发引擎,可以用于创建各种类型的游戏。在游戏中,第一人称角色控制器、第一人称相机和摄像机是密切相关的组件,它们共同协作来实现游戏的第一人称视角。下面将详细解释它们之间的关系,并给出代码实现。 对啦!这里有个游戏开发交流小组里面聚集了一帮热爱学习游戏的零基础小白,也有一些 ......
控制器 摄像机 角色 Unity3D 相机

【matlab混沌理论】1.5.洛伦兹模型的分析

洛伦兹方程用于生成y变量的图。这是对三种y初始条件敏感依赖的一个例子。 1.洛伦兹吸引子的y敏感依赖的着色图 input: % 洛伦兹方程用于生成y变量的图。x和z的初始条件保持不变,但y的初始条件在1.001、1.0001和1.00001之间变化 % 定义洛伦兹方程 sigma = 16; bet ......
模型 理论 matlab
共3700篇  :10/124页 首页上一页10下一页尾页