模型 中枢2023 09

ChatGLM2-6B模型的微调

概述 GLM模型底层还是基于Transformer,因此其设计、优化都是围绕Transformer的各个组件的。从注意力层的掩码、位置编码等方面优化与设计。 ChatGLM3/ChatGLM2的源码中,比如finetune、trainer等代码,其实是copy自HuggingFace,而且其使用流程 ......
ChatGLM2 模型 ChatGLM 6B

最强Pose模型RTMO开源 | 基于YOLO架构再设计,9MB+9ms性能完爆YOLO-Pose

https://mp.weixin.qq.com/s/4EJAKBcqlCzDXib1_TKJxw 点击下方卡片,关注「AI视界引擎」公众号 AI视界引擎 「AI视界引擎」公众号不仅致力于分享AI视觉与大语言模型的前沿科技,还将成为连接业界专家、学术界和广大读者的桥梁。我们将提供最新的研究进展、技术 ......
Pose YOLO 架构 YOLO-Pose 模型

三维模型的顶层合并构建的模型层级和块大小划分规则浅析

三维工厂K3DMaker是一款三维模型浏览、分析、轻量化、顶层合并构建、几何校正、格式转换、调色裁切等功能专业处理软件。可以进行三维模型的网格简化、纹理压缩、层级优化等操作,从而实现三维模型轻量化。轻量化压缩比大,模型轻量化效率高,自动化处理能力高;采用多种算法对三维模型进行几何精纠正处理,精度高,... ......
模型 层级 顶层 大小 规则

2023-2024-1 20232421邓锴 《网络空间安全导论》 第5周学习总结

教材学习总结 思维导图 教材学习中的问题和解决问题 问题1: 问题1解决办法: 问题2: 问题2解决办法: 问题3: 问题3解决办法: 基于AI的学习 思考 参考资料 《网络空间安全导论》 ......
导论 20232421 网络 空间 2023

2023年12月13日总结

之前一直不是很会写摘要,都是用 AI 写的。今天尝试写正经一点:今天的内容是 dp。其实计划上有很多内容的,但是 dp 实在是太多内容了,以至于没有完成全部。但是还是学习了很多新的知识点,重新理解了四边形不等式的决策单调性优化dp,还学习了 wqs 二分。晚上又练习了动态dp(ddp)。明天测试,加... ......
2023

【专题】2023中国新母婴人群研究报告PDF合集分享(附原数据表)

原文链接:https://tecdat.cn/?p=34538 原文出处:拓端数据部落公众号 在回归母婴行业主题的背景下,我们发现了一个普遍讨论的热点问题——生育率的下降。随着主要母婴群体和市场环境的变化,母婴行业已经进入存量竞争阶段。为了应对这一挑战,母婴品牌和服务机构需要调整经营思路,以赢得消费 ......
数据表 研究报告 母婴 人群 专题

2023.12.12 校赛解题报告

7-1 点菜 题面 Congruent 和 ComistryMo 两个人正在饭店吃饭,饭店里面一共有 \(n\) 道菜,每道菜有一个价格 \(a_i\) ​\((1≤i≤n)\)。他俩会在饭店按顺序点 \(k\) 道菜(可以不连续,保证相对顺序即可), 假设点的菜序列为\(S_1−S_k\)。 他们 ......
报告 2023 12

2023.12.13——每日总结

学习所花时间(包括上课):9h 代码量(行):0行 博客量(篇):1篇 今天,上午学习,下午学习; 我了解到的知识点: 1.c# 明日计划: 学习 ......
2023 12 13

2023-12-13

package com.example.chatroom.api; import com.example.chatroom.component.OnlineUserManger; import com.example.chatroom.model.*; import com.fasterxml.ja ......
2023 12 13

2023-2024 ICPC, NERC, Northern Eurasia Onsite镜像赛瞎写

晚饭吃的卷饼,好吃。 L 题意 有 \(n\) 个字符,L 代表面包,O 代表洋葱,你和一个朋友需要分这些食物,需满足以下要求: 每个人至少有一件物品。 你从最左边向右边连续取,剩下的都是那个朋友的。 你们的面包数和洋葱数不能相同。 输出一个方案你分得的物品数,如无解则输出 \(-1\)。 做法 感 ......
Northern 镜像 Eurasia Onsite 2023

Android Studio Hedgehog | 2023.1.1

Android Studio Hedgehog | 2023.1.1 新建的默认工程报错。 使用依赖: implementation(platform("org.jetbrains.kotlin:kotlin-bom:1.8.0")) ......
Hedgehog Android Studio 2023

The 2023 ICPC Asia Hangzhou Regional Contest

目录写在前面赛时MJDGHH 之后的一个半小时赛后写在最后 写在前面 赛时题目按照过题顺序排序,赛后补题按照个人向难度排序。 虽然补题大概要拖到期末之后了。 这学期确实是超负荷了,现在脑子里一团糟,赛时的记忆已经不太清楚了。 省流版:搏一搏单车变摩托,但是怂了。 赛时 M 开局我正开,有中文题面好评 ......
Hangzhou Regional Contest 2023 ICPC

[CSP-S 2023] 种树

[CSP-S 2023] 种树 Part - 1 特殊性质 B 将种树时间设为 \(l\),结束时间为 \(r\),则可以把数的高度记作: \[\sum_{i = l}^r\max(1, b_i + x \times c_i) \]分类讨论: \(c_i \ge 0\) 可以表示为 \(b_i \t ......
CSP-S 2023 CSP

[CSP-S 2023] 消消乐

赛时 想到了一个规律,当一个字符串的头和首相等,并且中间的字符串同样可以被消除的话,那么这个大字串也就可以被消除。 虽然竭尽全力想到了这一点,不过还不知道如何实现,开始的想法是: 先使用 \(vector\) 来记录每一个字母所在的分别的下标,然后先从两个相邻字母的开始找(因为这样必定是可以消掉的) ......
CSP-S 2023 CSP

[CSP-S 2023] 密码锁

[CSP-S 2023] 密码锁 考场上我跟个 \(somebody\) 一样,一看就想:一眼乘法原理,乱搞写一下就出来了。 当时我还算了一下暴力好像也不会超时,结果,每天在 yz 日以继日的颓废考试经验,我断定 CSP-S 是不会考这么 \(!\) 复杂的题目的,结果暴力出奇迹,就是枚举模拟。 考 ......
密码锁 密码 CSP-S 2023 CSP

2023-12-13:用go语言,密码是一串长度为n的小写字母,一则关于密码的线索纸条, 首先将字母a到z编号为0到25编号, 纸条上共有n个整数ai,其中a1表示密码里第一个字母的编号, 若i>1的

2023-12-13:用go语言,密码是一串长度为n的小写字母,一则关于密码的线索纸条, 首先将字母a到z编号为0到25编号, 纸条上共有n个整数ai,其中a1表示密码里第一个字母的编号, 若i>1的话就表示第i个字母和第i-1个字母编号的差值, 例如,a2就代表密码中第1个字母和第2个字母编号的差 ......
字母 密码 纸条 小写 整数

HanLP — HMM隐马尔可夫模型 -- 训练和预测

训练的过程,就是求三个矩阵的过程 初始概率矩阵 转移概率矩阵 发射矩阵 每个字有4种可能性,上图中有7个字,就是 4^7 种可能性 维特比算法,从众多路径中,挑出最优的那条,他和隐马尔可夫没有强关联 初始概率矩阵 根据频率得到概率 今天 天气 真 不错。 麻辣肥牛 好吃 ! 我 喜欢 吃 好吃 的! ......
模型 HanLP HMM

2023.12.13日报

最近事情比较多,写日报也有点怠惰了,主要是偶尔会忘记,简单总结一下这两天的工作 首先是使用jfinal做大作业,实话说这玩意一开始我觉得并不好用,因为页面也很简陋,后端也有点看不懂 但是在实际体验并且调用百度翻译和图像处理的api后,感觉用起来还可以,其实和springboot有点类似 现在是已经实 ......
日报 2023 12 13

Diffusion Model扩散模型

1、扩散模型基本原理: 扩散模型包括两个步骤: 固定的(或预设的)前向扩散过程q:该过程会逐渐将高斯噪声添加到图像中,直到最终得到纯噪声。 2.可训练的反向去噪扩散过程pθ:训练一个神经网络,从纯噪音开始逐渐去噪,直到得到一个真实图像 。 正向过程首先,对于一张原始图片,我们给加一个高斯噪声,图片由 ......
Diffusion 模型 Model

一文带你了解LoRa微调语言大模型的实用技巧

微调定制化的大型语言模型需要投入大量时间和精力,但掌握恰当的微调方法和技巧能显著提高效率。比如用LoRa(LLM的低秩适配Low-Rank Adaptation)微调大模型,能够利用少量显卡和时间对大模型进行微调,降低成本。 ......
实用技巧 模型 语言 技巧 LoRa

大模型-向量数据库

向量数据库很多,先试试milvus。 1、安装:通过docker pull没搞定。使用官网的docker-compose搞定了。 2、运行:需要启动3个容器: docker start milvus-etcd docker start milvus-minio docker start milvus ......
向量 模型 数据库 数据

HanLP — HMM隐马尔可夫模型 -- 语料库

BMES => B:词语开始、M:词语中间、E:词语结束、S:单独成词 并非所有中文任务都需要分词 语料库 每行是一篇“文章” 每篇文章用空格分开 语料库的准确性,严重影响分词结果 理论上,语料库越大越好 每个字都有一个标识(隐藏状态),可以根据语料库得到所有标识 中文分词就是为了得到状态 麻 辣 ......
语料库 语料 模型 HanLP HMM

Solution Set 2023.12.13

CF1736E Swap and Take 设在第 \(i\) 次操作后产生贡献的值为初始序列的 \(a_{p_i}\),可以发现产生的贡献的指针移动方式为每次向后移动 \(1\),而通过交换数字最多可以使得某个数字每次向后移动 \(1\),由此可以得出每次产生贡献的位置单调不减,即 \(p_1 \ ......
Solution 2023 Set 12 13

【2023-12-12】家庭分工

20:00 人们说得好,在耕种多年的田地里,一年又一年长出新的谷子;完全可以相信“从读过的旧书里”人们也一定能学到新的知识。 ——乔叟 每天晚上下班回到家,最喜欢的一件事就是听奶奶投诉孩子。就像昨晚,把二宝背得熟睡的奶奶见我们进门了,就直接投诉二宝的调皮。投诉二宝在白天衬她不注意的时候,在厨房挖出了 ......
家庭 2023 12

F. 纪念品 - 2023HBUCM程序设计竞赛/CSP-J2019

题面 小伟突然获得一种超能力,他知道未来 \(T\) 天 \(N\) 种纪念品每天的价格。某个纪念品的价格是指购买一个该纪念品所需的金币数量,以及卖出一个该纪念品换回的金币数量。每天,小伟可以进行以下两种交易无限次: 任选一个纪念品,若手上有足够金币,以当日价格购买该纪念品; 卖出持有的任意一个纪念 ......
纪念品 程序设计 程序 HBUCM CSP-J

大语言模型LLM的核心技术及应用场景案例的分析

自注意力机制、位置编码和激活函数共同提高了模型对序列数据中重要信息的关注程度。通过自注意力机制,模型可以自动学会为序列中的关键部分分配更高的权重…… ......
模型 场景 核心 案例 语言

2023最新中级难度Redis面试题,包含答案。刷题必备!记录一下。

好记性不如烂笔头 内容来自 面试宝典-中级难度Redis面试题合集 问: 请解释Redis中的持久化机制RDB和AOF的区别,并谈谈你在实际应用中的选择。 Redis的两种持久化机制分别为RDB和AOF: RDB(Redis Database)是Redis默认的持久化方式,会在指定的时间间隔内将内存 ......
难度 答案 Redis 2023

2023年11月国产数据库大事记-墨天轮

本文为墨天轮社区整理的2023年11月国产数据库大事件和重要产品发布消息。 目录 11月国产数据库大事记 TOP10 11月国产数据库大事记(时间线) 产品/版本发布 兼容认证 代表厂商大事记 厂商活动 排行榜新增数据库 11月国产数据库大事记 TOP10 11月国产数据库大事记(时间线) 11月1 ......
天轮 大事记 大事 国产 数据库

2023最新初级难度Redis面试题,包含答案。刷题必备!记录一下。

好记性不如烂笔头 内容来自 面试宝典-初级难度Redis面试题合集 问: 请简单介绍一下Redis,以及它主要用于解决什么问题? Redis 是一款键值存储系统,也被称为“内存数据库”,其主要特点是在内存中高速存储数据。它的优点在于其极高的读写速度和较低的延迟,因此常被用来作为缓存、队列等应用场景中 ......
难度 答案 Redis 2023

【论文解读】System 2 Attention提高大语言模型客观性和事实性

本文简要介绍了论文“System 2 Attention (is something you might need too) ”的相关工作。基于transformer的大语言模型(LLM)中的软注意很容易将上下文中的不相关信息合并到其潜在的表征中,这将对下一token的生成产生不利影响。为了帮助纠正... ......
事实性 客观性 Attention 模型 客观
共13500篇  :43/450页 首页上一页43下一页尾页