大作业

cleaning of llm corpus 大模型语料清洗

cleaning of llm corpus 大模型语料清洗 数据是人工智能领域发展的基础要素之一。随着大规模预训练模型及相关技术不断取得突破,在相应研究中使用高效数据处理工具提升数据质量变得越来越重要。llm_corpus_quality集成了包含清洗、敏感词过滤、广告词过滤、语料质量自动评估等功 ......
语料 cleaning 模型 corpus llm

开发篇1:使用原生api和Langchain调用大模型

对大模型的调用通常有以下几种方式:方式一、大模型厂商都会定义http风格的请求接口,在代码中可以直接发起http请求调用;方式二、在开发环境中使用大模型厂商提供的api;方式三、使用开发框架Langchain调用,这个就像java对数据库的调用一样,可以直接用jdbc也可以使用第三方框架,第三方框架 ......
Langchain 模型 api

软件构造大作业 综合信息管理系统

项目地址:mendianyu/AdvancedManagement: 综合信息管理系统 (github.com) 项目演示地址:https://www.bilibili.com/video/BV1uw411J7cy/ 项目功能一:基于Jfinal构建信息管理系统,要求包含用户管理,翻译业务模块管理, ......
管理系统 系统 软件 信息

第四周作业

1. 使用while read line和/etc/passwd,计算用户id总和。 2. 总结索引数组和关联数组,字符串处理,高级变量使用及示例。 索引数组 示例:一次赋值数组B多个元素 关联数组 关联数组必须先声明,再赋值 示例:声明关联数组H,并赋值 引用和查看数组 ${数组名[X]}:数组特 ......

云平台大数据系统需求有哪些?

高性能计算资源:需要具备强大的计算能力来处理大规模的数据和进行复杂的数据分析、机器学习训练等任务。这可以通过采购高性能的服务器和配备适当的处理器、内存和存储设备来实现。同时,需要选择适合的数据处理和机器学习框架,如TensorFlow、PyTorch等,以提高计算效率和性能。 大规模存储能力:需要足 ......
需求 数据 系统 平台

用例图作业

用例图作业 一. 简答题(共4题,100分) (简答题) 对于一个电子商务网站而言,以下哪些不是合适的用例,指出并说明理由。 将商品放入购物车 结账 预订商品 邮寄商品 查看商品详情 正确答案: 输入支付信息:太小 邮件商品:系统功能之外 查看商品详情:太小 (简答题) 为了满足物业中介行业的信息化 ......

对象图作业

对象图作业 一. 简答题(共3题,100分) (简答题) 对象特性的三要素是什么,请通过一个实际的例子来说明三要素的内容。 正确答案: 对象特性的三要素是状态、行为和标识。 张三对象具有身高、体重、学历、职务、收入等状态,具有读书、锻炼、吃饭等行为。 福建省有个张三,北京市有个张三,我们说福建张三和 ......
对象

包图作业

包图作业 一. 简答题(共2题,100分) (简答题) .包依赖应该与内部关系的联系与区别 正确答案: 当一个包依赖于另一个是,这意味着两个包的内容间存在着一个或多个的关系。 例如:如果是一个用例包图,那么就有可能两个用例之间存在includes、 extends、或继承关系,而两个用例分别处于不同 ......

状态图作业

状态图作业 一. 简答题(共7题,100分) (简答题) 什么是状态,对象的状态和对象的属性有什么区别? 正确答案: 状态是指在对象生命周期中满足某些条件、 执行某些活动或等待某些事件的一个条件和状 况。属性表述对象的个性,状态用来表示生命周期。 (简答题) 在状态机图中,状态转换由哪五个部分组成? ......
状态

活动图作业

活动图作业 一. 简答题(共7题,100分) (简答题) 活动图和顺序图之间有什么区别?它们的特点是什么。 正确答案: 顺序图做为一种交互图,强调的是对象到对象的控制流(交互),而活动图则强调的是活动 以及活动到活动的控制流。 (简答题)“在活动图中,可以根据自己的需要,有多个初始节点和活动终点”, ......

组件图与部署图作业

组件图与部署图作业 一. 简答题(共7题,100分) (简答题) 请阐述类与构件之间的主要异同点,并指出在 UML 中构件主要包括哪三种。 正确答案: 类是逻辑抽象,构件是物理抽象 类可以直接有属性和操作,构件则仅拥有可以通过其接口访问的操作 构件包括实施构件、工作产品构件、执行构件三种。 (简答题 ......
组件

第二章作业

第二章作业 一. 单选题(共4题,30.4分) (单选题)UML中的事物包括结构事物、分组事物、注释事物和()。 A. 实体事物 B. 边界事物 C. 控制事物 D. 动作事物 正确答案: D:动作事物; (单选题)UML中的4种关系是依赖、泛化、关联和() A. 继承 B. 合作 C. 实现 D. ......
第二章

顺序图作业

顺序图作业 一. 简答题(共7题,100分) (简答题) 交互是什么?请举 2-3 个交互的实际例子。 正确答案: 一次交互就是指在特定语境中, 为了实现某一个目标, 而在一组对象之间进行交换的一组 消息所表示的行为。 上传告警、发送短信 (简答题) 在 UML 2.0 中定义了哪四种交互图?其中强 ......
顺序

类图作业

类图作业 一. 简答题(共5题,100分) (简答题) 在对类名、属性 /方法名时,通常会遵循什么样的规则?请举例说明。 正确答案: 对于类名通常采用 CamelCase格式(大写字母开头、混合大小写,每个单词以大写开始, 避免使用特殊符号),尽可能避免使用缩写,例如 OrderDetail。 属性 ......

第一章作业

第一章作业 一. 单选题(共2题,18分) (单选题) 如果想对一个类的意义进行描述,那么应该采用( )。 A. 标记值 B. 规格描述 C. 注释 D. 构造型 正确答案: C:注释; (单选题) ( )模型的缺点是缺乏灵活性,特别是无法解决软件需求不明确或不准确的 问题。 A. 瀑布模型 B. ......

[极客大挑战 2019]Secret File 1

[极客大挑战 2019]Secret File 1 审题 看到题目应该是一道简单的按照要求找flag的题目 知识点 跟着题目走 解题 一,查看源码 找到网站进入 点开发现 【注意它说没看清吗】 二,使用BP抓包试试 发现新出现了/action.php 抓到后放到Repeater中响应 得到一个新的网 ......
Secret 2019 File

InternLM实训营 第四次作业

基础作业 基础作业的教程给的还是蛮详细的,这里就给一个最后的项目结构 前后对比 batch_size我刚开始设置的太大了,一直训不下去!! 进阶作业 创建模型 https://openxlab.org.cn/models/detail/aitejiu/personal_assistant 创建应用 ......
InternLM

从工程化角度,详解鹏程·脑海大模型训练过程

从工程化的角度,对鹏城.脑海大模型训练语料处理、模型训练优化、模型应用等方面做出了全面详细的经验分享。 ......
模型 脑海 角度 过程 工程

人工智能应用的“繁花时代”,各大企业何以破局AI模型挑战

​ AI技术的崛起,为各行业发展带来巨大变革和超强的创新潜力。然而,各大企业在拥抱AI的进程中并非一路坦途,“繁花盛开”的背后隐藏着AI模型生产与管理环节的诸多痛点。 先来看看部分金融企业在人工智能技术的应用现状:工商银行运用超过2200个智能模型,通过OCR技术实现支票、业务委托书等业务凭证要素的 ......
人工智能 繁花 人工 模型 智能

【专题】2023年大语言模型综合评测报告PDF合集分享(附原数据表)

原文链接:https://tecdat.cn/?p=33624 原文出处:拓端数据部落公众号 自2022年年末以来,人工智能大模型已成为技术领域甚至全球创新领域最受关注的话题。以ChatGPT为代表的大模型产品发展迅速,预测数据显示,到2030年,AIGC市场规模有望超过万亿元。2023年,国内主要 ......
评测报告 数据表 模型 语言 专题

浦语书生大模型实战训练营03笔记和作业

1.1配置环境 进入命令行,安装pytorch环境 bash /root/share/install_conda_env_internlm_base.sh InternLM conda activate InternLM # 升级pippython -m pip install --upgrade ......
训练营 书生 实战 模型 笔记

Spark - spark on yarn 的作业提交流程

客户端(Client)通过YARN的ResourceManager提交应用程序。在此过程中,客户端进行权限验证,生成Job ID和资源上传路径,并将这些信息返回给客户端。 客户端将jar包、配置文件、第三方包等文件上传到指定的HDFS路径。完成后,客户端再次向ResourceManager提交作业执 ......
流程 Spark spark yarn on

数据科学与大数据专业

数据科学与大数据技术专业 阅读量:690 发布时间:2021-06-08 分享到: 数据科学与大数据技术专业是2020年教育部批准的新工科专业,面向国家大数据产业发展战略规划需要以及对接社会对大数据相关专业人才迫切需求,具有跨学科特色的交叉融合专业,是目前人才市场缺口最大的专业之一。 1、培养目标 ......
数据 科学 专业

大模型调优方法:提示工程、RAGs 与微调对比

每一个搭建大语言模型应用的AI工程师都会面临一个难题,如何选择一个合适调优方法。就算是强大的预训练LLM也可能无法直接满足项目中的特定需求。如项目需要一个特定结构的应用程序,如预训练缺失上下文的重要文件,再比如有特定术语和结构的高专业性的行业领域,面对这些问题,需要有特定的方法来调整LLM。 要决定 ......
模型 方法 工程 RAGs

大语言模型LLM幻觉的解决方法:检索增强生成RAG

当你向大语言模型LLMs集成的问答系统平台咨询医疗方面的问题,比如呼吸道感染应该怎么治疗,它可能直接给出答案,但不会提供这个答案的依据来源,这是因为大语言模型应用过程中还存在答案透明度不足的缺陷导致。此外,大语言模型还有知识更新的滞后性、在处理复杂任务时的准确性的问题。 为了解决这些问题,检索增强生 ......
幻觉 模型 语言 方法 LLM

数字先锋 | “言”之有“力”,大模型背后的算力“推手”!

在算力调度方面,天翼云通过自研的调度系统,协助思必驰DFM-2大模型调度GPU、NPU、CPU等异构算力资源,大规模训练上云1个月,可以完成数十亿规模大模型所有阶段训练和效果评估。在训练能力打造方面,天翼云支持多种模型训练方式,不仅可以提升大模型训练平台的数据量,还大幅缩短了训练周期和交付进度。 ......
推手 模型 背后 数字

爱奇艺大数据生态的实时化建设

作者|爱奇艺大数据团队 数据作为互联网时代的基础生产资料,在各大公司企业拥有举足轻重的地位。数据的价值在互联网公司的体现,大致而言可以分成三类: 发掘数据中的信息来指导决策,如产品运营、用户增长相关的 BI 报表 依托数据优化用户体验和变现效率,如信息分发场景下的个性化推荐、效果广告等 基于数据统计 ......
实时 生态 数据

P4103 [HEOI2014] 大工程 题解

题目链接:大工程 先考虑只有一次查询,很显然我们可以暴力树上 dp 处理出答案。 对于每个节点而言,有: 容易看出类似点分治逐个遍历子树计算前面一堆子树对后面子树的贡献思想,我们可以很容易的知道: 对于路径总和,显然多了一段新的贡献,这段贡献为当前关键点和前面点多的一段 \(2\) 号路线长。这段长 ......
题解 工程 P4103 4103 2014

开源大数据集群部署(二)集群基础环境实施准备

作者:櫰木 环境准备 本次使用到的二进制软件包目录为:系统初始化前提是操作系统已完成安装、各个主机之间网络互通,系统常用命令已安装,本默认这些前提条件已具备,不在阐述。 1 主机环境初始化 安装centos系统完成后需要对主机进行初始化配置和验证工作,在所有主机上(hd1.dtstack.com-h ......
集群 环境 基础 数据

听6位专家畅谈AI大模型落地实践:场景和人才是关键

回顾大模型技术在企业的应用过程中,我们不禁要问:大模型在落地方面带来了哪些改变?开发者如何应对大模型的变革?在AI大模型的驱动下,企业的未来又会走向何方? ......
模型 场景 关键 专家 人才
共7200篇  :1/240页 首页上一页1下一页尾页