llm

乱弹 LLM 的工程化

乱弹 LLM 的工程化 仅为个人观点,乱弹而已。 这一波 LLM 狂热很有意思,从现象上来看跟智能手机 + 移动互联网那一拨有点相像。首先是 OpenAI 扮演了当年 Apple 的角色,以 ChatGPT 这一杀手级产品搅动了一池春水,此时整个学术界、工业界及 AI 社区对 AI 表现出的那种食之 ......
乱弹 工程 LLM

安卓机上 4G 内存跑 alpaca,欢迎试用轻量级 LLM 模型推理框架 InferLLM

从 LLM 火爆以来,社区已经出现了非常多优秀的模型,当然他们最大的特点就是体积大,最近为了让大模型可以在更低端的设备上运行,社区做了非常多的工作, gptq 实现了将模型进行低比特量化,因此降低了运行大模型对CPU内存,GPU显存的要求,llama.cpp 实现了在本地 CPU/GPU 上就可以运 ......
轻量 轻量级 框架 InferLLM 模型

LLM

ChatGLM-6B https://github.com/THUDM/ChatGLM-6B 支持在单张 2080Ti 上进行推理使用。 在 1:1 比例的中英语料上训练了 1T 的 token 量 ChatGLM-6B 序列长度达 2048 fine-tune 需要Deepspeed 训练需要显存 ......
LLM

Databricks 开源 LLM

导读 大数据分析公司 Databricks Inc 近日也加入了生成式 AI 领域的竞争之中,发布了一个名为 Dolly 的开源大型语言模型,将模型命名为 Dolly 是为了向第一只克隆羊多莉致敬。 像 ChatGPT 和 Bard 这样的生成式 AI,它们使用的数据通常来自于在成千上万不同网站,使 ......
Databricks LLM

开源大模型(large language model, LLM)介绍

作为如今LLM圈内绝对的领头羊,OpenAI并没有遵从其创立初衷,无论是ChatGPT早期所使用的的GPT3、GPT3.5还是此后推出的GPT4模型,OpenAI都因“暂无法保证其不被滥用”为由拒绝了对模型开源,开启了订阅付费模式。 对于大型科技企业而言,不管是出于秀肌肉还是出于商业竞争目的,自研L ......
language 模型 large model LLM

LLM(大语言模型)解码时是怎么生成文本的?

Part1配置及参数 transformers==4.28.1 源码地址:transformers/configuration_utils.py at v4.28.1 · huggingface/transformers (github.com) 文档地址:Generation (huggingfa ......
模型 文本 语言 LLM

如何理解人工智能领域 LLM 的 No notion of time or chronological order 这一局限性?

在人工智能领域,LLM代表“大型语言模型”。当一个LLM处理一段文本时,它通常只考虑当前的句子,而不考虑整个上下文中的时间或时间顺序。 这种局限性意味着LLM无法处理一些需要考虑时间或时间顺序的任务。例如,如果一个LLM被用来预测天气,它可能无法考虑先前的天气预报,这会影响其预测准确性。同样,在一些 ......

怎么裁剪LLM(大语言模型)的vocab(词表)?

怎么裁剪LLM(大语言模型)的vocab(词表)? Part1前言 对于一些多语言的大语言模型而言,它的词表往往很大。在下游使用这些模型的时候,可能我们不需要其它的一些语言,例如只需要中文和英文,此时,我们可以对其vocab进行裁剪,既可以大大减少参数量,也能够保留模型的性能,接下来以Bloom模型 ......
词表 模型 语言 vocab LLM

使用LLM的问题

当前大模型的低成本实现方案: 语言模型 + 指令微调数据 + 微调加速 llama + alpaca_data(Fine-tuning) + lora 语言模型: ... 指令微调数据: 在一组通过指示描述的数据集上对语言模型微调,大大提高了在未见过任务上的 Zero-Shot 能力。 通过对多种任 ......
问题 LLM

Semantic Kernel 入门系列:🪄LLM的魔法

ChatGPT 只是LLM 的小试牛刀,让人类能够看到的是机器智能对于语言系统的理解和掌握。 如果只是用来闲聊,而且只不过是将OpenAI的接口封装一下,那么市面上所有的ChatGPT的换皮应用都差不多。这就像是买了个徕卡镜头的手机,却只用来扫二维码一样。 由于微软的财大气粗,在OpenAI取得进展 ......
Semantic Kernel 129668 魔法 LLM

Semantic Kernel 入门系列:🛸LLM降临的时代

不论你是否关心,不可否认,AGI的时代即将到来了。 在这个突如其来的时代中,OpenAI的ChatGPT无疑处于浪潮之巅。而在ChatGPT背后,我们不能忽视的是LLM(Large Language Model)大型语言模型。 一夜之间所有的大厂商都在搞LLM,虽然很难有谁能和OpenAI相匹敌,但 ......
Semantic 时代 Kernel 128760 LLM

Schillace法则:使用LLM创建软件的最佳实践

LLM(大语言模型)的发展正在改变软件开发的方式。 以前,开发人员需要编写大量的代码来实现其意图,但现在,随着语言模型的发展,开发人员可以使用自然语言来表达他们的意图,而无需编写大量的代码。这使得软件开发更加高效和灵活,同时也降低了开发人员的工作量。LLM的发展将极大地改变软件开发的方式,使软件开发 ......
法则 Schillace 软件 LLM

微软开源了一个 助力开发LLM 加持的应用的 工具包 semantic-kernel

在首席执行官萨蒂亚·纳德拉(Satya Nadella)的支持下,微软似乎正在迅速转变为一家以人工智能为中心的公司。最近微软的众多产品线都采用GPT-4加持,从Microsoft 365等商业产品到“新必应”搜索引擎,再到低代码/无代码Power Platform等面向开发的产品,包括软件开发组件P ......
共163篇  :6/6页 首页上一页6下一页尾页