InferLLM

Inferllm源码解析

# Inferllm源码解析 ## 文件结构 1. application: 放置几个不同模型的参数配置和后处理 2. include: 包含抽象model类的头文件 3. src/core: 核心组件,包括tensor、算法等基础算子的抽象和KV文件系统的实现 4. src/graph: 包含了几 ......
源码 Inferllm

安卓机上 4G 内存跑 alpaca,欢迎试用轻量级 LLM 模型推理框架 InferLLM

从 LLM 火爆以来,社区已经出现了非常多优秀的模型,当然他们最大的特点就是体积大,最近为了让大模型可以在更低端的设备上运行,社区做了非常多的工作, gptq 实现了将模型进行低比特量化,因此降低了运行大模型对CPU内存,GPU显存的要求,llama.cpp 实现了在本地 CPU/GPU 上就可以运 ......
轻量 轻量级 框架 InferLLM 模型
共2篇  :1/1页 首页上一页1下一页尾页