526互联

3w+星标项目大佬创业：树莓派即可运行大模型，已获GitHub前CEO投资

发布时间 2023-06-28 17:53:57作者: CV技术指南（公众号）

前言资深开发大佬，终于忍不住自己出来创业了。

本文转载自量子位

仅用于学术分享，若侵权请联系删除

欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

CV各大方向专栏与各个部署框架最全教程整理

【CV技术指南】CV全栈指导班、基础入门班、论文指导班全面上线!!

Georgi Gerganov，今年三月曾开源了llama.cpp项目，GitHub上已破三万星标，要知道Stable Diffusion也不过8.8k。

这个项目能让开发者在没有GPU情况下运行Meta的LLaMA模型，即便是在树莓派、MacBook上运行大模型也通通不在话下~

动图封面

△在 M2 Max 上以 40 tok/s 的速度运行 7B LLaMA

甚至还成功吸引了小扎的注意：Meta也在运行llama.cpp。

可能由于反响太好，这位大哥决定把背后核心纯C语言框架ggml拿出来创业：原本是几月前的副业项目。

在官宣前这家公司就已经获得来自GitHub前CEONat Friedman、Y Combinator合伙人Daniel Gross的种子前投资。

消息一出，众多开发者赶来祝贺。

其中不乏一些坚定的拥护者：ggml正在将大模型普及到边缘设备。

没过多久就有人建议：苹果应该将它收购了。（狗头）

llama.cpp作者创业

ggml，是一个纯C语言编写的张量库，可帮助开发者在消费级硬件上运行大模型，GitHub星标数达到4.4k。

由于加速效果惊人，一下子收获了不少开发者的支持。

By the way，ggml的gg恰好是他名字的缩写。

大哥自己的两个上万星标的项目llama.cpp和whisper.cpp都使用了它。

后者是为OpenAI的Whisper自动语音识别模型开发的加速方案，可在Mac、Windows、Linux、iOS、安卓、树莓派以及web上运行。

动图封面

△使用whisper.cpp在树莓派上检测短语音命令

不少初创公司，比如主打生活搜索引擎的rewind都使用了这套解决方案。

还有两个项目同时在终端上运行。

动图封面

△在单个M1Pro上同时运行4个13B LLaMA+Whisper Small实例

根据个人介绍，ggml张量库具有以下这些特点：

支持 16bit 浮点数；支持整数量化（包括 4 位、5 位、8 位）；自动微分；内置优化算法（例如 ADAM、L-BFGS）；为苹果芯片设置特定优化；在 x86 架构上使用AVX / AVX2 Intrinsic；通过WebAssembly和WASM SIMD提供Web支持；无第三方依赖；运行时零内存分配；支持指导型语言输出……

目前这个库以及相关项目都是免费开源，开发过程也全公开；当然也不排除开发授权给一些商业用途的项目。

用C/C++重写神经网络代码

而这背后的开发大佬Georgi Gerganov也值得说道说道。

他的个人网站十分简单直接，甩出各种开源项目，除此之外别无其他。可以看出，他是C/C++的狂热爱好者，信仰Vim。

此前，他曾用C/C++语言重写神经网络推理代码，这样几乎不依赖于其他库，以此提升效率。至于llama.cpp也是他一晚上Hacking出来的。

除此之外，他还有一些有意思的项目。

比如检查键盘是否可以通过麦克风窃听、猜Hacker News的标题，Wordle克隆版等等。

One More Thing

值得一提的是，背后的这两个投资者也有点意思。

他们还专门给创业者提供算力集群，只需在网站上申请即可。这波是在Next Level上了~

参考链接：
[1]https://ggerganov.com/
[2]http://ggml.ai/
[3]https://twitter.com/ggerganov

欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

计算机视觉入门1v3辅导班

【技术文档】《从零搭建pytorch模型教程》122页PDF下载

QQ交流群：470899183。群内有大佬负责解答大家的日常学习、科研、代码问题。

其它文章

中科院自动化所发布FastSAM | 精度相当，速度提升50倍！！！

大核卷积网络是比 Transformer 更好的教师吗？ConvNets 对 ConvNets 蒸馏奇效

MaskFormer：将语义分割和实例分割作为同一任务进行训练

CVPR 2023 VAND Workshop Challenge零样本异常检测冠军方案

视觉魔法师：开启语义分割的奇幻之旅

沈春华团队最新 | SegViTv2对SegViT进行全面升级，让基于ViT的分割模型更轻更强

刷新20项代码任务SOTA,Salesforce提出新型基础LLM系列编码器-解码器Code T5+

可能95%的人还在犯的PyTorch错误

从DDPM到GLIDE：基于扩散模型的图像生成算法进展

CVPR最佳论文颁给自动驾驶大模型！中国团队第一单位，近10年三大视觉顶会首例

最新轻量化Backbone | FalconNet汇聚所有轻量化模块的优点，成就最强最轻Backbone

ReID专栏（二）多尺度设计与应用

ReID专栏（一）任务与数据集概述

libtorch教程（三）简单模型搭建

libtorch教程（二）张量的常规操作

libtorch教程（一）开发环境搭建：VS+libtorch和Qt+libtorch

NeRF与三维重建专栏（三）nerf_pl源码部分解读与colmap、cuda算子使用

NeRF与三维重建专栏（二）NeRF原文解读与体渲染物理模型

NeRF与三维重建专栏（一）领域背景、难点与数据集介绍

异常检测专栏（三）传统的异常检测算法——上

异常检测专栏（二）：评价指标及常用数据集

异常检测专栏（一）异常检测概述

BEV专栏（二）从BEVFormer看BEV流程（下篇）

BEV专栏（一）从BEVFormer深入探究BEV流程（上篇）

可见光遥感图像目标检测（三）文字场景检测之Arbitrary

可见光遥感目标检测（二）主要难点与研究方法概述

可见光遥感目标检测（一）任务概要介绍

TensorRT教程（三）TensorRT的安装教程

TensorRT教程（二）TensorRT进阶介绍

TensorRT教程（一）初次介绍TensorRT

AI最全资料汇总 | 基础入门、技术前沿、工业应用、部署框架、实战教程学习

计算机视觉入门1v3辅导班

计算机视觉交流群

聊聊计算机视觉入门

树莓已获模型项目

gpt源码树莓模型

模型numpy树莓可在

树莓神经网络长短模型

树莓模型llama2 llama

卷积树莓神经网络模型

树莓模型神经网络numpy

模态cogagent模型github