一文读懂生成式人工智能的所有基础知识(上)

发布时间 2023-12-08 18:59:24作者: 曼孚科技

生成式人工智能已经成为一项突破性技术,改变了我们的生活与工作方式。

它不仅是一种技术现象,更是一种广泛应用于实际生活的工具。

2023 年,世界见证了生成式人工智能的多项突破,其中最引人注目的当属由 OpenAI 开发的最新版本ChatGPT。该工具于2022年11月向公众发布测试,短短五天内就有超过100万人注册使用,至今热度不减。

可以说,生成式人工智能对人工智能世界的影响是深远的,我们才刚刚开始触及其潜力的表层。

在本文中,我们将介绍生成式人工智能的所有基础知识并概述其当前的生态系统。

什么是生成式人工智能?

生成式人工智能又名AIGC,是相对于PCG(专业生成内容)、UCG(用户生成内容)提出的又一概念。它善于从现有内容中学到的模式来创建新内容,包括文本、图像、音频、视频和3D交互内容等各种形式的内容和数据。

中国信息通信研究院曾在《人工智能生成内容(AIGC)白皮书(2022年)》中发表观点,将AIGC的发展历程大致分为三个阶段,分别为早起萌芽阶段(1950-1990)、沉淀积累阶段(1990-2010)与快速发展阶段(2010-至今)。

其中,快速发展阶段是AIGC的新时代。自14年起,随着以生成式对抗网络(Generative Adversarial Network,GAN)为代表的深度学习算法的提出与迭代更新,生成内容百花齐放,效果逐渐逼真直至人类难以分辨。

  • 2017 年,微软人工智能少女“小冰”推出了世界首部 100%由人工智能创作的诗集《阳光失了玻璃窗》。
  • 2018年,英伟达发布的 StyleGAN模型可以自动生成图片,目前已升级到第四代模型 StyleGAN-XL,其生成的高分辨率图片人眼难以分辨真假。
  • 2019 年,DeepMind 发布了DVD-GAN模型用以生成连续视频,在草地、广场等明确场景下表现突出。
  • 2021 年,OpenAI 推出了DALL-E并于一年后推出了升级版本 DALL-E-2,主要应用于文本与图像的交互生成内容,用户只需输入简短的描述性文字,DALL-E-2 即可创作出相应极高质量的卡通、写实、抽象等风格的绘画作品。
  • 2022年,OpenAI推出了聊天机器人ChatGPT(基于GPT-架构的大型语言模型)。ChatGPT除了可以以文字方式与用户进行互动,还可以用于相对复杂的语言工作,包括自动文本生成、自动问答等功能,还具有编写和调试计算机程序,创作文本、故事的能力。
  • 2023年,百度推出了全新一代知识增强大语言模型文心一言(文心大模型4.0)。自全面开放以来,用户数量已达7000万,应用场景扩展到4300个,无论是帮助列提纲、写邮件、写调研报告、做会议纪要,还是为工程师推荐和生成代码,文心一言都展现出了卓越的性能和实用性。

生成式与判别式模型(GM&DM)

从内容层面讲,生成式人工智能之所以被称为生成式,是因为它创造了以前不存在的东西,而判别式仅限区分类型的不同。

举个例子,判别人工智能试图回答这样的问题:“这张图片是A还是B的图画?” 而生成式人工智能则对诸如“给我画一张A与B坐在一起的图片”之类的提示做出反应。

而从技术角度剖析,生成式模型是针对联合分布进行建模,判别式模型是针对条件分布建模。判别式模型更注重对于分类任务的解决,生成式模型则更专注于对于数据的理解和建模。

所以,在区分一个物种是A还是B类型的问题时,两种模型的工作思路分别如下:

  • 判别式模型:从过往数据中学习到模型,并通过提取该物种特征来预测其为A或B的概率。
  • 生成式模型:先利用vA的特征习得一个A的模型,再根据B的特征习得一个B的模型。然后从该物种中提取特征,分别放入A模型与B模型,比较概率大小,较大的那个即为答案。

此外,需要注意的是,判别式模型对数据的要求较低,只需要有足够的标记数据即可进行学习,而生成式模型则需要更多的无标记数据来进行模型的学习。

在一些既定类型区分或选择的场景下,判别式模型具有更高的准确性,效率更高,而在需要生成新样本或数据重建的场景下,生成式模型往往优势更大。

未完待续......