2022，AIGC元年？人工智能aigc自然语言处理-奇宝库

文｜世昕

有人认为，AIGC将会改变内容领域的生产方式，带来整个行业的变革，也有人认为AIGC将会取代大多数创作者，带来灾难性的影响。在各种言论甚嚣尘上之时，一个共识似乎悄然达成了，从2022年开始，AIGC将迎来完全不同的发展时期。
AIGC编年史

AI绘画最早要追溯2014年，GAN（生成式对抗网络）的诞生。据说人工智能专家Ian Goodfellow在一次酒后想到了这一深度模型概念，基于CNN（深度卷积神经网络），GAN创造性地将两个神经网络进行对抗，即生成器与鉴别器。生成器用于生成“造假数据”，鉴别器用于判断数据的真伪，在两者的对抗中，逐渐演化出强大的“造假能力”，而这种造假能力则用于图像的合成。
GAN之父Ian Goodfellow，图源网络

在GAN大放异彩的2015年，一家公司在美国硅谷成立，其背后站着“钢铁侠”埃隆·马斯克、Y Combinator总裁阿尔特曼、天使投资人彼得·泰尔等一众硅谷大佬，这家公司就是ChatGPT的缔造者——OpenAI。

OpenAI最大的特点即是“Open”，即开放AI能力，全球研发者都可以通过其提供的开发与研究框架投入AI开发中，共同促进AI技术的发展。也是从2016年开始，OpenAI推出了自己的AI平台Universe。故事轰轰烈烈地开始了。

GPT-1则可以在开始进行无监督学习的预训练，通过对数据的学习增强语言能力，最后进行部分有监督的微调。简单来说，GPT-1可以用更少的资源和数据进行更具效率的学习，但GPT-1仍旧是青涩的，一方面碍于训练数据的有限，AI的“世界观”很有限，另一方面其性能仍旧不够好，远远达不到对话的能力。GPT-3的推出是一场革新。

随后便是我们熟知的故事了。

AIGC国内玩家但近几年来，阿里巴巴、百度、腾讯等互联网巨头都注意到了AIGC这一未来的产业富矿。

在五个月前的百度世界大会上，百度CEO李彦宏就着重强调了AIGC，他认为，AIGC不仅能够提升内容生产小笼包，还能创造出有独特价值的独立视角的内容。在世界大会上，百度AI也展示出了自己的实力：在十分钟内复原了《富春山居图》的残卷，其背后依赖的深度学习模型，即是百度的当家模型——文心大模型。
百度AI复原的《富春山居图》，图源网络

在世界大会两个月后的万象大会上，百度还发布了AI助理，根本上是多种AIGC应用的集合，包括文本生成、图片生成，图片转换视频等多种功能，最值得关注的一点是，其直接面向用户与内容创作者，也就是说，AIGC技术的C端应用化正在实现。

自2020年起，昆仑万维便组建了超过200人的AIGC团队，训练集群200张卡，投入数千万元，并在2021年4月研发出了百亿参数的中文GPT-3模型。值得关注的是，在很多人忽略的音乐领域，昆仑万维也取得了不错的进展，于2022年1月启动的SkyMusic已经可以实现生成商用级别的音乐。

除了以上提到的这两家公司外，在国内AIGC领域，垂直赛道的初创公司也势头正劲，覆盖AI音乐、虚拟人、AI音频语音、AI游戏等领域。

另一方面，国内AIGC相关公司面对的营收压力客观存在，很难像OpenAI等平台不计成本的进行投入。但伴随着AIGC逐渐成熟的商业化以及更广泛的应用，或许国内AIGC领域即将迎来春天。
为何元年？

2022年8月，人工智能公司Stability AI推出了AI文生图模型Stable Diffusion（扩散模型），将AI图像生成的效率与精度提升到了前所未有的量级，在最基础的终端设备上，只需输入关键词，就能生成高质量的AI图像，几乎让整个世界为之疯狂。AI绘画的爆发式发展也第一次让C端感受到了AIGC的强大魅力。

相比以前的GAN图像生成模型，Stable Diffusion最大的特点就在于精准，只要输入对关键词，其就能产生较为接近的图像结果，这是此前的图像生成很难做到的。ChatGPT也同样是高性能的，有人几乎把它当做了谷歌一样的搜索引擎，正是在于其对于文本的深度分析并能够生成较为精确的反馈。而各种生成内容则进一步显示了其性能的强大。

最后则在于更大范围的应用。

AIGC在2022年的火爆，是技术积累与发展策略双重变革的产物，

AIGC也还有很长的路要走。一方面，在“创造”这一概念面前，基于深度学习的AI的创作是否真正是创造还难以定论，另一方面知识产权问题也像一把达摩克利斯之剑始终悬在AIGC头上，如何解决AI学习背后的伦理问题也是一大难题。

媒介合作联系微信号|ciweimeijiejun

如需和我们交流可后台回复“进群”加社群

相关文章