奇宝库 > 2022,AIGC元年?人工智能aigc自然语言处理

2022,AIGC元年?人工智能aigc自然语言处理


文|世昕

有人认为,AIGC将会改变内容领域的生产方式,带来整个行业的变革,也有人认为AIGC将会取代大多数创作者,带来灾难性的影响。在各种言论甚嚣尘上之时,一个共识似乎悄然达成了,从2022年开始,AIGC将迎来完全不同的发展时期。
AIGC编年史

AI绘画最早要追溯2014年,GAN(生成式对抗网络)的诞生。据说人工智能专家Ian Goodfellow在一次酒后想到了这一深度模型概念,基于CNN(深度卷积神经网络),GAN创造性地将两个神经网络进行对抗,即生成器与鉴别器。生成器用于生成“造假数据”,鉴别器用于判断数据的真伪,在两者的对抗中,逐渐演化出强大的“造假能力”,而这种造假能力则用于图像的合成。
GAN之父Ian Goodfellow,图源网络

在GAN大放异彩的2015年,一家公司在美国硅谷成立,其背后站着“钢铁侠”埃隆·马斯克、Y Combinator总裁阿尔特曼、天使投资人彼得·泰尔等一众硅谷大佬,这家公司就是ChatGPT的缔造者——OpenAI。

OpenAI最大的特点即是“Open”,即开放AI能力,全球研发者都可以通过其提供的开发与研究框架投入AI开发中,共同促进AI技术的发展。也是从2016年开始,OpenAI推出了自己的AI平台Universe。故事轰轰烈烈地开始了。

GPT-1则可以在开始进行无监督学习的预训练,通过对数据的学习增强语言能力,最后进行部分有监督的微调。简单来说,GPT-1可以用更少的资源和数据进行更具效率的学习,但GPT-1仍旧是青涩的,一方面碍于训练数据的有限,AI的“世界观”很有限,另一方面其性能仍旧不够好,远远达不到对话的能力。GPT-3的推出是一场革新。

随后便是我们熟知的故事了。


AIGC国内玩家但近几年来,阿里巴巴、百度、腾讯等互联网巨头都注意到了AIGC这一未来的产业富矿。

在五个月前的百度世界大会上,百度CEO李彦宏就着重强调了AIGC,他认为,AIGC不仅能够提升内容生产小笼包,还能创造出有独特价值的独立视角的内容。在世界大会上,百度AI也展示出了自己的实力:在十分钟内复原了《富春山居图》的残卷,其背后依赖的深度学习模型,即是百度的当家模型——文心大模型。
百度AI复原的《富春山居图》,图源网络

在世界大会两个月后的万象大会上,百度还发布了AI助理,根本上是多种AIGC应用的集合,包括文本生成、图片生成,图片转换视频等多种功能,最值得关注的一点是,其直接面向用户与内容创作者,也就是说,AIGC技术的C端应用化正在实现。

自2020年起,昆仑万维便组建了超过200人的AIGC团队,训练集群200张卡,投入数千万元,并在2021年4月研发出了百亿参数的中文GPT-3模型。值得关注的是,在很多人忽略的音乐领域,昆仑万维也取得了不错的进展,于2022年1月启动的SkyMusic已经可以实现生成商用级别的音乐。

除了以上提到的这两家公司外,在国内AIGC领域,垂直赛道的初创公司也势头正劲,覆盖AI音乐、虚拟人、AI音频语音、AI游戏等领域。

另一方面,国内AIGC相关公司面对的营收压力客观存在,很难像OpenAI等平台不计成本的进行投入。但伴随着AIGC逐渐成熟的商业化以及更广泛的应用,或许国内AIGC领域即将迎来春天。
为何元年?

2022年8月,人工智能公司Stability AI推出了AI文生图模型Stable Diffusion(扩散模型),将AI图像生成的效率与精度提升到了前所未有的量级,在最基础的终端设备上,只需输入关键词,就能生成高质量的AI图像,几乎让整个世界为之疯狂。AI绘画的爆发式发展也第一次让C端感受到了AIGC的强大魅力。


相比以前的GAN图像生成模型,Stable Diffusion最大的特点就在于精准,只要输入对关键词,其就能产生较为接近的图像结果,这是此前的图像生成很难做到的。ChatGPT也同样是高性能的,有人几乎把它当做了谷歌一样的搜索引擎,正是在于其对于文本的深度分析并能够生成较为精确的反馈。而各种生成内容则进一步显示了其性能的强大。

最后则在于更大范围的应用。

AIGC在2022年的火爆,是技术积累与发展策略双重变革的产物,

AIGC也还有很长的路要走。一方面,在“创造”这一概念面前,基于深度学习的AI的创作是否真正是创造还难以定论,另一方面知识产权问题也像一把达摩克利斯之剑始终悬在AIGC头上,如何解决AI学习背后的伦理问题也是一大难题。

媒介合作联系微信号|ciweimeijiejun

如需和我们交流可后台回复“进群”加社群

本文来自网络,不代表本站立场,转载请注明出处: