课程: 什么是生成式人工智能(Generative AI)

文本转图像应用

2022年, 我们见证了商业图像生成服务的增长。 这些服务背后的技术, 被统称为文本转图像技术。 只需输入文字, 算法就会根据要求生成图像, 哪怕描述不是特别具体也行。 目前存在三个主要的文本转图像生成服务。 就是屏幕上显示的这三个。 用操作系统比喻的话, 第一个就相当于苹果系统, 因为他们都有封闭的应用编程接口, 同时在图像生成的过程中, 都非常关注设计和艺术。 第二个就相当于微软系统, 都有开放应用编程接口, 因为它是企业发布的, 一开始就用了最先进的机器学习算法。 相比设计和艺术敏感性, 它的母公司更关注技术。 第三个利用的是稳定扩散算法, 相当于一种开源操作系统, 因为它依靠整个人工智能社区的贡献, 来不断发展。 文本转图像模型生成的图像质量, 取决于算法质量和用来训练的数据库质量。 知道这些主要服务之后, 来看它们的工业应用。 首先看这个工具, 这是由我们公司开发的, 也是好莱坞第一个生成式人工智能软件, 用于制作流媒体电影背景。 普通的虚拟制作工作流程, 需要在三维世界中制作, 这需要团队专门为电影量身定做三维世界。 这耗时耗钱还涉及很多重复任务。 现在在图片生产过程, 引入生成式人工智能技术, 就能把二维背景增强为2.5维。 第二个例子, 来看一个提供个性化造型的服装网站。 它们利用真实的服装和图像生成系统, 向客户推荐服饰,从而发现客户的时尚风格。 最后, 市场营销人员和电影制片人, 在构思电影概念时,也使用文本转图像模型。 实际上,他们之后可能还会用它, 制作分镜板, 甚至在制作广告和电影后期时应用它。 而营销领域最近的一个例子, 是马丁尼在广告中, 用了图像生成系统生成的图片。 亨氏和雀巢的广告也一样。 而美国一家众筹网站, 用基于稳定扩散算法的工具, 制作了精美视频。 营销人员在创意过程中, 利用生成式人工智能有两个理由。 首先是它节省了时间和成本。 其次是能从文本转图像工具中, 获得独特的外观和感受。

内容