课程: 什么是生成式人工智能（Generative AI）

文本转图像应用

课程: 什么是生成式人工智能（Generative AI）

文本转图像应用

“

2022年，我们见证了商业图像生成服务的增长。这些服务背后的技术，被统称为文本转图像技术。只需输入文字，算法就会根据要求生成图像，哪怕描述不是特别具体也行。目前存在三个主要的文本转图像生成服务。就是屏幕上显示的这三个。用操作系统比喻的话，第一个就相当于苹果系统，因为他们都有封闭的应用编程接口，同时在图像生成的过程中，都非常关注设计和艺术。第二个就相当于微软系统，都有开放应用编程接口，因为它是企业发布的，一开始就用了最先进的机器学习算法。相比设计和艺术敏感性，它的母公司更关注技术。第三个利用的是稳定扩散算法，相当于一种开源操作系统，因为它依靠整个人工智能社区的贡献，来不断发展。文本转图像模型生成的图像质量，取决于算法质量和用来训练的数据库质量。知道这些主要服务之后，来看它们的工业应用。首先看这个工具，这是由我们公司开发的，也是好莱坞第一个生成式人工智能软件，用于制作流媒体电影背景。普通的虚拟制作工作流程，需要在三维世界中制作，这需要团队专门为电影量身定做三维世界。这耗时耗钱还涉及很多重复任务。现在在图片生产过程，引入生成式人工智能技术，就能把二维背景增强为2.5维。第二个例子，来看一个提供个性化造型的服装网站。它们利用真实的服装和图像生成系统，向客户推荐服饰，从而发现客户的时尚风格。最后，市场营销人员和电影制片人，在构思电影概念时，也使用文本转图像模型。实际上，他们之后可能还会用它，制作分镜板，甚至在制作广告和电影后期时应用它。而营销领域最近的一个例子，是马丁尼在广告中，用了图像生成系统生成的图片。亨氏和雀巢的广告也一样。而美国一家众筹网站，用基于稳定扩散算法的工具，制作了精美视频。营销人员在创意过程中，利用生成式人工智能有两个理由。首先是它节省了时间和成本。其次是能从文本转图像工具中，获得独特的外观和感受。

内容