ChatGPT 图像生成功能迎来升级
在周二的一次直播中,OpenAI首席执行官山姆・奥特曼宣布了ChatGPT图像生成能力一年多来的首次重大升级。

ChatGPT现在可以利用该公司的GPT-4o模型原生地创建和修改图像及照片。GPT-4o长期以来一直是这个人工智能聊天机器人平台的基础,但在此之前,该模型只能生成和编辑文本,不能生成图像。
奥特曼表示,对于OpenAI每月200美元的专业版计划订阅者来说,GPT-4o原生图像生成功能现已在ChatGPT和OpenAI的人工智能视频生成产品Sora中上线。OpenAI称,该功能很快将向ChatGPT的Plus用户和免费用户以及使用该公司应用程序编程接口(API)服务的开发者推出。
与它实际上取代的图像生成模型DALL-E3相比,具有图像输出功能的GPT-4o“思考”的时间要长一些,以生成OpenAI所说的更准确、更详细的图像。GPT-4o可以编辑现有的图像,包括有人物的图像——对其进行变换或“修复”前景和背景物体等细节。
为了支持新的图像功能,OpenAI称,它使用“公开可用的数据”以及与Shutterstock等公司合作获得的专有数据来训练GPT-4o。
许多生成式人工智能供应商将训练数据视为一种竞争优势,因此他们对其及相关信息守口如瓶。但训练数据的细节也是潜在的知识产权相关诉讼的来源,这是公司不愿透露太多的另一个原因。
OpenAI首席运营官布拉德・莱特卡普在一份声明中表示:“在输出方面,我们尊重艺术家的权利,并且我们有相应的政策来防止我们生成直接模仿任何在世艺术家作品的图像。”
OpenAI提供了一个退出表单,创作者可以通过该表单请求将他们的作品从其训练数据集中删除。该公司还表示,它会尊重禁止其网络爬虫从网站收集包括图像在内的训练数据的请求。
ChatGPT升级后的图像生成功能是在谷歌为其旗舰模型之一Gemini2.0Flash推出实验性原生图像输出功能之后推出的。这个强大的功能在社交媒体上迅速传播,但不一定是因为好的原因。事实证明,Gemini2.0Flash的图像组件几乎没有防护措施,这使得人们可以去除水印并创建描绘受版权保护角色的图像。
本文源自:金融界