上个月,OpenAI 在其流行的 ChatGPT 中引入了图像生成功能,结果引发了用户的热烈反响。在发布后的短短一周内,全球用户已创建超过7亿张图像,访问量更是超过了1.3亿人次。这一良好表现体现了市场对于集成人工智能图像生成工具的强烈需求,让许多开发者和企业意识到,AI绘图所带来的巨大潜力和便利性。
为了满足这一需求,OpenAI最近宣布推出新的API:gpt-image-1。这次的API是专为开发者和企业设计的,使他们能够将高质量、专业级的图像生成功能无缝集成到自己的应用程序和中,从而提升用户体验并扩展服务范围。gpt-image-1 API 的发布标志着一个新的时代,全世界的开发者从今天开始能够利用 ChatGPT 高效且强大的图像生成功能。
gpt-image-1 API 提供了一系列令人印象深刻的功能,使其在图像生成领域脱颖而出。通过这项技术,用户能够生成更为精准和高保真的图像,同时也支持多样的视觉风格和精确的图像编辑。借助丰富的世界知识和一致的文本呈现,gpt-image-1 可以为用户提供一流的图像质量和多样化的表现形式。
OpenAI的首席执行官萨姆·奥特曼指出,gpt-image-1 API 相对于ChatGPT版本在多个方面存在一些差异。例如,开发者可以应用moderation参数,以控制审核敏感度并确保图像生成符合相关法律法规。开发者还能够根据具体需求调整图像生成的质量与速度、背景选择和输出格式等。这种灵活性是开发者在创建应用时所需的便利功能。
在定价方面,gpt-image-1 采用基于 token 的定价结构。文本输入 token 与图像输入 token 在价格上是有所区别的,具体如下:文本输入 token(即提示文本)定价为每100万 token 5美元;图像输入 token(即用户上传的输入图像)则是每100万 token 10美元;而生成的图像输出 token 价格为每100万 token 40美元。这样的价格设置使得开发者能够根据实际情况进行灵活选择,而用户在生成低质量、中等质量和高质量的方形图像时,将分别需要支出约0.02美元、0.07美元和0.19美元的费用,再加上文本输入的价格。
在使用 gpt-image-1 API 的实际过程中,开发者和用户能够体验到的好处显而易见。在一次请求中,用户可以生成多张图像,只需设置相应的 n 参数,即可收获庞大的视觉资料库。而在默认情况下,API 返回的则是单张图片。用户还能够将一张或多张作为参考图像来生成新图,这为创意工作提供了更多的可能性。例如,您可以使用多达四张输入图片去生成一幅新的作品,打破了传统图像生成工具的局限性。
除了生成图像,现在的 gpt-image-1 还具备出色的图像编辑功能,用户可以利用蒙版进行精准的图像处理。这为创意人士和设计师提供了极大的便利,能够轻松实现高质量图像的定制和修整。更令人惊喜的是,OpenAI 有多家企业和初创公司已经开始使用该模型用于创意项目和产品开发。例如,全球知名的多媒体巨头 Adobe 将其 Firefly 和 Express 应用与 OpenAI 的图像生成功能紧密集成,实现了更出色的设计和图像创作能力。
AI视频生成 HeyGen 也在积极集成 gpt-image-1,为虚拟形象的创建增添新的维度,特别在内部的虚拟形象编辑功能得到了进一步的增强。这些应用程序不仅展示了 gpt-image-1的多样性,更加表明了该技术在创意行业的广泛潜力。
开发者们可以参考 OpenAI 官方提供的 API 指南,以获取更详细的使用说明和最佳实践。这将帮助他们更快上手并充分发挥 gpt-image-1 的强大功能。链接地址为:https://platform.openai/docs/guides/image-generation?image-generation-model=gpt-image-1。
OpenAI 的 gpt-image-1 API 的推出,不仅为开发者提供了一种全新的工具,有望推动整个行业的创新和发展,也使得高质量的图像生成变得更加平易近人。随着越来越多的企业和开发者拥抱这种技术,我们期待在未来看到更多独特而令人惊艳的创作!