Flux 现已上线 RenderNet 仅需一张参考图像即可生成一致的人物形象
训练图像模型以生成自定义的 AI 照片曾是一项漫长而繁琐的过程。您需要多张高质量的图像,并且经常需要等待数小时才能获得微调完成的模型。
但现在,情况已经发生了变化。
如今,微调图像模型变得更加高效。借助 Black Forest Labs 最强大的开放权重模型,您现在只需一张图像即可进行训练。训练速度也有了显著提升——曾经需要数小时的训练,现在只需几分钟即可完成。
在 RenderNet 这一最受欢迎的图像和视频生成平台之一,使用单张图像训练 Flux 模型现已成为可能。
在本文中,我将详细介绍如何使用单张参考图像微调 Flux 模型并生成自定义图像。
让我们开始吧。
什么是 RenderNet?
RenderNet 是一个以 AI 影响者或虚拟角色生成而闻名的生成式 AI 平台。通过其“角色向导”,您可以快速设计符合需求的自定义 AI 角色。创建后,您可以使用提示词和 PoseControl 功能精确微调角色的姿势和构图。最近,RenderNet 增加了对 Flux 模型的支持,这是包括我在内的众多粉丝期待已久的功能。
什么是 Flux?
Flux 是 Black Forest Labs 推出的一套强大的模型,将文本到图像生成提升到了一个新的水平。它在图像细节、准确性、风格多样性和场景复杂性方面设立了新的标准。
Flux 共有三个版本:
- Flux.1 Pro:性能最佳的模型,提供高质量的图像,细节出众,提示词准确,风格多样。
- Flux.1 Dev:这一版本为开放权重,适用于非商业用途。基于 Flux.1 Pro,质量相似但效率更高,非常适合研发使用。
- Flux.1 Schnell:最快的模型,专为个人使用和本地开发设计。根据 Apache 2.0 许可证免费提供,运行迅速且不牺牲质量。
所有 Flux 模型都采用先进的 AI 技术,拥有 120 亿参数。它们通过使用称为流匹配(flow matching)的方法,使训练更加简便,从而改进了旧有模型。此外,这些模型还包括旋转位置嵌入和并行注意力层,以更好地利用硬件,使模型运行更快、更高效。
如何创建角色
在 RenderNet 上开始使用 Flux 简单且用户友好。首先,访问网站并创建一个免费账户。
Flux 功能便捷地位于首页。点击“尝试 Flux”按钮,即会弹出一个模态窗口。
此时,您有两个选项:选择预设角色或上传您自己的照片。如果您希望创建具有个人特色的独特角色,建议选择上传自己的图像。
返回首页,点击“创建新角色”按钮。
上传您的肖像照片,确保面部和发型清晰。系统需要这些清晰度以在生成图像时获得更好的效果。根据需要裁剪照片以聚焦于面部。裁剪的准确性会影响最终输出,因此请注意面部和发型的定义程度。
点击“下一步”按钮,进入自定义窗口,您可以在这里调整角色的风格、性别、年龄以及发色/发型。这些参数允许您根据创意需求调整最终结果。
最后,为您的角色命名。这一步很重要,因为名称将作为 Flux 模型生成图像时的“触发词”。
完成后,您的新角色将被添加到首页的角色列表中,随时可用于图像生成。
太棒了。现在,让我们尝试使用它生成自定义图像。
使用 Flux 创建自定义图像
图像生成仪表板极其简洁,即使是初学者也能轻松上手。在仪表板底部,您会注意到一个提示词输入框,您可以在此输入您想要生成图像的描述。这就是魔法发生的地方!
假设您希望您的角色在特定场景中摆姿势。以下是一个示例:
提示词:@Jade 在纽约街头摆姿势
设置好提示词后,点击“生成”按钮,系统将在几秒钟内处理并生成图像。
相当酷吧?
生成的结果令人印象深刻——Jade 的面部、发型和身体与输入图像保持了惊人的一致性。然而,我注意到尽管整体照片真实感不错,但在某些细节上仍有提升空间。皮肤纹理、光照和背景融合有时会显得有些不协调,尤其是与高端模型如 Midjourney 相比时。
如您所见,提示词中包含了“@Jade”。这是至关重要的,因为它作为 Flux 模型的触发词。
什么是触发词?
简单来说,触发词是在模型训练阶段与特定对象、风格或概念关联的关键词。在这种情况下,“Jade” 指的是该模型微调时使用的特定角色或外观。当您在提示词中包含这个触发词时,模型就会知道使用那个角色来生成图像。
这也是生成的图像在不同场景中保持角色外观一致性的原因之一。如果去掉触发词,您将获得完全不同的图像。
让我们尝试更多示例。
提示词:@Jade 穿着羽绒服站在珠穆朗玛峰顶
我对Flux的印象
我对文本提示与生成图像之间的连贯性感到印象深刻。Flux不仅成功捕捉了珠穆朗玛峰严酷的雪地环境,还确保了角色与原始照片完全一致,甚至包括面部特征。
提示词:@Jade穿着礼服在红毯上摆姿势
我喜欢这个工具的一点是,在保持核心元素一致的同时,生成图像的变化多样。AI生成器常常难以处理肢体部分,但Flux在这方面表现出色,四肢看起来准确无误,并且输入图像中的面部一致性得以保持。
虽然许多AI图像生成器在处理手部和手指时存在困难,Flux在这方面却做得相当不错。我可以看到手部定义得当,没有出现AI生成艺术中常见的尴尬现象。
好了,现在让我们来谈谈定价。
价格如何?
Flux在RenderNet上的一个最佳特点是其定价灵活。免费用户每天可获得10个免费积分。
- 免费版:$0/月 包含50个积分,可生成最多10张Flux图像和50张SDXL图像。功能有限,支持2个同时生成。
- 基础版:$9/月 提供400个积分,最多生成80张Flux图像和400张SDXL图像。包括1.5分钟的解说视频、8K升级、True Touch以及2个同时生成。
- 标准版:$24/月 赠送2,000个积分,最多生成400张Flux图像和2,000张SDXL图像。包括8分钟的解说视频、10个同时生成以及所有高级功能。
- 高级版:$49/月 提供5,000个积分,最多生成1,000张Flux图像和5,000张SDXL图像。包括20分钟的解说视频和50个同时生成。全面访问所有功能。
如果您计划长期使用Flux,选择年度计划可以为您节省一些费用。按年支付,您将在任何计划上获得20%的折扣,这对平台的常规用户来说是一个不错的优惠。
为什么值得关注?
自两个月前发布以来,Flux图像模型已证明其能力出众。图像质量令人印象深刻,与文本提示的连贯性非常好,其准确渲染文本的能力更是令人惊叹。
在我看来,Flux Pro已经与最强大的闭源图像生成器Midjourney不相上下,甚至更胜一筹。而且,由于Flux是开放权重的,微调它成为可能,现在已有数百个平台向其用户提供这一功能。另一个有趣的事实是,Flux背后的团队——Black Forest Labs,由最初开发支持Stable Diffusion技术的开发者和潜在扩散的发明者组成。Stability AI过去曾经历一些内部问题,导致其核心团队成员离开并成立了新的初创公司。
这种技术团队的外流往往会促进创新。当有才华的个人独立发展时,他们可以自由追求大胆的新想法,而不受大型组织的限制。
Flux模型仅有几个月的历史,这只是第一代。我们可以期待未来几个月会有更多令人兴奋的更新。团队还透露即将推出视频模型,这更加令人期待!RenderNet本身也是一个视频平台,因此Flux模型的集成将会是一个史诗般的事件。
最后的思考
总的来说,我很高兴看到RenderNet迅速在其平台上增加对Flux的支持。我已经使用RenderNet生成会说话的AI影响者有一段时间了,对结果非常满意。Flux的加入使RenderNet成为您AI图像和视频工作流程中更加诱人的平台。
其应用场景不仅限于人像生成。Flux图像模型可以针对其他主题进行微调,不仅限于人类肖像。您可以用宠物或产品的照片进行训练,这意味着您可以提升品牌资产。想象一下,仅用一张产品照片训练一个模型,就能生成无限种您能想到的设计变化。这有多酷!
未来有如此多的可能性。我相信RenderNet的开发团队已经在开发令人兴奋的新功能,我迫不及待地想看到它们的发布!
如果您喜欢这篇文章,请点赞并留言。感谢阅读,我们下次见!