FIBO - 全球首个开源原生支持JSON的文本生成图像模型

作者： Jam 发布时间： November 1, 2025 分类：技术 No Comments

FIBO 是 Bria AI 开发的全球首个开源的原生支持 JSON 的文本生成图像模型。基于 8B 参数的 DiT（扩散 Transformer）架构，采用流匹配（Flow Matching）训练方式，使用 SmolLM3-3B 作为文本编码器，并在超过 1 亿条结构化 JSON 描述上训练而成。FIBO 的核心优势在于其 VLM 引导的 JSON 原生提示词体系，能将简短的文本提示扩展为详细的结构化描述，生成高质量的图像。支持迭代可控生成，用户可以基于已有 JSON 或图像进行多轮细化与灵感扩展，能单独调整某个属性而不破坏整体场景。FIBO 提供 API 接口、ComfyUI 节点及本地推理支持，便于开发者集成和使用。FIBO 100% 使用授权数据，确保了企业级的合规性。

FIBO的功能特色

原生支持 JSON：FIBO 是首个原生支持 JSON 的文本生成图像模型，能处理复杂的长文本描述，将简短的文本提示扩展为详细的结构化 JSON 描述，生成更精确、更高质量的图像。
迭代可控生成：支持从简短的文本提示开始生成图像，也可以基于已有的 JSON 描述和图像进行多轮细化和灵感扩展，用户可以根据需要逐步调整和完善生成的图像。
特征解耦控制：允许用户单独调整某个属性，如相机角度、光线等，而不破坏整体场景的协调性，为图像生成提供了更高的灵活性和可控性。
企业级合规性：在训练过程中，FIBO 100% 使用授权数据，确保了数据的合法性和合规性，为企业的使用提供了保障，降低了法律风险。
强提示词一致性：在 PRISM 等评测中表现出高对齐度，能够更好地理解用户的文本提示，生成与提示高度一致的图像，提高了生成图像的准确性和可靠性。
生产级集成：提供 API 接口、ComfyUI 节点以及本地推理支持，方便开发者进行集成和二次开发，能够满足不同用户在不同场景下的使用需求。

FIBO的核心优势

VLM 引导的 JSON 原生提示词体系：可接入任意视觉语言模型（VLM），将简短提示自动扩展为包含光线、相机、构图、景深等元素的 1000+ 字结构化描述。
迭代可控生成：支持从简短提示生成图像，或基于已有 JSON 与图像进行多轮细化与灵感扩展。
特征解耦控制：可单独调整某个属性（如相机角度）而不破坏整体场景。
企业级合规性：100% 使用授权数据，确保治理、可重复性与法律透明性。
强提示词一致性：在 PRISM 等评测中展现出高对齐度。
生产级集成：提供 API 接口（Bria Platform、Fal.ai、Replicate），ComfyUI 节点及本地推理支持。

FIBO官网是什么

GitHub仓库：https://github.com/Bria-AI/FIBO
HuggingFace模型库：https://huggingface.co/briaai/FIBO
在线体验Demo：https://huggingface.co/spaces/briaai/FIBO

FIBO的适用人群

创意工作者：FIBO 能帮助创意工作者快速将文字概念转化为视觉图像，激发灵感，提升创作效率。
设计师：可以用 FIBO 生成高质量的图像作为设计参考，辅助设计工作，节省寻找素材的时间。
开发者：开源的 FIBO 提供了丰富的接口和本地推理支持，便于开发者集成到自己的项目中，进行二次开发和创新。
企业用户：对于有图像生成需求的企业，FIBO 的企业级合规性和授权数据使用，能够满足其在合法合规的前提下进行商业应用。
研究人员：FIBO 的开源性质和先进的技术架构，为研究人员提供了研究和探索文本生成图像领域的实验平台。
爱好者：对人工智能和图像生成感兴趣的个人用户，可以通过 FIBO 探索和体验文本生成图像的乐趣。

标签: AI, FIBO, JSON文本生成图像模型

Jam's Blog II

JamLee.Life 心情演绎

FIBO - 全球首个开源原生支持JSON的文本生成图像模型

FIBO的功能特色

FIBO的核心优势

FIBO官网是什么

FIBO的适用人群

添加新评论 »