Fooocus:一款基于SDXL架构的图像生成软件
Fooocus 是一款基于 Gradio 构建的图像生成软件。它重新定义了图像生成器的设计理念,是一款离线、开源且完全免费的工具。与许多在线图像生成器(如 Midjourney)类似,Fooocus 无需用户进行繁琐的手动参数调整,用户只需专注于提示词和图像本身。Fooocus 极大地简化了安装流程:从点击“下载”到生成第一张图像,所需的鼠标点击次数严格控制在3次以内。其最低 GPU 显存要求为 4GB(Nvidia)。
项目状态:有限长期支持(LTS),仅进行错误修复
Fooocus 项目完全基于 Stable Diffusion XL(SDXL) 架构构建,目前已进入有限长期支持(LTS)阶段,仅进行错误修复。由于现有功能在程序上已基本无问题,未来的更新将仅专注于解决可能出现的任何错误。
目前没有计划迁移到或集成更新的模型架构。 然而,随着开源社区的发展,这种情况可能会发生变化。例如,如果社区在未来半年或一年内就图像生成的主流方法达成共识,Fooocus 也可能随之迁移。
对于希望使用 Flux 等更新模型的用户,建议探索其他平台,如 WebUI Forge、ComfyUI/SwarmUI 以及一些优秀的 Fooocus 分支。
核心功能特性
Fooocus 提供了对标 Midjourney 和 LeonardoAI 的丰富功能,以下是一些核心特性:
对标 Midjourney 的功能:
- 高质量文本到图像生成: 无需复杂的提示词工程或参数调整。Fooocus 内置离线的 GPT-2 提示词处理引擎和大量采样优化,无论提示词是“花园里的房子”这样的短句,还是长达1000个单词的长句,都能生成优美的结果。
- 图像变体与放大: 支持对输入图像进行“细微变化”或“强烈变化”,以及 1.5倍 或 2倍 的放大。
- 图像修复与扩展: 支持对输入图像进行修复(Inpaint)以及向上、下、左、右四个方向的扩展(Outpaint)。Fooocus 使用自己的修复算法和模型,结果优于使用标准 SDXL 修复方法/模型的其他软件。
- 图像提示: 支持以图像作为提示。Fooocus 使用自己的图像提示算法,在结果质量和提示理解方面优于使用标准 IP-Adapter 或 Revision 的其他软件。
- 风格与引导: 提供“风格”和“引导”等高级参数。
- 模型预设: 提供“默认”、“动漫”和“写实”等多种启动器,支持 Civitai 上的 SDXL 模型。
- 质量与重复生成: 支持“质量”和“图像数量”等参数。
- 多提示与权重: 支持使用多行提示词,并支持 A1111 格式的提示词加权(例如“I am (happy:1.5)”),也支持使用 Embedding。
- 负面提示词与宽高比: 支持设置负面提示词和自定义宽高比。
- 人脸替换与图像描述: 支持 InsightFace 人脸替换和“描述”功能,可自动生成图像描述。
对标 LeonardoAI 的功能:
- 提示词魔法: 提供“Fooocus V2”风格。
- 高级采样器参数: 支持调整采样锐度等参数。
- 用户友好的 ControlNet: 提供直观的图像提示功能。
安装与使用
Windows 用户:
可直接下载预打包的压缩包,解压后运行 run.bat 文件。首次启动时,软件会自动下载所需的默认模型。如果已拥有这些模型文件,可将其复制到指定文件夹以加快安装速度。需要注意的是,如果遇到“MetadataIncompleteBuffer”或“PytorchStreamReader”错误,说明模型文件已损坏,需要重新下载。
Linux 用户:
支持通过 Anaconda、Python Venv 或原生系统 Python 安装。主要步骤包括克隆仓库、创建并激活虚拟环境、安装依赖,然后运行 python entry_with_update.py 启动软件。若需远程访问,可添加 –listen 参数。
Colab 用户:
提供官方 Colab 笔记本,可一键运行。在 Colab 中,可以通过修改启动命令来切换预设(如 –preset anime 或 –preset realistic)。
Mac 用户:
支持 Apple Silicon(M1/M2)芯片。需要安装 conda 和 PyTorch nightly 版本,并确保 PyTorch 能识别 MPS 设备。由于没有独立显卡,图像处理时间会显著长于有独立显卡的电脑。
Docker 用户:
提供 Dockerfile 和 docker-compose.yml 文件,方便容器化部署。
硬件要求
Fooocus 对本地运行有最低硬件要求:
- NVIDIA GPU: 最低 4GB 显存(GTX 9XX 及以上),建议 8GB 显存。
- AMD GPU: 最低 8GB 显存(Windows 下通过 DirectML 运行,速度约为 Nvidia RTX 3XXX 的 1/3;Linux 下通过 ROCm 运行,速度约为 Nvidia RTX 3XXX 的 2/3)。
- Mac: M1/M2 MPS,速度约为 Nvidia RTX 3XXX 的 1/9。
- 仅使用 CPU: 最低 32GB 系统内存,速度约为 Nvidia RTX 3XXX 的 1/17。
所有平台均建议开启系统交换空间(Swap)。
高级特性与自定义
内联提示功能:
- 通配符: 支持在提示词中使用
__color__等通配符,程序会从对应的wildcards/color.txt文件中随机选择一个词替换。支持嵌套和组合使用。 - 数组处理: 支持使用
[[red, green, blue]]语法,为数组中的每个元素生成一张独立的图像。 - 内联 LoRA: 支持在提示词中使用
<lora:sunflowers:1.2>语法,直接应用位于models/loras目录下的 LoRA 模型。
自定义配置:
首次运行后,会在 Fooocusconfig.txt 生成配置文件,用户可编辑此文件来修改模型路径、默认参数(如模型、采样器、负面提示词、默认风格等)。如果配置出错,删除此文件即可恢复默认设置。
用户界面与安全
除了在本地运行,Fooocus 还可以通过 –listen 参数暴露本地 UI 监听器,或通过 –share 参数创建临时的公网 API 地址。默认情况下,这两种方式均无身份验证。用户可以通过创建 auth.json 文件来添加基本身份验证。
本地化与翻译
Fooocus 支持通过 JSON 文件进行用户界面本地化。用户可将翻译文件放入 language 文件夹,并通过 –language 参数加载。例如,创建 Fooocus/language/cn.json 文件,然后使用 –language cn 参数即可将界面翻译为中文。
相关导航

Jasper

toptools ai

虎课网


