AutoFigure-Edit 科研插图工具配置说明
!!仅供学习交流与内部分享使用,不允许收取任何费用!!!!重要声明!!
本说明文档用于应大内部学习、交流和部署辅助。AutoFigure-Edit 为 GitHub 开源项目;本地部署版本不得包装为收费服务,不得向校内外用户收取任何费用。若后续公开发布、商用或二次分发,请先核对原项目许可证、官方网站条款和相关 API 服务条款。
一、项目来源与链接
本地部署使用的是 GitHub 开源项目 AutoFigure-Edit。请在分享和培训时保留原项目来源,不要删除作者和项目链接。
- 本地访问地址通常为:
http://127.0.0.1:8000/。 - 本地生成结果默认保存在:
E:\AutoFigure-Edit\outputs。 - 本文档只说明内部部署和填写方式,不代表原作者官方说明。
二、先理解三个 Key 和两条路线
AutoFigure-Edit 不是只调用一个模型。它把科研图流程拆成多个阶段,因此界面里会出现多个 Provider、模型和 Key。
| 界面字段 | 作用 | 怎么填 |
|---|---|---|
| SVG / 推理 Provider | 第 4 步读取 figure.png、samed.png、boxlib.json 后重建 SVG。 | 必须用支持文本 + 视觉/多模态的模型;不要填纯生图模型。 |
| 步骤 1 图片 Provider | 第 1 步根据方法文本生成初始位图 figure.png。 | 需要用生图模型,例如 gpt-image-2-vip、nano-banana-2/pro 或官方图像模型。 |
| 主 API Key | 给 SVG / 推理 Provider 使用。 | 官方就填官方 Key;中转就填中转平台 Key。 |
| 图片路线 API Key | 只有图片路线和主路线不是同一个平台时才需要。 | 同一个中转平台通常可以留空或填同一把 Key。 |
| SAM3 API Key | 给 Roboflow 或 fal.ai 分割接口使用。 | 这是单独的 Key,不是 OpenAI / 中转 / DeepSeek Key。 |
注意:自定义 API URL 要填兼容 OpenAI 的 /v1 根路径,不要填 /chat/completions、/images 或其他具体 endpoint。
三、推荐填写方式:中转 API
中转 API 的核心原则
选择“中转 API”预设后,Provider 应为 Custom,而不是 OpenAI Responses。OpenAI Responses 是官方 OpenAI 路线,中转 Key 放进去通常会 401。
- 打开本地页面:
http://127.0.0.1:8000/。 - 在右侧“配置预设”里选择“中转 API”。
- SVG / 推理 Provider 自动变为“自定义 Custom”。
- SVG API URL 填:
https://right.codes/gemini。 - SVG 模型填:
google/gemini-3-pro-preview。这是本次已成功输出的第 4 步 SVG 重建路线。 - 步骤 1 图片 Provider 选择“自定义 Custom”。
- 图片路线 API URL 填:
https://www.right.codes/draw/v1。 - 图片模型填:
gpt-image-2-vip。也可以按中转实际开通情况改成nano-banana-2或nano-banana-pro。 - 主 API Key 填中转平台 Key。图片路线 API Key 如果同平台复用,可以留空;如果图片路线单独走另一平台,再填第二套 Key。
- SAM3 后端建议先用
Skip SAM保证主流程跑通;需要图标级替换时再启用 Roboflow Workflow,并填写单独的 Roboflow Key。
| 字段 | 中转推荐值 |
|---|---|
| 配置预设 | 中转 API |
| SVG / 推理 Provider | 自定义 Custom |
| SVG API URL | https://right.codes/gemini |
| SVG 模型 | google/gemini-3-pro-preview |
| 主 API Key | 中转 Key |
| 步骤 1 图片 Provider | 自定义 Custom |
| 图片模型 | gpt-image-2-vip |
| 图片路线 API URL | https://www.right.codes/draw/v1 |
| 优化轮数 | 0,先跑通再调整 |
| SAM3 后端 | Skip SAM;需要图标替换时再选 Roboflow API |
四、导入已有图片继续操作
导入模式会跳过步骤 1 生图,所以不需要填写图片模型和图片 URL。但后续第 4 步仍然要看图重建 SVG,因此必须配置 SVG 中转路线。
- 进入“我已有第一阶段图片”页面后,先上传已有图片。
- 配置预设选择“中转 API”。
- SVG / 推理 Provider 保持
Custom。 - SVG API URL 填:
https://right.codes/gemini。 - SVG 模型填:
google/gemini-3-pro-preview。 - 主 API Key 填中转 Key。
- SAM3 后端先用
Skip SAM跑通;需要图标替换时再启用 Roboflow Workflow。
不要把 https://www.right.codes/draw/v1 填到导入页的 SVG API URL。/draw/v1 是生图路线,导入模式已经跳过生图。
五、官方 OpenAI 怎么填写
只有使用官方 OpenAI Key 时,才选择 OpenAI 官方路线。中转 Key 不要放在这里。
- 配置预设选择“OpenAI 官方”。
- SVG / 推理 Provider 选择 OpenAI Responses。
- 主 API Key 填官方 OpenAI Key。
- 自定义 API URL 不需要填写;官方路线会走 OpenAI 官方接口。
- 步骤 1 图片 Provider 保持“与 SVG 路径一致”即可,系统会落到 OpenAI Images。
- 图片模型可填
gpt-image-2;如果你的账号或接口支持其他图像模型,也可以按官方模型 id 填写。 - SVG 模型填写账号可用的支持视觉输入和推理的模型。若默认模型不可用,就换成账号后台实际开通的模型。
- SAM3 仍然需要 Roboflow / fal / local 其中一种,OpenAI Key 不能代替 SAM3 Key。
六、通用中转怎么填写
适合 one-api、new-api、LiteLLM、自建网关或其他“兼容 OpenAI /v1 接口”的平台。
- 配置预设:中转 API,或直接选择 Custom。
- Provider:自定义 Custom。
- 自定义 API URL:填你的平台给出的
/v1根地址,例如https://api.example.com/v1。不要填/chat/completions。 - SVG 模型:填能看图的多模态模型,不要填纯文本模型或纯生图模型。
- 图片 Provider:如果同一平台支持生图,就选择 Custom 并填生图模型;如果同一平台不支持生图,就把图片 Provider 切到另一个可生图平台。
- 如果平台前面套了 Cloudflare,建议使用支持流式的
v1/chat/completions路线,避免长时间请求超时。本地改造版已尽量按流式兼容处理。
七、DeepSeek 能不能直接用
DeepSeek 使用边界
DeepSeek-chat / DeepSeek-reasoner 通常是文本模型。AutoFigure-Edit 第 4 步需要把图片和分割结果一起交给模型看,然后生成 SVG,因此 DeepSeek 单独作为 SVG 模型大概率跑不通。
- 可以用 DeepSeek 辅助整理方法文本、改写提示词、提炼流程结构。
- 不建议把
deepseek-chat填到 SVG 模型里跑完整流程,除非你的中转平台把它封装成了兼容视觉输入的多模态模型。 - 如果只想用 DeepSeek 的中转 Key,但平台同时提供
gpt-4o、Gemini 多模态或其他视觉模型,应在 SVG 模型栏填写那些视觉模型,而不是deepseek-chat。 - DeepSeek 也不是生图模型,不能作为步骤 1 图片模型。
八、模型兼容性速查表
| 用途 | 需要能力 | 可以考虑的模型 | 不能填什么 |
|---|---|---|---|
| SVG / 推理模型 | 文本 + 视觉/多模态;能读取 figure.png 和 samed.png | gpt-4o、gpt-4.1、Gemini 多模态模型、网关提供的视觉模型 | gpt-image-2、nano-banana、deepseek-chat 这类纯生图/纯文本模型 |
| 步骤 1 图片模型 | 文生图或图像生成 | gpt-image-2-vip、gpt-image-2、nano-banana-2、nano-banana-pro、Gemini 图像模型 | deepseek-chat、普通文本聊天模型 |
| SAM3 后端 | 图像分割 | Roboflow API、fal.ai API、本地 SAM3 | OpenAI Key、中转 Key、DeepSeek Key 不能替代 SAM Key |
| RMBG 背景移除 | 下载/访问 briaai/RMBG-2.0 | 管理员已在 .env 配置 HF_TOKEN 后,用户无需在界面填写 | 界面里的 API Key 不会替代 HF_TOKEN |
九、常见错误与处理
画布页 AI SVG Studio 新功能
生成完成或从历史图片打开结果后,点击右下角 AI 按钮可进入精修工作台。它可以框选局部区域后对话改 SVG,也可以直接对整张 SVG 做修改。
- Box select:点击后在画布上拖拽框选要精修的区域;不框选则默认修改整张 SVG。
- 快捷提示:Polish、Text、Lines、Style match 分别用于整体打磨、文字可读性、线条连接和风格统一。
- Apply edit:把当前 SVG、框选坐标和修改要求发给模型,返回完整 SVG 后自动载入画布,并保存为
assistant_refined_*.svg。 - SVG QA:检查 XML 语法、viewBox、外部引用、重复 id、脚本/事件属性、嵌入位图等问题,并保存
svg_quality_report.json。 - Save:把当前画布状态保存为
assistant_saved_*.svg,适合多轮修改前做检查点。 - Export:支持导出 SVG、PNG、PDF、ZIP + QA,并可选择草稿、标准、印刷、超清质量。PNG/PDF 优先使用后端 CairoSVG 渲染;Windows 下需要可信来源安装的 Cairo 运行库,推荐 MSYS2/Scoop,不要单独下载来路不明的
libcairo-2.dll。 - Copy SVG:把当前 SVG 源码复制到剪贴板,方便临时交给其他工具检查。
如果不想在页面里反复输入 Key,可以在 .env 中配置 AUTOFIGURE_ASSISTANT_PROVIDER、AUTOFIGURE_ASSISTANT_MODEL、AUTOFIGURE_ASSISTANT_BASE_URL、AUTOFIGURE_ASSISTANT_API_KEY。没有专用 Key 时,后端会继续尝试读取 OPENAI_API_KEY。
十、常见错误与处理
| 现象 | 处理方法 |
|---|---|
| 401 invalid OpenAI key | 把中转 Key 放到了 OpenAI Responses 官方路线。切换为“中转 API”,Provider 走 Custom。 |
| 卡在发送请求到 /draw/v1 | 中转平台请求时间长、Cloudflare 超时或模型排队。优先使用流式 chat/completions;也检查模型是否开通和余额。 |
| gpt-image-2 生成不了 4K | 部分中转的 gpt-image-2 通常只支持 1K。4K 改用 gpt-image-2-vip、nano-banana-2 或 nano-banana-pro。 |
| SAM3 API Key 报错 | SAM3 Key 是 Roboflow/fal 的 Key,不是 LLM 中转 Key。Roboflow 在 Models -> SAM3 -> Use Model 界面复制 API Key。 |
| RMBG-2.0 没有访问凭据 | 管理员需要申请 Hugging Face briaai/RMBG-2.0 访问权限,并在 .env 中配置 HF_TOKEN。普通使用者不用在界面填。 |
| 第一次运行下载很久 | 首次下载 Hugging Face 模型或缓存时会慢,不一定是卡死。看日志是否还在下载。 |
| 最后画布空白或只有 untitled.svg | 流程前面失败了,先点“日志”看失败步骤;若只有第一阶段图成功,可以进历史图片查看 figure.png。 |
十一、内部分享要求
- 分享时必须同时保留本文档首页红色声明和项目来源链接。
- 不得以安装费、服务费、会员费、培训费等名义对 AutoFigure-Edit 本地部署版本收费。
- 不得承诺生成结果一定可直接用于论文,科研图仍需人工审核、修改和确认。
- 不得把个人 API Key、Roboflow Key、Hugging Face Token 写进群公告或公共文档。
- 如需公开部署、商业服务或二次开发发布,请先核对原项目许可证、官网条款、API 服务商条款和单位管理要求。
版本:内部说明 v1.0|日期:2026-05-09