AutoFigure-Edit 操作文档
完整配置说明、接口填写方法和常见问题处理。
应大内部使用

AutoFigure-Edit 科研插图工具配置说明

!!仅供学习交流与内部分享使用,不允许收取任何费用!!

!!重要声明!!

本说明文档用于应大内部学习、交流和部署辅助。AutoFigure-Edit 为 GitHub 开源项目;本地部署版本不得包装为收费服务,不得向校内外用户收取任何费用。若后续公开发布、商用或二次分发,请先核对原项目许可证、官方网站条款和相关 API 服务条款。

一、项目来源与链接

本地部署使用的是 GitHub 开源项目 AutoFigure-Edit。请在分享和培训时保留原项目来源,不要删除作者和项目链接。

  • 本地访问地址通常为:http://127.0.0.1:8000/
  • 本地生成结果默认保存在:E:\AutoFigure-Edit\outputs
  • 本文档只说明内部部署和填写方式,不代表原作者官方说明。

二、先理解三个 Key 和两条路线

AutoFigure-Edit 不是只调用一个模型。它把科研图流程拆成多个阶段,因此界面里会出现多个 Provider、模型和 Key。

界面字段作用怎么填
SVG / 推理 Provider第 4 步读取 figure.pngsamed.pngboxlib.json 后重建 SVG。必须用支持文本 + 视觉/多模态的模型;不要填纯生图模型。
步骤 1 图片 Provider第 1 步根据方法文本生成初始位图 figure.png需要用生图模型,例如 gpt-image-2-vipnano-banana-2/pro 或官方图像模型。
主 API Key给 SVG / 推理 Provider 使用。官方就填官方 Key;中转就填中转平台 Key。
图片路线 API Key只有图片路线和主路线不是同一个平台时才需要。同一个中转平台通常可以留空或填同一把 Key。
SAM3 API Key给 Roboflow 或 fal.ai 分割接口使用。这是单独的 Key,不是 OpenAI / 中转 / DeepSeek Key。

注意:自定义 API URL 要填兼容 OpenAI 的 /v1 根路径,不要填 /chat/completions/images 或其他具体 endpoint。

三、推荐填写方式:中转 API

中转 API 的核心原则

选择“中转 API”预设后,Provider 应为 Custom,而不是 OpenAI Responses。OpenAI Responses 是官方 OpenAI 路线,中转 Key 放进去通常会 401。

  1. 打开本地页面:http://127.0.0.1:8000/
  2. 在右侧“配置预设”里选择“中转 API”。
  3. SVG / 推理 Provider 自动变为“自定义 Custom”。
  4. SVG API URL 填:https://right.codes/gemini
  5. SVG 模型填:google/gemini-3-pro-preview。这是本次已成功输出的第 4 步 SVG 重建路线。
  6. 步骤 1 图片 Provider 选择“自定义 Custom”。
  7. 图片路线 API URL 填:https://www.right.codes/draw/v1
  8. 图片模型填:gpt-image-2-vip。也可以按中转实际开通情况改成 nano-banana-2nano-banana-pro
  9. 主 API Key 填中转平台 Key。图片路线 API Key 如果同平台复用,可以留空;如果图片路线单独走另一平台,再填第二套 Key。
  10. SAM3 后端建议先用 Skip SAM 保证主流程跑通;需要图标级替换时再启用 Roboflow Workflow,并填写单独的 Roboflow Key。
字段中转推荐值
配置预设中转 API
SVG / 推理 Provider自定义 Custom
SVG API URLhttps://right.codes/gemini
SVG 模型google/gemini-3-pro-preview
主 API Key中转 Key
步骤 1 图片 Provider自定义 Custom
图片模型gpt-image-2-vip
图片路线 API URLhttps://www.right.codes/draw/v1
优化轮数0,先跑通再调整
SAM3 后端Skip SAM;需要图标替换时再选 Roboflow API

四、导入已有图片继续操作

导入模式会跳过步骤 1 生图,所以不需要填写图片模型和图片 URL。但后续第 4 步仍然要看图重建 SVG,因此必须配置 SVG 中转路线。

  1. 进入“我已有第一阶段图片”页面后,先上传已有图片。
  2. 配置预设选择“中转 API”。
  3. SVG / 推理 Provider 保持 Custom
  4. SVG API URL 填:https://right.codes/gemini
  5. SVG 模型填:google/gemini-3-pro-preview
  6. 主 API Key 填中转 Key。
  7. SAM3 后端先用 Skip SAM 跑通;需要图标替换时再启用 Roboflow Workflow。

不要把 https://www.right.codes/draw/v1 填到导入页的 SVG API URL。/draw/v1 是生图路线,导入模式已经跳过生图。

五、官方 OpenAI 怎么填写

只有使用官方 OpenAI Key 时,才选择 OpenAI 官方路线。中转 Key 不要放在这里。

  1. 配置预设选择“OpenAI 官方”。
  2. SVG / 推理 Provider 选择 OpenAI Responses。
  3. 主 API Key 填官方 OpenAI Key。
  4. 自定义 API URL 不需要填写;官方路线会走 OpenAI 官方接口。
  5. 步骤 1 图片 Provider 保持“与 SVG 路径一致”即可,系统会落到 OpenAI Images。
  6. 图片模型可填 gpt-image-2;如果你的账号或接口支持其他图像模型,也可以按官方模型 id 填写。
  7. SVG 模型填写账号可用的支持视觉输入和推理的模型。若默认模型不可用,就换成账号后台实际开通的模型。
  8. SAM3 仍然需要 Roboflow / fal / local 其中一种,OpenAI Key 不能代替 SAM3 Key。

六、通用中转怎么填写

适合 one-api、new-api、LiteLLM、自建网关或其他“兼容 OpenAI /v1 接口”的平台。

  • 配置预设:中转 API,或直接选择 Custom。
  • Provider:自定义 Custom。
  • 自定义 API URL:填你的平台给出的 /v1 根地址,例如 https://api.example.com/v1。不要填 /chat/completions
  • SVG 模型:填能看图的多模态模型,不要填纯文本模型或纯生图模型。
  • 图片 Provider:如果同一平台支持生图,就选择 Custom 并填生图模型;如果同一平台不支持生图,就把图片 Provider 切到另一个可生图平台。
  • 如果平台前面套了 Cloudflare,建议使用支持流式的 v1/chat/completions 路线,避免长时间请求超时。本地改造版已尽量按流式兼容处理。

七、DeepSeek 能不能直接用

DeepSeek 使用边界

DeepSeek-chat / DeepSeek-reasoner 通常是文本模型。AutoFigure-Edit 第 4 步需要把图片和分割结果一起交给模型看,然后生成 SVG,因此 DeepSeek 单独作为 SVG 模型大概率跑不通。

  • 可以用 DeepSeek 辅助整理方法文本、改写提示词、提炼流程结构。
  • 不建议把 deepseek-chat 填到 SVG 模型里跑完整流程,除非你的中转平台把它封装成了兼容视觉输入的多模态模型。
  • 如果只想用 DeepSeek 的中转 Key,但平台同时提供 gpt-4o、Gemini 多模态或其他视觉模型,应在 SVG 模型栏填写那些视觉模型,而不是 deepseek-chat
  • DeepSeek 也不是生图模型,不能作为步骤 1 图片模型。

八、模型兼容性速查表

用途需要能力可以考虑的模型不能填什么
SVG / 推理模型文本 + 视觉/多模态;能读取 figure.png 和 samed.pnggpt-4o、gpt-4.1、Gemini 多模态模型、网关提供的视觉模型gpt-image-2、nano-banana、deepseek-chat 这类纯生图/纯文本模型
步骤 1 图片模型文生图或图像生成gpt-image-2-vip、gpt-image-2、nano-banana-2、nano-banana-pro、Gemini 图像模型deepseek-chat、普通文本聊天模型
SAM3 后端图像分割Roboflow API、fal.ai API、本地 SAM3OpenAI Key、中转 Key、DeepSeek Key 不能替代 SAM Key
RMBG 背景移除下载/访问 briaai/RMBG-2.0管理员已在 .env 配置 HF_TOKEN 后,用户无需在界面填写界面里的 API Key 不会替代 HF_TOKEN

九、常见错误与处理

画布页 AI SVG Studio 新功能

生成完成或从历史图片打开结果后,点击右下角 AI 按钮可进入精修工作台。它可以框选局部区域后对话改 SVG,也可以直接对整张 SVG 做修改。

  1. Box select:点击后在画布上拖拽框选要精修的区域;不框选则默认修改整张 SVG。
  2. 快捷提示:Polish、Text、Lines、Style match 分别用于整体打磨、文字可读性、线条连接和风格统一。
  3. Apply edit:把当前 SVG、框选坐标和修改要求发给模型,返回完整 SVG 后自动载入画布,并保存为 assistant_refined_*.svg
  4. SVG QA:检查 XML 语法、viewBox、外部引用、重复 id、脚本/事件属性、嵌入位图等问题,并保存 svg_quality_report.json
  5. Save:把当前画布状态保存为 assistant_saved_*.svg,适合多轮修改前做检查点。
  6. Export:支持导出 SVG、PNG、PDF、ZIP + QA,并可选择草稿、标准、印刷、超清质量。PNG/PDF 优先使用后端 CairoSVG 渲染;Windows 下需要可信来源安装的 Cairo 运行库,推荐 MSYS2/Scoop,不要单独下载来路不明的 libcairo-2.dll
  7. Copy SVG:把当前 SVG 源码复制到剪贴板,方便临时交给其他工具检查。

如果不想在页面里反复输入 Key,可以在 .env 中配置 AUTOFIGURE_ASSISTANT_PROVIDERAUTOFIGURE_ASSISTANT_MODELAUTOFIGURE_ASSISTANT_BASE_URLAUTOFIGURE_ASSISTANT_API_KEY。没有专用 Key 时,后端会继续尝试读取 OPENAI_API_KEY

十、常见错误与处理

现象处理方法
401 invalid OpenAI key把中转 Key 放到了 OpenAI Responses 官方路线。切换为“中转 API”,Provider 走 Custom。
卡在发送请求到 /draw/v1中转平台请求时间长、Cloudflare 超时或模型排队。优先使用流式 chat/completions;也检查模型是否开通和余额。
gpt-image-2 生成不了 4K部分中转的 gpt-image-2 通常只支持 1K。4K 改用 gpt-image-2-vip、nano-banana-2 或 nano-banana-pro。
SAM3 API Key 报错SAM3 Key 是 Roboflow/fal 的 Key,不是 LLM 中转 Key。Roboflow 在 Models -> SAM3 -> Use Model 界面复制 API Key。
RMBG-2.0 没有访问凭据管理员需要申请 Hugging Face briaai/RMBG-2.0 访问权限,并在 .env 中配置 HF_TOKEN。普通使用者不用在界面填。
第一次运行下载很久首次下载 Hugging Face 模型或缓存时会慢,不一定是卡死。看日志是否还在下载。
最后画布空白或只有 untitled.svg流程前面失败了,先点“日志”看失败步骤;若只有第一阶段图成功,可以进历史图片查看 figure.png。

十一、内部分享要求

  • 分享时必须同时保留本文档首页红色声明和项目来源链接。
  • 不得以安装费、服务费、会员费、培训费等名义对 AutoFigure-Edit 本地部署版本收费。
  • 不得承诺生成结果一定可直接用于论文,科研图仍需人工审核、修改和确认。
  • 不得把个人 API Key、Roboflow Key、Hugging Face Token 写进群公告或公共文档。
  • 如需公开部署、商业服务或二次开发发布,请先核对原项目许可证、官网条款、API 服务商条款和单位管理要求。

版本:内部说明 v1.0|日期:2026-05-09