应大内部使用 - AutoFigure-Edit 操作文档

一、项目来源与链接

本地部署使用的是 GitHub 开源项目 AutoFigure-Edit。请在分享和培训时保留原项目来源，不要删除作者和项目链接。

GitHub 项目 https://github.com/ResearAI/AutoFigure-Edit 官方在线网站 https://deepscientist.cc/ 论文页面 https://arxiv.org/abs/2603.06674 Hugging Face Papers https://huggingface.co/papers/2603.06674

本地访问地址通常为：http://127.0.0.1:8000/。
本地生成结果默认保存在：E:\AutoFigure-Edit\outputs。
本文档只说明内部部署和填写方式，不代表原作者官方说明。

二、先理解三个 Key 和两条路线

AutoFigure-Edit 不是只调用一个模型。它把科研图流程拆成多个阶段，因此界面里会出现多个 Provider、模型和 Key。

界面字段	作用	怎么填
SVG / 推理 Provider	第 4 步读取 `figure.png`、`samed.png`、`boxlib.json` 后重建 SVG。	必须用支持文本 + 视觉/多模态的模型；不要填纯生图模型。
步骤 1 图片 Provider	第 1 步根据方法文本生成初始位图 `figure.png`。	需要用生图模型，例如 `gpt-image-2-vip`、`nano-banana-2/pro` 或官方图像模型。
主 API Key	给 SVG / 推理 Provider 使用。	官方就填官方 Key；中转就填中转平台 Key。
图片路线 API Key	只有图片路线和主路线不是同一个平台时才需要。	同一个中转平台通常可以留空或填同一把 Key。
SAM3 API Key	给 Roboflow 或 fal.ai 分割接口使用。	这是单独的 Key，不是 OpenAI / 中转 / DeepSeek Key。

注意：自定义 API URL 要填兼容 OpenAI 的 /v1 根路径，不要填 /chat/completions、/images 或其他具体 endpoint。

三、推荐填写方式：中转 API

中转 API 的核心原则

选择“中转 API”预设后，Provider 应为 Custom，而不是 OpenAI Responses。OpenAI Responses 是官方 OpenAI 路线，中转 Key 放进去通常会 401。

打开本地页面：http://127.0.0.1:8000/。
在右侧“配置预设”里选择“中转 API”。
SVG / 推理 Provider 自动变为“自定义 Custom”。
SVG API URL 填：https://right.codes/gemini。
SVG 模型填：google/gemini-3-pro-preview。这是本次已成功输出的第 4 步 SVG 重建路线。
步骤 1 图片 Provider 选择“自定义 Custom”。
图片路线 API URL 填：https://www.right.codes/draw/v1。
图片模型填：gpt-image-2-vip。也可以按中转实际开通情况改成 nano-banana-2 或 nano-banana-pro。
主 API Key 填中转平台 Key。图片路线 API Key 如果同平台复用，可以留空；如果图片路线单独走另一平台，再填第二套 Key。
SAM3 后端建议先用 Skip SAM 保证主流程跑通；需要图标级替换时再启用 Roboflow Workflow，并填写单独的 Roboflow Key。

字段	中转推荐值
配置预设	中转 API
SVG / 推理 Provider	自定义 Custom
SVG API URL	`https://right.codes/gemini`
SVG 模型	`google/gemini-3-pro-preview`
主 API Key	中转 Key
步骤 1 图片 Provider	自定义 Custom
图片模型	`gpt-image-2-vip`
图片路线 API URL	`https://www.right.codes/draw/v1`
优化轮数	0，先跑通再调整
SAM3 后端	Skip SAM；需要图标替换时再选 Roboflow API

四、导入已有图片继续操作

导入模式会跳过步骤 1 生图，所以不需要填写图片模型和图片 URL。但后续第 4 步仍然要看图重建 SVG，因此必须配置 SVG 中转路线。

进入“我已有第一阶段图片”页面后，先上传已有图片。
配置预设选择“中转 API”。
SVG / 推理 Provider 保持 Custom。
SVG API URL 填：https://right.codes/gemini。
SVG 模型填：google/gemini-3-pro-preview。
主 API Key 填中转 Key。
SAM3 后端先用 Skip SAM 跑通；需要图标替换时再启用 Roboflow Workflow。

不要把 https://www.right.codes/draw/v1 填到导入页的 SVG API URL。/draw/v1 是生图路线，导入模式已经跳过生图。

五、官方 OpenAI 怎么填写

只有使用官方 OpenAI Key 时，才选择 OpenAI 官方路线。中转 Key 不要放在这里。

配置预设选择“OpenAI 官方”。
SVG / 推理 Provider 选择 OpenAI Responses。
主 API Key 填官方 OpenAI Key。
自定义 API URL 不需要填写；官方路线会走 OpenAI 官方接口。
步骤 1 图片 Provider 保持“与 SVG 路径一致”即可，系统会落到 OpenAI Images。
图片模型可填 gpt-image-2；如果你的账号或接口支持其他图像模型，也可以按官方模型 id 填写。
SVG 模型填写账号可用的支持视觉输入和推理的模型。若默认模型不可用，就换成账号后台实际开通的模型。
SAM3 仍然需要 Roboflow / fal / local 其中一种，OpenAI Key 不能代替 SAM3 Key。

六、通用中转怎么填写

适合 one-api、new-api、LiteLLM、自建网关或其他“兼容 OpenAI /v1 接口”的平台。

配置预设：中转 API，或直接选择 Custom。
Provider：自定义 Custom。
自定义 API URL：填你的平台给出的 /v1 根地址，例如 https://api.example.com/v1。不要填 /chat/completions。
SVG 模型：填能看图的多模态模型，不要填纯文本模型或纯生图模型。
图片 Provider：如果同一平台支持生图，就选择 Custom 并填生图模型；如果同一平台不支持生图，就把图片 Provider 切到另一个可生图平台。
如果平台前面套了 Cloudflare，建议使用支持流式的 v1/chat/completions 路线，避免长时间请求超时。本地改造版已尽量按流式兼容处理。

七、DeepSeek 能不能直接用

DeepSeek 使用边界

DeepSeek-chat / DeepSeek-reasoner 通常是文本模型。AutoFigure-Edit 第 4 步需要把图片和分割结果一起交给模型看，然后生成 SVG，因此 DeepSeek 单独作为 SVG 模型大概率跑不通。

可以用 DeepSeek 辅助整理方法文本、改写提示词、提炼流程结构。
不建议把 deepseek-chat 填到 SVG 模型里跑完整流程，除非你的中转平台把它封装成了兼容视觉输入的多模态模型。
如果只想用 DeepSeek 的中转 Key，但平台同时提供 gpt-4o、Gemini 多模态或其他视觉模型，应在 SVG 模型栏填写那些视觉模型，而不是 deepseek-chat。
DeepSeek 也不是生图模型，不能作为步骤 1 图片模型。

八、模型兼容性速查表

用途	需要能力	可以考虑的模型	不能填什么
SVG / 推理模型	文本 + 视觉/多模态；能读取 figure.png 和 samed.png	gpt-4o、gpt-4.1、Gemini 多模态模型、网关提供的视觉模型	gpt-image-2、nano-banana、deepseek-chat 这类纯生图/纯文本模型
步骤 1 图片模型	文生图或图像生成	gpt-image-2-vip、gpt-image-2、nano-banana-2、nano-banana-pro、Gemini 图像模型	deepseek-chat、普通文本聊天模型
SAM3 后端	图像分割	Roboflow API、fal.ai API、本地 SAM3	OpenAI Key、中转 Key、DeepSeek Key 不能替代 SAM Key
RMBG 背景移除	下载/访问 briaai/RMBG-2.0	管理员已在 .env 配置 HF_TOKEN 后，用户无需在界面填写	界面里的 API Key 不会替代 HF_TOKEN

九、常见错误与处理

画布页 AI SVG Studio 新功能

生成完成或从历史图片打开结果后，点击右下角 AI 按钮可进入精修工作台。它可以框选局部区域后对话改 SVG，也可以直接对整张 SVG 做修改。

Box select：点击后在画布上拖拽框选要精修的区域；不框选则默认修改整张 SVG。
快捷提示：Polish、Text、Lines、Style match 分别用于整体打磨、文字可读性、线条连接和风格统一。
Apply edit：把当前 SVG、框选坐标和修改要求发给模型，返回完整 SVG 后自动载入画布，并保存为 assistant_refined_*.svg。
SVG QA：检查 XML 语法、viewBox、外部引用、重复 id、脚本/事件属性、嵌入位图等问题，并保存 svg_quality_report.json。
Save：把当前画布状态保存为 assistant_saved_*.svg，适合多轮修改前做检查点。
Export：支持导出 SVG、PNG、PDF、ZIP + QA，并可选择草稿、标准、印刷、超清质量。PNG/PDF 优先使用后端 CairoSVG 渲染；Windows 下需要可信来源安装的 Cairo 运行库，推荐 MSYS2/Scoop，不要单独下载来路不明的 libcairo-2.dll。
Copy SVG：把当前 SVG 源码复制到剪贴板，方便临时交给其他工具检查。

如果不想在页面里反复输入 Key，可以在 .env 中配置 AUTOFIGURE_ASSISTANT_PROVIDER、AUTOFIGURE_ASSISTANT_MODEL、AUTOFIGURE_ASSISTANT_BASE_URL、AUTOFIGURE_ASSISTANT_API_KEY。没有专用 Key 时，后端会继续尝试读取 OPENAI_API_KEY。

十、常见错误与处理

现象	处理方法
401 invalid OpenAI key	把中转 Key 放到了 OpenAI Responses 官方路线。切换为“中转 API”，Provider 走 Custom。
卡在发送请求到 /draw/v1	中转平台请求时间长、Cloudflare 超时或模型排队。优先使用流式 chat/completions；也检查模型是否开通和余额。
gpt-image-2 生成不了 4K	部分中转的 gpt-image-2 通常只支持 1K。4K 改用 gpt-image-2-vip、nano-banana-2 或 nano-banana-pro。
SAM3 API Key 报错	SAM3 Key 是 Roboflow/fal 的 Key，不是 LLM 中转 Key。Roboflow 在 Models -> SAM3 -> Use Model 界面复制 API Key。
RMBG-2.0 没有访问凭据	管理员需要申请 Hugging Face briaai/RMBG-2.0 访问权限，并在 .env 中配置 HF_TOKEN。普通使用者不用在界面填。
第一次运行下载很久	首次下载 Hugging Face 模型或缓存时会慢，不一定是卡死。看日志是否还在下载。
最后画布空白或只有 untitled.svg	流程前面失败了，先点“日志”看失败步骤；若只有第一阶段图成功，可以进历史图片查看 figure.png。

十一、内部分享要求

分享时必须同时保留本文档首页红色声明和项目来源链接。
不得以安装费、服务费、会员费、培训费等名义对 AutoFigure-Edit 本地部署版本收费。
不得承诺生成结果一定可直接用于论文，科研图仍需人工审核、修改和确认。
不得把个人 API Key、Roboflow Key、Hugging Face Token 写进群公告或公共文档。
如需公开部署、商业服务或二次开发发布，请先核对原项目许可证、官网条款、API 服务商条款和单位管理要求。

返回配置首页下载 Word 版查看 Markdown 源文档

版本：内部说明 v1.0｜日期：2026-05-09

AutoFigure-Edit 科研插图工具配置说明

！！重要声明！！