Vibe API 技术澄清说明

问题概览

反馈问题类别

排查修复耗时

+32

修复代码行数

100%

问题解决率

问题根因与状态

问题	根因	状态
图片识别失败	底层代理 bug（tool_result 图片未提取）	✓ 已修复
上下文频繁压缩	未开启 [1m] + 第三方工具兼容性	文档完善中
Ultra 渠道不稳定	外部供应商封杀	✓ 已降级保障
速度/质量差距	非同等条件对比	已澄清
缓存失效担忧	平台天然无缓存机制	已澄清

图片识别问题 — 排查与修复

问题现象

客户在第三方编程工具中通过 @ 文件引用方式发送截图，AI 反复读取 3 次均无法识别图片内容。

图片传输链路

① 客户端将图片编码为 base64，放入请求体

直接粘贴/拖入

message content → image block
✓ 一直正常

@ 文件引用

tool_result → image block
✓ 新版已修复

② API 请求传输（JSON + base64）

③ 底层代理提取 image block，转换为上游格式

④ 上游模型接收图片并理解

根因定位

⚠

extract_tool_result_content 函数缺陷

源码审查发现：该函数处理 tool_result 的 content 数组时，只提取了 type: "text" 的内容块，静默丢弃了 type: "image" 的内容块。

// 旧代码 — 只处理 text，丢弃 image
fn extract_tool_result_content(content) {
    for item in arr {
        if let Some(text) = item.get("text") {  // ← 只取 text
            parts.push(text);
        }
        // image 类型在此被静默忽略
    }
}

✓

修复方案 — 新增 extract_tool_result_images

// 新增函数 — 从 tool_result 中提取图片
fn extract_tool_result_images(content, images) {
    for item in arr {
        if item.type == "image" {
            let format = get_image_format(item.source.media_type);
            images.push(KiroImage::from_base64(format, item.source.data));
        }
    }
}

验证修复后的图片能力

✓

修复验证通过

修复后使用相同的 tool_result 图片请求测试，模型正确识别并详细描述了图片全部内容。同时验证了 Anthropic 原生格式下多图支持正常（实测 18 张 / 28MB 均可正确识别）。

建议用户使用 Alt+V 粘贴或 Anthropic 原生格式发送图片。

另：另有客户反馈通过 OpenAI 兼容格式发送多图时报错，该问题与本次反馈无关，已另行记录排查。

上下文窗口说明

关于 [1m] 上下文

[1m] 后缀是 Claude Code / Claude Desktop SDK 层面的兼容处理，告知客户端该模型支持 1M 上下文。直接调用 API 时该参数不生效，实际上下文窗口由上游分配决定。若未在官方客户端配置中指定，默认为 200K tokens。

日志实证 — 上下文满额提供

主站 2026-05-16 使用日志显示，单次请求输入 token 数稳定在 180K-360K 区间：

时间	输入 tokens	输出 tokens
01:08:35	359,941	125
01:08:29	181,044	88
01:08:22	359,668	111
01:07:38	359,380	58
01:07:25	359,082	155

远超客户怀疑的 16K/32K，证明上下文窗口未做任何人为限制。

压缩实测 — 从未自动触发

✓

长时间使用无压缩

我方使用同一套 API 进行日常开发，上下文累积到 400,000 - 500,000 tokens 的情况下，从未见自动压缩触发。如遇到频繁压缩，建议检查客户端配置文件，并将对应工具更新至最新版本。

关于"之前没内容"的上下文丢失

Claude API 是无状态的 — 每次请求都由客户端携带完整历史发送，服务端不维护对话状态。出现上下文丢失只能是客户端工具自身触发了压缩或丢弃了历史消息，与服务端无关。

渠道架构与定价

关于 Kiro 渠道

Kiro 并非先天不足

Kiro 是作为 Anthropic 股东的亚马逊（AWS）提供的货真价实的模型服务。虽然对比官方直连存在一定差距，但模型本身质量有保障。我方只是照原样转发请求，不做任何降级处理。

渠道分组

分组	说明	倍率
GPT	GPT 最新文本模型 + gpt-image-2 生图	0.6x
Kiro	AWS Kiro 渠道，支持 Opus 4.7 原生（算力紧张时响应可能较慢）	0.5x
Ultra	高价优质线路（近期不稳定），自动转发 Kiro	0.5x
default	默认分组，含 Claude、GPT、Gemini、国产模型、生图。Opus 4.7 默认转发到 4.6 以保障响应速度	0.6x

由于上游当前 Opus 4.7 算力紧张，default 分组中的 4.7 请求默认转发到 4.6 以保障响应速度。如需原生 4.7，可选用 Kiro 分组。

定价逻辑

1:3

常规汇率（1元=3美元额度）

1:6

活动期间（1元=6美元额度）

推广期优惠策略，非以牺牲质量换取低价。平台自身也在使用同一套 API 进行日常开发。

技术架构澄清

请求链路

客户端

Claude Code
Claude Desktop
第三方工具

→

API 网关

粘性路由
令牌管理
格式兼容

→

底层代理

协议转换
负载均衡
故障转移

关键技术事实

维度	客户担忧	实际情况
切账号/缓存	切账号导致缓存失效	协议层不含 cache 字段，天然无缓存；网关层有粘性路由
上下文窗口	可能被限制到 16K/32K	日志证明 180K-360K 输入，满额提供
多模态处理	图片数据丢失	已定位为代理层 bug，已修复验证
响应速度	比官方慢很多	TTFT 与上下文大小正相关，180K+ 请求 6-15s 属正常