使用概述
呱呱聚合提供与 OpenAI 兼容的 API 接口,同时内置智能路由引擎,
OpenAI 兼容
完全兼容 OpenAI API 格式,一行代码即可迁移
智能路由
根据行业身份和偏好自动匹配最优模型
多模型聚合
一次接入,畅享 GLM、Kimi、DeepSeek 等主流模型
用量统计
实时查看调用日志、Token 消耗和模型分布
快速开始
只需三步即可接入呱呱聚合 API:
curl https://guaguahub.com/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer *** \
-d '{
"model": "smart",
"messages": [
{"role": "user", "content": "你好,请介绍一下自己"}
]
}' 鉴权说明
呱呱聚合 API 使用 API Key 进行身份验证。请在请求头中加入 Authorization 字段。
Authorization: Bearer ***
⚠️ 安全提示 请勿将 API Key 硬编码在客户端代码中,也不要提交到公开的代码仓库。
Base URL
呱呱聚合 API 的基础地址如下:
https://guaguahub.com/v1 注意:仅支持 HTTPS 协议,HTTP 请求将自动重定向至 HTTPS。
所有 API 端点都基于该地址。例如对话补全的完整 URL 为:
POST https://guaguahub.com/v1/chat/completions Anthropic 协议接入
平台对外同时支持两种接口协议,你可以任选其一调用同样的模型,模型名保持不变(如 glm-4-flash、deepseek-v4-pro):
- OpenAI 兼容协议:POST /v1/chat/completions,使用 Authorization: Bearer <API Key> 鉴权。
- Anthropic 原生协议:POST /v1/messages,可用 x-api-key 或 Authorization: Bearer 鉴权。适合 Claude Code、Cursor、Anthropic 官方 SDK 等默认使用 Anthropic 协议的客户端直连。
接口地址
POST https://guaguahub.com/v1/messages 请求示例(非流式)
curl https://guaguahub.com/v1/messages \\
-H "x-api-key: YOUR_API_KEY" \\
-H "anthropic-version: 2023-06-01" \\
-H "Content-Type: application/json" \\
-d '{
"model": "glm-4-flash",
"max_tokens": 1024,
"messages": [
{ "role": "user", "content": "你好" }
]
}' 响应示例
{
"id": "msg_xxxxxxxxxxxx",
"type": "message",
"role": "assistant",
"model": "glm-4-flash",
"content": [
{ "type": "text", "text": "你好!有什么可以帮你的吗?" }
],
"stop_reason": "end_turn",
"usage": { "input_tokens": 9, "output_tokens": 12 }
} 流式输出
请求体加上 "stream": true 即可获得标准 Anthropic SSE 事件流(message_start → content_block_delta → message_stop),与 Anthropic 官方格式完全一致。
在 Claude Code / Anthropic SDK 中使用
把客户端的 Base URL 指向本平台,API Key 填你在用户中心创建的密钥即可:
export ANTHROPIC_BASE_URL=https://guaguahub.com
export ANTHROPIC_API_KEY=YOUR_API_KEY 说明:两种协议共用同一套计费、智能路由与额度,调用哪种协议都按实际消耗的 token 计费,无差别。
对话补全
对话补全接口兼容 OpenAI Chat Completions API,支持流式输出。将 model 参数设为 "smart" 即可启用智能路由。
请求地址
POST /v1/chat/completions 请求参数
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
model | string | 是 | 模型名称,使用"smart"启用智能路由,或指定具体模型如"glm-5.1" |
messages | array | 是 | 对话消息列表,每个消息包含role和content |
stream | boolean | 否 | 是否使用流式输出,默认false |
temperature | number | 否 | 采样温度,范围 0~2,默认0.7 |
max_tokens | integer | 否 | 最大生成 Token 数 |
请求示例
{
"model": "smart",
"messages": [
{"role": "system", "content": "你是一个专业的编程助手"},
{"role": "user", "content": "用 Python 写一个快速排序"}
],
"stream": true,
"temperature": 0.7
} 响应示例
{
"id": "chatcmpl-abc123",
"object": "chat.completion",
"created": 1699123456,
"model": "glm-5.1",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "以下是快速排序的 Python 实现..."
},
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 25,
"completion_tokens": 150,
"total_tokens": 175
}
} 流式响应
当stream: true时,响应为 SSE 流格式:
data: {"id":"...","choices":[{"delta":{"content":"你好"}}]}
data: {"id":"...","choices":[{"delta":{"content":"!"}}]}
data: [DONE] 模型列表
通过以下接口获取当前可用的模型列表:
GET /v1/models 支持的路由模式
| 模型标识 | 说明 |
|---|---|
smart | 智能路由,根据用户配置自动选择最优模型 |
glm-5.1 | 智谱 GLM-5.1,综合能力强,适合复杂推理与代码 |
glm-5-turbo | 智谱 GLM-5-Turbo,速度快、性价比高 |
kimi-k2.6 | Moonshot Kimi-K2.6,长上下文、文档理解出色 |
MiniMax-M2.7 | MiniMax-M2.7,中文创意写作与对话见长 |
deepseek-v4-pro | DeepSeek-V4-Pro,代码与数学能力突出 |
deepseek-v4-flash | DeepSeek-V4-Flash,轻量快速,适合高频简单任务 |
图像与视频生成
图像与视频生成复用同一个对话补全接口 /v1/chat/completions,无需学习新的 API。只要把 model 换成对应的生成模型,把要画的内容写进 messages 即可。返回结果是标准的 chat.completion 结构,生成的图片/视频以链接形式放在 content 字段里(Markdown 语法),链接 24 小时内有效。
请求地址
POST /v1/chat/completions 图像生成
把 model 设为图像模型,content 写画面描述(prompt),即可返回一张高清图片。约 20 秒出图。
可用图像模型
seedream seedream-5.0 seedream-5.0-lite seedream-4.5 seedream-4.0 视频生成
把 model 设为视频模型,content 写画面描述,即可返回一段约 5 秒的高清短视频,自带运镜与音效。出片较慢(约 1-3 分钟),请把客户端超时时间设为 300 秒以上。
可用视频模型
seedance seedance-2.0 seedance-2.0-fast seedance-1.5-pro seedance-1.0-pro seedance-1.0-pro-fast 请求示例
curl https://guaguahub.com/v1/chat/completions \
-H "Authorization: Bearer $PAPERAIX_API_KEY" \
-H "Content-Type: application/json" \
--max-time 300 \
-d '{
"model": "seedream",
"messages": [
{"role": "user", "content": "一只戴墨镜的柯基在沙滩上奔跑"}
]
}' 图像返回示例
content 为 Markdown 文本: 展示图片,后附原图链接与生成信息。第三方应用可用正则从 content 中提取图片 URL。
{
"id": "chatcmpl-f649493c85b4...",
"object": "chat.completion",
"model": "seedream",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "已为你生成图片 🎨\n\n\n\n[点击查看原图](https://...volces.com/...jpeg?...)\n\n> 模型:seedream | 共 1 张 | 链接 24 小时内有效"
},
"finish_reason": "stop"
}
]
} 视频返回示例
视频以 ::guaguavideo{src=... download=...} 指令(directive)形式返回(用于在呱呱聚合对话页内嵌播放器),并同时附带标准 Markdown 下载链接 [点击下载/查看视频](视频链接)。第三方应用请从 content 中提取 .mp4 链接使用。
{
"id": "chatcmpl-...",
"object": "chat.completion",
"model": "seedance",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "已为你生成视频 🎬\n\n::guaguavideo{src=\"https://...volces.com/...seedance...mp4?X-Tos-Expires=86400&...\" download=\"https://...mp4?...\"}\n\n[点击下载/查看视频](https://...volces.com/...mp4?...)\n\n> 模型:seedance | 规格:720p 5s | 链接 24 小时内有效"
},
"finish_reason": "stop"
}
]
} 使用建议
- 视频生成耗时较长,务必将 HTTP 客户端超时设为 300 秒以上,避免提前断开。
- 返回的图片/视频链接有效期为 24 小时,请及时下载转存到自己的存储。
- 图像与视频生成为同步等待,不支持流式返回(stream 参数会被忽略)。
- 返回的 content 是 Markdown / 指令文本,第三方应用需自行从中提取媒体 URL(图片为 .jpeg,视频为 .mp4)。
智能路由引擎
呱呱聚合的核心特性是智能路由。当model设置为"smart"时,
路由决策因素
- 行业身份:软件开发、建筑行业、医学行业、教育等
- 偏好模式:经济模式(优先性价比)或质量优先(优先效果)
- 任务类型:代码生成、文档理解、创意写作、数据分析等
配置路由偏好
登录后进入用户中心,在「智能路由引擎」区域配置:
// 路由配置示例(通过用户中心界面设置)
{
"industry": "software", // 行业:software | architecture | medical | education
"subIndustry": "web-dev", // 子行业:web-dev | mobile | ai | backend
"preference": "quality", // 偏好:economy | balanced | quality
"language": "zh" // 语言偏好:zh | en
} 行业配置
不同行业对应的最佳模型选择策略:
| 行业 | 经济模式推荐 | 质量优先推荐 |
|---|---|---|
| 软件开发 | DeepSeek-V4-Pro | GLM-5.1 / Kimi-K2.6 |
| 建筑行业 | GLM-5.1 | Kimi-K2.6 |
| 医学行业 | GLM-5.1 | Kimi-K2.6 |
| 教育 | DeepSeek-V4-Pro | GLM-5.1 |
| 通用 | MiniMax-M2.7 | GLM-5.1 |
指定单个模型
智能路由(<code>smart</code>)会自动帮你挑选最优模型,但如果你心里已经有明确的选择——
只需把请求里的model字段填成具体的模型标识即可,调用方式和 OpenAI 完全一致:
curl https://guaguahub.com/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer YOUR_API_KEY" \
-d '{
"model": "kimi-k2.6",
"messages": [{ "role": "user", "content": "你好" }]
}' 可指定的模型标识见上方模型列表,目前支持 6 个:
glm-5.1·glm-5-turbokimi-k2.6MiniMax-M2.7deepseek-v4-pro·deepseek-v4-flash
用smart让呱呱聚合帮你智能选模型、省成本;想自己说了算时,直接填具体模型名即可。
工具集成
呱呱聚合支持多种主流 Coding Agent 和 AI 工具接入。只需配置 Base URL 和 API Key,即可在您喜爱的工具中使用呱呱聚合的智能路由能力。
呱呱聚合提供 OpenAI 兼容协议端点:https://guaguahub.com/v1
支持的 Coding Agent 工具
通用配置步骤
获取 API Key
登录呱呱聚合用户中心,在「API Key 管理」中创建新的 Key。
配置工具
在您的 Coding Agent 工具中,找到模型/Provider 设置,添加自定义 OpenAI 兼容端点。
填写配置信息
填入呱呱聚合的 Base URL 和您的 API Key,选择模型即可开始使用。
Claude Code
Claude Code 是 Anthropic 推出的智能编码工具,在终端中运行,通过自然语言命令交互帮助开发者快速完成代码生成、调试、重构等任务。
步骤一:安装 Claude Code
前提条件:Node.js 18 或更新版本
# 安装 Claude Code
npm install -g @anthropic-ai/claude-code
# 验证安装
claude --version 步骤二:配置呱呱聚合
选择以下任意一种方式配置环境变量:
方式一:自动化脚本(推荐)
# 下载并运行呱呱聚合环境配置脚本(macOS / Linux)
curl -O "https://guaguahub.com/install/guaguahub-env.sh" && bash ./guaguahub-env.sh 方式二:手动配置
编辑或创建 Claude Code 配置文件~/.claude/settings.json:
{
"env": {
"ANTHROPIC_AUTH_TOKEN": "YOUR_PAPERAIX_API_KEY",
"ANTHROPIC_BASE_URL": "https://guaguahub.com/v1",
"API_TIMEOUT_MS": "3000000",
"CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC": "1"
}
} 配置完成后,请重新打开一个新的终端窗口,以便环境配置生效。
步骤三:开始使用
# 进入项目目录
cd your-project
# 启动 Claude Code
claude 模型映射(可选)
Claude Code 内部使用 Claude 模型名称,可通过环境变量映射到呱呱聚合模型:
{
"env": {
"ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-5.1",
"ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-5.1",
"ANTHROPIC_DEFAULT_HAIKU_MODEL": "deepseek-v4-flash"
}
} Cursor
Cursor 是 AI 优先的代码编辑器,支持自定义模型配置。
配置步骤
打开 Models 设置
在 Cursor 中,打开「Settings」→「Models」部分,点击「Add Custom Model」。
选择 OpenAI 协议
选择OpenAI Compatible作为 Provider 类型。
填写配置
- API Key:填入您的呱呱聚合 API Key
- Override OpenAI Base URL:
https://guaguahub.com/v1 - 模型:输入
smart或具体模型如glm-5.1
保存并使用
保存设置,在编辑器中选择刚创建的 Provider 即可开始使用。
Cline (VS Code)
Cline 是 VS Code 的 AI 编程插件,支持代码生成和文件操作。
配置步骤
打开 Cline 设置
在 VS Code 中,点击 Cline 扩展的设置图标。
选择 API Provider
选择OpenAI Compatible或OpenAI。
填写配置信息
- Base URL:
https://guaguahub.com/v1 - API Key:您的呱呱聚合 API Key
- Model:选择「Use Custom」并输入
smart或glm-5.1
高级设置(可选)
- 取消勾选Support Images(如不需要多模态)
- 调整Context Window Size为
200000 - 根据需求调整
temperature等参数
OpenCode
OpenCode 是面向开发者的开源 Coding Agent,在终端中提供代码生成、编辑与任务执行能力。
配置步骤
安装 OpenCode
npm install -g @opencode/opencode 配置 Provider
编辑 OpenCode 配置文件,添加呱呱聚合作为 Provider:
{
"$schema": "https://opencode.ai/config.json",
"providers": {
"paperaix": {
"type": "openai",
"baseUrl": "https://guaguahub.com/v1",
"apiKey": "YOUR_PAPERAIX_API_KEY",
"model": "smart"
}
}
} 启动使用
opencode --provider paperaix 其他工具
以下工具同样支持通过 OpenAI 兼容协议接入呱呱聚合:
| 工具 | 说明 | 配置方式 |
|---|---|---|
| Crush | 终端 AI 编程工具,支持 CLI 和 TUI 界面 | 配置文件中添加 OpenAI 兼容 Provider |
| Goose | AI Agent 工具,支持本地运行和自动化任务 | Extensions → Add custom extension → HTTP 类型 |
| Roo Code | VS Code 插件,用于项目代码编写重构 | OpenAI Compatible Provider |
| Kilo Code | 高效的 VS Code 插件,专注性能优化 | OpenAI Compatible Provider |
| TRAE | 能独立完成各类开发任务的 AI 编辑器 | 自定义模型配置 |
| CodeBuddy | 基于 AI 的全流程智能编程工具 | 自定义 API 端点 |
| Lingma | 阿里云智能编程助手 | 自定义模型配置 |
所有支持 OpenAI 协议的工具,核心配置均为:
- Base URL:
https://guaguahub.com/v1 - API Key:您的呱呱聚合 API Key
- Model:
smart(智能路由)或具体模型名称
如何切换模型
呱呱聚合支持在工具中灵活切换模型,满足不同的编码需求。
在 Claude Code 中切换
编辑配置文件~/.claude/settings.json,修改模型映射:
{
"env": {
"ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-5.1",
"ANTHROPIC_DEFAULT_SONNET_MODEL": "kimi-k2.6",
"ANTHROPIC_DEFAULT_HAIKU_MODEL": "deepseek-v4-flash"
}
} 在 Cursor 中切换
在 Cursor 的 Models 设置中,直接修改已添加的 Custom Model 的模型名称即可。
在 Cline 中切换
在 Cline 扩展设置中,修改 Model 字段为想要的模型标识,如glm-5.1、kimi-k2.6等。
将模型设置为smart,呱呱聚合会根据您的行业配置和偏好自动选择最优模型,无需手动切换。
MCP 服务
MCP(Model Context Protocol)是 Anthropic 推出的开放协议,用于标准化 AI 模型与外部工具、数据源之间的交互。呱呱聚合提供多个专属 MCP 服务,增强您的 Coding Agent 能力。
联网搜索
让 AI 拥有实时网络搜索能力,获取最新信息
视觉理解
图像分析、视频理解、UI 截图转代码
网页读取
抓取任意网页内容,提取结构化数据
开源仓库
GitHub 仓库检索、代码读取、文档搜索
联网搜索 MCP
为 Claude Code、Cline 等兼容 MCP 的客户端提供实时网络搜索能力。
功能特性
- 网络搜索:支持全网搜索,获取最新的网络信息和资源
- 实时信息:获取实时更新的信息,包括新闻、股价、天气等
- 远程服务:基于 HTTP 协议的远程 MCP 服务,无需本地安装
支持的工具
| 工具名 | 说明 |
|---|---|
webSearch | 搜索网络信息,返回网页标题、URL、摘要、网站名称等 |
Claude Code 配置
# 一键安装命令
claude mcp add -s user -t http web-search \
https://guaguahub.com/mcp/search \
--header "Authorization: Bearer ***
手动配置
编辑~/.claude.json的 MCP 部分:
{
"mcpServers": {
"web-search": {
"type": "http",
"url": "https://guaguahub.com/mcp/search",
"headers": {
"Authorization": "Bearer YOUR_API_KEY"
}
}
}
} Cline 配置
{
"mcpServers": {
"web-search": {
"type": "streamableHttp",
"url": "https://guaguahub.com/mcp/search",
"headers": {
"Authorization": "Bearer YOUR_API_KEY"
}
}
}
} 使用示例
"帮我搜索最新的 AI 技术发展"
"查找关于 Python 异步编程的最佳实践" 视觉理解 MCP
为 Claude Code 等客户端提供图像分析、视频理解等视觉能力。
功能特性
- 图像分析:支持多种图像格式的智能分析和内容理解
- 视频理解:支持本地视频与远端视频的视觉理解
- 简单集成:一键安装,快速集成到 MCP 兼容客户端
支持的工具
| 工具名 | 说明 |
|---|---|
ui_to_code | 将 UI 截图转换为代码、设计规范或自然语言描述 |
extract_text | 从截图中提取和识别文字(OCR) |
diagnose_error | 解析错误弹窗、堆栈截图,给出定位与修复建议 |
analyze_diagram | 针对架构图、流程图、UML 等技术图纸生成结构化解读 |
analyze_chart | 阅读仪表盘、统计图表,提炼趋势与业务要点 |
ui_diff_check | 对比两张 UI 截图,识别视觉差异和实现偏差 |
image_analysis | 通用图像理解能力 |
video_analysis | 支持 MP4/MOV 等格式的视频场景解析 |
环境变量配置
| 环境变量 | 说明 | 默认值 |
|---|---|---|
PAPERAIX_API_KEY | 呱呱聚合 API Key | 必需配置 |
Claude Code 配置
# 一键安装命令
claude mcp add -s user vision-mcp \
--env PAPERAIX_API_KEY=YOUR_API_KEY \
-- npx -y "@paperaix/mcp-vision" 手动配置
{
"mcpServers": {
"vision-mcp": {
"type": "stdio",
"command": "npx",
"args": ["-y", "@paperaix/mcp-vision"],
"env": {
"PAPERAIX_API_KEY": "YOUR_API_KEY"
}
}
}
} 将图片放到本地目录,通过对话指定图片路径来调用 MCP:
What does demo.png describe?
网页读取 MCP
为 Claude Code 等客户端提供网页内容抓取能力,获取网页详细内容和结构化数据。
功能特性
- 网页内容抓取:支持抓取任意网页的完整内容
- 结构化数据:提取网页的标题、正文、元数据等
- 远程服务:基于 HTTP 协议,无需本地安装
支持的工具
| 工具名 | 说明 |
|---|---|
webReader | 抓取指定 URL 的网页内容,返回标题、正文、元数据、链接列表等 |
示例场景
- API 文档读取:自动抓取并解析官方文档,提炼要点摘要
- 开源项目解析:解析项目官网或仓库页面,提取核心信息
- 技术文章理解:从博客、教程提取步骤、命令与注意事项
- BUG 参考修复:读取网页公开信源,参考修复问题
Claude Code 配置
# 一键安装命令
claude mcp add -s user -t http web-reader \
https://guaguahub.com/mcp/reader \
--header "Authorization: Bearer ***
手动配置
{
"mcpServers": {
"web-reader": {
"type": "http",
"url": "https://guaguahub.com/mcp/reader",
"headers": {
"Authorization": "Bearer YOUR_API_KEY"
}
}
}
} 开源仓库 MCP
为 Claude Code 等客户端提供 GitHub 仓库的知识文档与代码访问功能。
功能特性
- 文档搜索:GitHub 代码仓库检索文档、代码与注释
- 仓库结构:获取目录结构和文件列表,快速掌握项目布局
- 代码读取:读取指定文件的完整代码内容,深入分析实现细节
支持的工具
| 工具名 | 说明 |
|---|---|
search_doc | 搜索 GitHub 仓库的知识文档、新闻、Issue、PR 等 |
get_repo_structure | 获取仓库目录结构和文件列表 |
read_file | 读取指定文件的完整代码内容 |
示例场景
- 快速上手开源库:搜索文档和获取仓库结构,加速学习曲线
- 排查 Issue:搜索仓库 Issue 和 Commit 历史,查找解决方案
- 深入源码分析:读取核心文件代码,分析实现逻辑
- 依赖库调研:评估依赖库的活跃度、代码质量和维护情况
Claude Code 配置
# 一键安装命令
claude mcp add -s user -t http zread \
https://guaguahub.com/mcp/zread \
--header "Authorization: Bearer ***
手动配置
{
"mcpServers": {
"zread": {
"type": "http",
"url": "https://guaguahub.com/mcp/zread",
"headers": {
"Authorization": "Bearer YOUR_API_KEY"
}
}
}
} 错误码
| HTTP 状态码 | 错误类型 | 说明 |
|---|---|---|
| 400 | Bad Request | 请求参数错误,请检查请求体格式 |
| 401 | Unauthorized | API Key 无效或已过期 |
| 403 | Forbidden | 权限不足,当前 Key 无权访问该模型 |
| 429 | Too Many Requests | 请求频率超限,请降低调用频率 |
| 500 | Internal Server Error | 服务器内部错误,请稍后重试 |
| 503 | Service Unavailable | 模型服务暂时不可用,正在自动切换备用模型 |
错误响应格式
{
"error": {
"message": "Invalid API key",
"type": "invalid_request_error",
"code": "invalid_api_key"
}
} 速率限制
为保障服务稳定性,API 调用存在以下限制:
| 限制项 | 免费版 | 标准版 | 专业版 |
|---|---|---|---|
| RPM(每分钟请求数) | 20 | 100 | 500 |
| TPM(每分钟 Token 数) | 10,000 | 100,000 | 1,000,000 |
| 并发请求数 | 2 | 10 | 50 |
当接近速率限制时,响应头中会包含X-RateLimit-Remaining字段。