AI中转站深度拆解：月入百万的商业模式、技术架构与潜在风险

2026-04-27 04:19:00 +0800 CST

来源: 整理自互联网

AI安全与搞钱

2026 年 3 月，深潮 TechFlow 写 OpenClaw 淘金热时提到一件事：倒卖 Token API 的中转站，有人单月盈利上百万。这个数字不一定代表行业平均水平。但它解释了一个现象：为什么最近到处都是「低价 Claude」「满血模型」「国内直连」。 ![文章配图](https://static.haode.com/news_img/2026/04/28/wechat-article-cover-ai-relay.jpg) 我这几天把调研了一遍，先说结论：**AI 中转站赚钱，靠的不是模型能力。** 它赚的是三笔钱：访问门槛的钱、额度管理的钱、以及信息不透明的钱。真正值得讲清楚的也不是「怎么搭站」。那东西一写就容易变成灰色教程，没意思。我更关心另一个问题：我在客户端里输入一句提示词，最后到底是不是去了 Anthropic 的 Claude 真实服务器？中间经过了几层？返回时又经过了谁的手？这条路径说不清，低价就没有意义。 ## 01 中转站卖的不是模型，是入口官方 API 对国内很多用户有四个门槛：网络、支付、账号、协议。中转站把这四个问题包起来，给一个 `base_url` 和一个 `sk-xxx`，用户在 Cursor、Claude Code、Chatbox 或自己的脚本里一填，就能跑。说白了就是把麻烦藏起来。这里面第一笔钱来自**支付和站内汇率**。用户用人民币充值，后台用虚拟美元计价，甚至出现「1 元人民币 = 1 美刀额度」，也就是说，所谓「刀」往往不是银行汇率意义上的美元，而是站内额度单位。第二笔钱来自**额度池**。轻度用户充了 100 元，只用了 10 元就停了；重度用户把 Claude Code 接到项目里跑一晚上，站长再靠限速、排队、换上游去扛。第三笔钱来自**模型和渠道的不透明**。用户买的是「我能用上 Claude」这个结果，但很少能验证背后到底是哪条通道。 > 中转站利润不是来自模型本身，而是来自入口、额度和不透明路由。 ## 02 一次提示词请求，先过的是中转站自己的账本先把一条正常请求拆开。我在客户端输入： ```json { "model": "claude-sonnet-4-5", "messages": [ { "role": "user", "content": "帮我分析这段代码的问题" } ], "stream": true } ``` 客户端不会直接去 Anthropic。它会把请求发到中转站提供的地址，比如： ```bash POST https://api.example-relay.com/v1/chat/completions Authorization: Bearer sk-relay-user-key ``` **第一层是接入层。** 可能是 Cloudflare、Nginx、APISIX 或其他网关，负责挡掉异常流量，保持长连接，处理跨域和超时。 **第二层是鉴权层。** 中转站会查这个 `sk-relay-user-key` 属于谁，余额还有多少，用户在哪个分组，能不能调用这个模型。 **第三层是计费预估。** 系统会粗略估算输入 Token 数，检查余额，必要时先冻结一部分额度。到这里，请求还没碰到 Claude。很多人以为中转站就是一个反向代理：进来、转发、回来。实际不是。一个能赚钱的中转站，前半段最重要的是**账本、分组和限流**。因为用户不会平均地用模型。有人一天问两句，有人把 AI 编程工具接到真实项目里连续跑。站长赚不赚钱，先看能不能识别这种用量差异。 > 从用户提示词到 Claude 真实服务器的请求路径 ## 03 真正分叉在路由层请求通过账本之后，会进入路由层。这一步决定了钱从哪里来，也决定了风险从哪里来。我把它拆成三种模式。 | 模式 | 背后是什么 | 便宜原因 | 主要风险 | |---|---|---|---| | 官方 API Key 转发 | Anthropic、OpenAI、Azure、AWS Bedrock 等真实 API | 批量采购、汇率、统一计费 | 成本高，价格很难离谱低 | | 订阅账号池逆向 | 网页或客户端订阅账号，被脚本包装成 API | 订阅额度被多人共享 | 易封号、限流、协议不稳定 | | 小中转接大中转 | 自己不持有稳定上游，再接别人接口 | 再包装赚差价 | 故障不可解释，责任边界消失 | **第一种是最干净的。** 中转站自己持有 Anthropic、OpenAI、Azure、AWS Bedrock 等官方或准官方渠道的 Key。用户请求进来后，中转站把用户 Key 换成自己的官方 Key，再把请求转发到真实 API。 New API 和 LiteLLM 这类项目，做的就是这类网关能力：多模型接入、协议转换、路由、计费、失败重试、成本统计。这个模式不是天然有问题。很多企业内部也会自建 AI Gateway，把 OpenAI、Claude、Gemini 统一到一个入口，方便做权限、成本和审计。问题在于，企业自用网关的目标是**可控**，中转站的目标通常是**便宜和可售卖**。这两个目标会冲突。 **第二种是订阅账号池逆向。** 站长买很多 Claude Pro、Max 或其他订阅账号，再用自动化脚本登录网页或客户端，把用户的提示词塞进去，等网页返回结果，再抓出来包装成 API 响应。用户以为自己在调 API，其实后面可能是浏览器自动化、客户端逆向、Cookie 池、代理 IP 池。这里有个坑：网页和客户端不是为 API 服务设计的。它们有自己的系统提示词、频率限制、风控策略和会话状态。中转站硬把它包装成 API，就会出现奇怪的问题：同样的提示词今天能跑，明天 403；短问题能回答，长上下文突然断；Claude Code 的 tool use 表现不稳定。这不是用户写错了。这是中转站把非 API 通道伪装成了 API。 **第三种是小中转接大中转。** 我以为自己买的是某个中转站，实际上它后面又接了另一个中转站。它自己没有官方 Key，也没有稳定账号池，只是拿别人的接口再包装一层。这类站最大的特点是解释不了故障。用户问为什么 429，它说上游限流；问为什么模型不对，它说上游兜底；问为什么扣费异常，它说上游计费延迟。听起来都合理，但没有任何可验证信息。这就是我最不喜欢的一类。因为它不只是便宜不便宜的问题，而是**责任边界消失了**。 > 三种上游模式的成本、稳定性和风险对比 ## 04 返回路径更敏感，因为中转站看得见内容请求到了真实模型服务器，Claude 或 OpenAI 开始生成内容。如果是流式输出，官方会通过 SSE 返回一段一段事件。 Anthropic 的官方文档写得很清楚，创建 Message 时设置 `"stream": true`，就会通过 Server-Sent Events 增量返回；OpenAI 的 Responses API 也是类似机制。这解释了为什么客户端里会一个字一个字出来。但中转站在中间，所以返回也不是「官方直接回到用户」。真实路径大概是： ``` 官方模型服务器 → 中转站上游连接 → 中转站格式转换和日志 → 中转站计费结算 → 用户客户端 ``` 这里最敏感的是**日志**。中转站理论上可以看到用户发出的 prompt，也可以看到模型返回的 response。它可以选择只记录用量、状态码、耗时、Token 数，也可以把完整对话存下来。我以前觉得「我又不写什么机密，怕什么」。后来我想了一下，如果我把整个项目目录交给 AI 编程工具，中转站拿到的就不是一句聊天，而是一部分工作现场。这件事性质就变了。用户在 Claude Code 里跑项目时，提示词里可能包含 `.env`、客户数据、源码、数据库结构、内部文档。哪怕我自己做了 `.gitignore`，也不代表 AI 工具不会在上下文里带出敏感片段。中转站不是单纯网络代理。**它是能读到内容的中间人。** 所以这里就有最离谱的赚钱方式：把信息卖给厂商。有些大量免费用 xx 模型的中转站，可能就是了。 ## 05 常见故障，其实是在暴露上游结构中转站日常出问题，不要只看报错文本。要看它暴露了哪一层。 | 现象 | 可能位置 | 暴露的问题 | |---|---|---| | 经常 401 / Key invalid | 鉴权层或上游 Key | 用户 Key 管理混乱，或真实 Key 被封 | | 经常 429 / rate limit | 上游额度池 | 官方 Key 额度不足，或订阅账号池被打满 | | 高峰期排队很久 | 路由和账号池 | 站长用低成本池子对赌轻度用户 | | Claude Code tool use 异常 | 协议转换层 | OpenAI 格式硬转 Claude 格式，细节没适配 | | 模型自称和面板不一致 | 路由层或提示词层 | 可能被降级，或被系统提示词伪装 | | 输出风格突然变化 | 上游渠道切换 | 真实模型可能换了，或中间被加了系统提示词 | | 长上下文突然截断 | 网关或上游限制 | 上下文上限、请求体大小或流式转发有问题 | | 扣费和用量对不上 | 计费层 | Token 估算、缓存计费或倍率配置有问题 | 这里最值得盯的是两个信号。 **第一，模型能力突然不稳定。** 如果同一个模型名，上午能处理复杂代码，晚上连工具调用都乱掉，这不像正常波动，更像路由换了。 **第二，站长永远用「上游问题」解释一切。** 真正直连官方或自持稳定渠道的服务商，至少能告诉我是哪类错误：余额不足、RPM 限流、TPM 限流、模型维护、账号封禁、协议转换失败。只会说「上游炸了」，多半说明它自己也不知道上游是谁。 > 用故障信号反推问题发生在哪一层 ## 07 靠谱中转站更像网关，不像倒卖摊位合规的 AI Gateway 和灰色中转站，表面都给一个 API 地址。区别在运营目标。靠谱网关关心的是：**权限、成本、可观测、故障切换、日志边界、协议兼容。** 灰色中转关心的是：**低价、引流、充值、上游套利、尽量别被封。** 这两个东西看起来都能用，但不是一个物种。我的判断很简单：中转站如果能把调用路径讲清楚，把日志边界讲清楚，把故障归因讲清楚，它就有机会变成基础设施；如果它只能把「低价 Claude」四个字写得很大，它大概率只是把别人的不确定性转卖给我。 > AI 时代最贵的不是 Token。是我把工作现场交出去之后，还以为自己只是省了几块钱。 ## 参考资料 1. [OpenClaw 淘金热，谁在暴富？](https://finance.sina.com.cn/wm/2026-03-11/doc-inhqrfcr5593259.shtml) 2. [AI 中转站黑话大全整理](https://www.v2ex.com/t/1196011) 3. [AI 中转站的底裤，扒给你看](https://www.v2ex.com/t/1200135) 4. [New API 项目说明](https://github.com/QuantumNous/new-api) 5. [LiteLLM 项目说明](https://github.com/BerriAI/litellm) 6. [Anthropic Streaming Messages](https://docs.anthropic.com/claude/reference/messages-streaming) 7. [OpenAI Streaming Responses](https://platform.openai.com/docs/guides/streaming-responses)