支持的国产大模型

We2AI 通过 OpenAI 兼容接口统一接入下面这些国产大语言模型 —— 你的应用代码不用改，把 base_url 换成我们的、把 model 名字换一下就能调用，按量计费、统一账单。

DeepSeek · DeepSeek (深度求索)

DeepSeek 是国产开源大模型里推理能力最强的几个之一，DeepSeek V4 在中文推理、代码生成、长文档理解上接近 GPT-4 水平，价格只有它的几十分之一。DeepSeek-R1 是带思维链（chain-of-thought）的推理模型，做复杂数学题和代码 debug 时表现尤其好。

主要用途：通用对话、代码补全、长文档分析、数学推理
上下文长度：128K tokens（V4）、64K（R1）
调用 model 名：deepseek-chat、deepseek-reasoner
典型客户端：Cursor、Continue、Cline、LobeChat、NextChat、ChatBox

通义千问 Qwen · 阿里云

阿里巴巴自研的 Qwen 系列覆盖广，从 qwen-plus（通用高性价比）、qwen-max（旗舰）、到 qwen-coder（代码专用）一应俱全。Qwen 在中文指令理解、多轮对话连贯性上做得很扎实，工具调用（function calling）兼容性高，适合做 agent 和 RAG。

主要用途：中文对话、agent / 工具调用、代码生成、企业级 RAG
上下文长度：128K-1M tokens（按子模型）
调用 model 名：qwen-plus、qwen-max、qwen-coder-plus
典型客户端：所有 OpenAI 兼容客户端都能直接用

智谱 GLM · 智谱 AI

清华系智谱团队出品，GLM-4.5 和 GLM-4.5-air 是当前主力，前者旗舰，后者轻量低延迟。GLM 系列在中英双语切换、结构化输出（JSON Mode）上很稳，最近的版本工具调用做得也不错。GLM-4-flash 适合做高频低成本任务（比如分类、关键词抽取）。

主要用途：双语对话、结构化输出、低成本批处理
上下文长度：128K tokens
调用 model 名：glm-4.5、glm-4.5-air、glm-4-flash
典型客户端：所有 OpenAI 兼容客户端

Kimi · 月之暗面 Moonshot

月之暗面的 Kimi 起家就是长上下文，moonshot-v1-128k 和 moonshot-v1-1m 适合喂整本书、整个代码仓库做问答。新版 kimi-k1 在推理能力上跟上了，但价格还是 Kimi 系列里偏贵的，按需选用。

主要用途：超长文档分析、整本书 / 整库 QA、研究综述
上下文长度：128K-1M tokens
调用 model 名：moonshot-v1-128k、moonshot-v1-1m、kimi-k1
典型客户端：所有 OpenAI 兼容客户端

怎么调用

所有模型都走 OpenAI 兼容协议，你只需要改两个地方：base_url 指向 https://we2ai.ai/v1、api_key 用你在 We2AI 后台创建的令牌。model 字段填上面表格里的对应名字。

Python（openai SDK）

from openai import OpenAI

client = OpenAI(
    base_url="https://we2ai.ai/v1",
    api_key="sk-YOUR_WE2AI_TOKEN",
)

resp = client.chat.completions.create(
    model="deepseek-chat",
    messages=[{"role": "user", "content": "用一句话介绍你自己"}],
)
print(resp.choices[0].message.content)

cURL

curl https://we2ai.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-YOUR_WE2AI_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen-plus",
    "messages": [{"role":"user","content":"hi"}]
  }'

Node.js

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://we2ai.ai/v1",
  apiKey: process.env.WE2AI_TOKEN,
});

const r = await client.chat.completions.create({
  model: "glm-4.5",
  messages: [{ role: "user", content: "hi" }],
});
console.log(r.choices[0].message.content);

哪些模型暂时没接

OpenAI GPT、Anthropic Claude、Google Gemini —— 三家境外模型暂不接入，原因是合规。后续会通过 Azure OpenAI / AWS Bedrock 等正规渠道引入。如果你的工作流非要 GPT-4 或 Claude，目前推荐另开账户走官方接口。

价格 / 计费方式

所有模型都按 1M tokens 计费（输入 / 输出独立计价），实时扣费、最小单位 1 token、调用失败不扣费。详细单价见后台「定价」页或首页价格区。