接口 API 参考
LLM_Interface (ABC)
构造函数
抽象方法
| 方法 | 签名 | 描述 |
|---|---|---|
chat | async def chat(*, trace_id, stream=False, messages, timeout=None, **kwargs) | 非流式调用 |
chat_stream | async def chat_stream(*, trace_id, stream=True, messages, timeout=None, **kwargs) -> AsyncGenerator | 流式调用 |
属性
| 属性 | 类型 | 描述 |
|---|---|---|
model_name | str | 模型标识符 |
base_url | str | None | API 端点 |
context_window | int | 上下文窗口大小(以 token 为单位) |
api_key_pool | APIKeyPool | API 密钥轮换池 |
OpenAICompatible
构造函数
类方法
| 方法 | 返回值 | 描述 |
|---|---|---|
load_from_json_file(path) | Dict[str, Dict[str, OpenAICompatible]] | 从 provider.json 加载所有模型 |
实例方法
| 方法 | 返回值 | 描述 |
|---|---|---|
get_rate_limit_status() | Dict[str, Any] | 当前速率限制器状态 |
reset_rate_limit() | None | 重置令牌桶 |
示例
OpenAIResponsesCompatible
OpenAICompatible 相同。
与 OpenAICompatible 的区别
| 方面 | OpenAICompatible | OpenAIResponsesCompatible |
|---|---|---|
| 系统提示词 | messages[0].role="system" | instructions 字段 |
| 流式格式 | Chat Completion 数据块 | Responses 流事件 |
| 推理支持 | 不适用 | reasoning={...} kwargs |
| 传输协议 | Chat Completions API | Responses API |
示例
APIKeyPool
构造函数
示例
TokenBucket
构造函数
| 参数 | 描述 |
|---|---|
capacity | 桶中最大令牌数 |
refill_rate | 每秒补充的令牌数 |
OpenAICompatible 内部使用。暴露给外部以便自定义实现。