LLM 接口
接口层负责处理模型通信、密钥轮换和速率限制。OpenAICompatible
适用于任何实现了 OpenAI Chat Completions API 的提供商:OpenAIResponsesCompatible
适用于实现了 OpenAI Responses API 的提供商:- 将系统提示词映射到
instructions字段 - 处理 Responses 特有的流式事件
- 支持
reasoning={...}kwargs 来控制推理力度 - 工具调用的协议格式不同
APIKeyPool
通过轮询机制管理多个密钥:速率限制
内置令牌桶速率限制器:OpenAICompatible 实例可以有不同的速率限制。
传递 LLM kwargs
额外参数会被转发给提供商:上下文窗口
设置context_window 以启用依赖模型容量信息的框架功能: