维护咨询 大模型部署 问题解决 技能定制 大模型训练
Hermes支持连接各种AI模型提供商:OpenAI、Anthropic、OpenRouter、本地模型等。本文讲清楚怎么配置每种provider,以及怎么在不同模型之间切换。
## 支持的模型提供商
OpenAI # GPT-4o、GPT-4o-mini、GPT-4
Anthropic # Claude 3.5 Sonnet、Claude 3 Haiku
OpenRouter # 聚合50+模型,一个API Key访问全部
Ollama # 本地开源模型(Llama、Qwen、Mistral等)
LocalAI # 自建模型服务
Azure OpenAI # 企业Azure部署
—
## OpenAI配置
# config.yaml
model:
provider: openai
model: gpt-4o # 或 gpt-4o-mini、gpt-4
# 环境变量
OPENAI_API_KEY=sk-xxxx
常用模型选择:
GPT-4o # 最强,反应最快
GPT-4o-mini # 性价比高,适合简单任务
GPT-4-turbo # 便宜但稍慢
—
## Anthropic配置
# config.yaml
model:
provider: anthropic
model: claude-3-5-sonnet-20240620
# 环境变量
ANTHROPIC_API_KEY=sk-ant-xxxx
常用模型选择:
Claude 3.5 Sonnet # 最推荐,性价比最高
Claude 3 Opus # 最强,但贵
Claude 3 Haiku # 最便宜,适合简单任务
—
## OpenRouter配置(强烈推荐)
OpenRouter是一个聚合平台,一个API Key可以访问50+模型,还能自动选最便宜的。
# config.yaml
model:
provider: openrouter
model: anthropic/claude-3.5-sonnet # 指定模型
# 或者用 auto 让平台自动选最便宜的
# model: auto
# 环境变量
OPENROUTER_API_KEY=sk-or-xxxx
OpenRouter热门模型:
anthropic/claude-3.5-sonnet # 性价比最高
openai/gpt-4o # 最强GPT
google/gemini-pro-1.5 # 谷歌最强
meta-llama/llama-3-70b-instruct # 开源最强
mistralai/mistral-large-2 # 欧洲最强
查看模型价格和排名:
访问 https://openrouter.ai/models 可以看到所有模型的价格、排名、速度评分。
—
## Ollama本地模型
Ollama让你在本地跑开源模型,数据完全不出门。
安装Ollama:
curl -fsSL https://ollama.com/install.sh | bash
# 下载模型
ollama pull llama3
ollama pull qwen2.5
ollama pull mistral
启动Ollama服务:
ollama serve
# 默认在 http://localhost:11434
配置Hermes连接Ollama:
# config.yaml
model:
provider: openai-compatible
api_base: "http://localhost:11434/v1"
model: llama3
api_key: "ollama" # 任意字符串
# 或者用环境变量
OLLAMA_API_BASE=http://localhost:11434/v1
OLLAMA_MODEL=llama3
—
## 多模型切换
在对话中切换模型:
/model gpt-4o
帮我写一个排序算法
/model claude-3-5-sonnet
这个代码有什么问题?
为不同任务配置不同模型:
# ~/.hermes/profiles/coding/config.yaml
model:
provider: openrouter
model: anthropic/claude-3.5-sonnet
# ~/.hermes/profiles/research/config.yaml
model:
provider: openrouter
model: google/gemini-pro-1.5
—
## 模型参数调优
# config.yaml
model:
provider: openrouter
model: anthropic/claude-3.5-sonnet
parameters:
temperature: 0.7 # 创造性(0-2,越高越随机)
top_p: 0.9 # 采样范围
max_tokens: 4096 # 最大输出长度
frequency_penalty: 0.0 # 频率惩罚(避免重复)
presence_penalty: 0.0 # 存在惩罚(鼓励话题扩展)
参数建议:
创意写作 → temperature 1.0-1.5
技术文档 → temperature 0.3-0.5
代码生成 → temperature 0.2-0.4
数据提取 → temperature 0.0-0.2
—
## 常见问题
Q:哪个模型最便宜?
A:DeepSeek V3最便宜($0.1/1M),但效果不如Claude。性价比最高是Claude 3.5 Haiku($0.25/1M输入)。
Q:本地模型和API模型效果差多少?
A:Llama 3 70B大概相当于GPT-3.5水平,比GPT-4和Claude 3.5 Sonnet差一个档次。本地模型适合简单任务和隐私要求高的场景。
Q:OpenRouter安全吗?
A:OpenRouter是正规平台,数据处理遵循标准流程。如果对数据安全要求极高,用Ollama本地部署。
Q:可以同时用多个模型吗?
A:可以。不同对话用不同模型,或者用Subagent同时调用多个模型。
—
## 相关文章








暂无评论内容