Documentation Index
Fetch the complete documentation index at: https://docs.laozhang.ai/llms.txt
Use this file to discover all available pages before exploring further.
模型简介
OpenAI是全球领先的AI公司,其GPT系列模型在老张API平台上完全可用。本指南将详细介绍如何使用 GPT-5.5、GPT-5、GPT-4.1、o3/o4 等系列模型,帮助你充分发挥这些顶级AI模型的能力。
🚀 模型概览
GPT-5 / GPT-4.1系列
稳定通用模型,覆盖生产和成本敏感场景
GPT-5.5 系列
GPT-5.5 是 OpenAI 当前旗舰模型,适合复杂专业工作、代码生成、长上下文分析和高质量内容生产。
🔥 GPT-5.5 (推荐)
模型ID: gpt-5.5
特点:
- 🎯 最新旗舰模型,综合能力强
- 📚 支持 1M 上下文
- 🖼️ 支持图像理解和生成
- 🌍 优秀的多语言能力
- 💻 适合复杂代码和 Agent 任务
价格: 以控制台实时定价为准
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://api.laozhang.ai/v1"
)
# 基础文本对话
response = client.chat.completions.create(
model="gpt-5.5",
messages=[
{"role": "system", "content": "你是一个专业的AI助手"},
{"role": "user", "content": "请解释什么是量子计算"}
],
temperature=0.7
)
print(response.choices[0].message.content)
🎯 GPT-5.5 图像理解
GPT-5.5 可以理解和分析图像内容:
response = client.chat.completions.create(
model="gpt-5.5",
messages=[
{
"role": "user",
"content": [
{
"type": "text",
"text": "请详细描述这张图片的内容,并分析其中的设计元素"
},
{
"type": "image_url",
"image_url": {
"url": "https://example.com/image.jpg",
"detail": "high" # high/low/auto
}
}
]
}
],
max_tokens=500
)
print(response.choices[0].message.content)
⚡ GPT-4o Mini (轻量快速)
模型ID: gpt-4o-mini
特点:
- 💰 适合成本敏感任务:输入仅 $0.15/1M tokens
- 🚀 响应速度更快
- 🎯 保持GPT-4o的核心能力
- 💡 适合大规模应用
价格: 以控制台实时定价为准
# GPT-4o Mini 特别适合日常对话和批量处理
response = client.chat.completions.create(
model="gpt-4o-mini",
messages=[
{"role": "system", "content": "你是一个友好的客服助手"},
{"role": "user", "content": "我想了解你们的服务"}
],
temperature=0.3
)
📅 GPT-4o 特定版本
模型ID: gpt-4o
使用特定日期版本确保结果的一致性:
response = client.chat.completions.create(
model="gpt-4o",
messages=[
{"role": "user", "content": "请写一篇关于AI发展的文章"}
],
temperature=0.5 # 较低温度确保一致性
)
GPT-5 / GPT-4.1 系列
稳定通用模型系列,适合生产环境、兼容旧项目和成本敏感任务。
🧠 GPT-5.5
模型ID: gpt-5.5
特点:
- 🚀 更快的响应速度
- 📚 支持 1M 上下文长度
- 💡 优秀的推理能力
- 🔧 适合复杂任务
价格: 以控制台实时定价为准
# 处理长文档分析
long_document = """
[这里是一篇很长的文档内容...]
"""
response = client.chat.completions.create(
model="gpt-5.5",
messages=[
{
"role": "system",
"content": "你是一个专业的文档分析师,请仔细分析文档内容并提供深入见解"
},
{
"role": "user",
"content": f"请分析以下文档的核心观点和结论:\n\n{long_document}"
}
],
temperature=0.3
)
🏛️ GPT-4.1 经典版
模型ID: gpt-4.1
经典稳定模型,在创意写作和复杂推理方面表现优异:
# 创意写作任务
response = client.chat.completions.create(
model="gpt-4.1",
messages=[
{
"role": "system",
"content": "你是一个富有创意的作家,擅长创作引人入胜的故事"
},
{
"role": "user",
"content": "请写一个关于时间旅行的科幻短故事,要求有意想不到的结局"
}
],
temperature=0.9, # 高温度增加创意性
max_tokens=1000
)
📖 GPT-4.1 Mini
模型ID: gpt-4.1-mini
更轻量的通用模型,适合低延迟和成本敏感场景:
# 处理超长代码审查
large_codebase = """
[这里是大量的代码内容...]
"""
response = client.chat.completions.create(
model="gpt-4.1-mini",
messages=[
{
"role": "system",
"content": "你是一个资深的代码审查专家"
},
{
"role": "user",
"content": f"请审查以下代码,指出潜在问题和改进建议:\n\n{large_codebase}"
}
],
temperature=0.2
)
o3 / o4 推理模型
o3 / o4 系列是 OpenAI 专为复杂推理任务设计的模型,在数学、编程、科学等领域表现卓越。
🎓 o3-pro
模型ID: o3-pro
特点:
- 🧮 强大的数学推理能力
- 🔬 科学问题解决能力
- 💻 复杂编程任务
- 🎯 多步骤逻辑推理
价格: 以控制台实时定价为准
推理模型可能有特殊限制:
- 不支持
temperature、top_p 等参数
- 不支持
system 角色消息
- 不支持流式输出
- 不支持函数调用
# 复杂数学问题
response = client.chat.completions.create(
model="o3-pro",
messages=[
{
"role": "user",
"content": """
解决这个数学问题:
一个正整数n,满足以下条件:
1. n是4位数
2. n的各位数字之和等于20
3. n是质数
4. n的各位数字都不相同
请找出所有满足条件的n,并说明解题思路。
"""
}
]
)
print(response.choices[0].message.content)
🚀 o4-mini
模型ID: o4-mini
轻量版的推理模型,成本更低:
价格: 以控制台实时定价为准
# 中等复杂度的逻辑推理
response = client.chat.completions.create(
model="o4-mini",
messages=[
{
"role": "user",
"content": """
有A、B、C、D四个人,其中有一个人说谎,其他人说真话。
A说:B是说谎者
B说:C是说谎者
C说:D是说谎者
D说:A是说谎者
请推理出谁是说谎者,并说明推理过程。
"""
}
]
)
🔬 O3 (最新推理模型)
模型ID: o3
最新的推理模型,能力更强:
价格: 以控制台实时定价为准
# 超复杂科学问题
response = client.chat.completions.create(
model="o3",
messages=[
{
"role": "user",
"content": """
请分析以下化学反应的机理,并预测在不同条件下的产物:
在催化剂存在下,化合物A (C₈H₁₀O₂) 与化合物B (C₄H₆O₃)
在180°C和2大气压下反应。已知A含有苯环和酯基,B含有烯烃双键。
请提供:
1. 详细的反应机理
2. 主要产物的结构
3. 副反应的可能性
4. 反应条件对产物的影响
"""
}
]
)
GPT-4o 系列(经典多模态)
GPT-4o 系列适合需要兼容旧项目、多模态输入和快速响应的场景。新项目建议优先评估 gpt-5.5 或 gpt-4.1-mini。
⚡ GPT-4o Mini
模型ID: gpt-4o-mini
特点:
- 💰 适合成本敏感任务
- 🚀 响应速度快
- 📱 适合移动应用
- 🔄 适合高频调用
价格: 以控制台实时定价为准
# 高频简单任务,如翻译、摘要等
response = client.chat.completions.create(
model="gpt-4o-mini",
messages=[
{
"role": "system",
"content": "你是一个专业的翻译专家"
},
{
"role": "user",
"content": "请将以下英文翻译成中文:'The future of artificial intelligence looks promising.'"
}
],
temperature=0.3
)
使用技巧和最佳实践
1. 选择合适的模型
推荐: GPT-5.5、GPT-4o Mini# 简单对话可先选轻量模型
model = "gpt-4o-mini"
temperature = 0.7 # 自然对话
推荐: GPT-5.5、GPT-4.1# 代码生成和调试
model = "gpt-5.5" # 最新代码能力
temperature = 0.2 # 精确性优先
max_tokens = 2000 # 足够长的代码
推荐: o3-pro, o4-mini# 数学、逻辑、科学问题
model = "o3-pro" # 最强推理能力
# 注意:推理模型可能不支持temperature等参数
推荐: GPT-5.5、GPT-4o# 图像分析和理解
model = "gpt-5.5" # 最新多模态能力
detail = "high" # 高清晰度分析
2. 优化提示词
# 好的系统消息示例
system_prompt = """
你是一个专业的Python编程专家,具有以下特点:
1. 代码风格遵循PEP8规范
2. 注重代码可读性和性能
3. 提供详细的注释和说明
4. 给出多种解决方案对比
请用简洁明了的语言回答,并提供可执行的代码示例。
"""
3. 参数调优
- 0.0-0.3: 需要精确、一致的输出(代码、数据分析)
- 0.4-0.7: 平衡创造性和准确性(日常对话)
- 0.8-1.0: 需要创造性和多样性(创意写作)
# 不同任务的温度设置
code_generation = {"temperature": 0.2}
casual_chat = {"temperature": 0.7}
creative_writing = {"temperature": 0.9}
根据任务类型设置合适的输出长度:token_limits = {
"简短回答": 100,
"详细解释": 500,
"代码生成": 2000,
"长文档": 4000
}
使用停止序列控制输出格式:# 生成列表时的停止序列
response = client.chat.completions.create(
model="gpt-4o",
messages=[...],
stop=["6.", "\n\n", "总结:"]
)
4. 成本优化策略
渐进式模型选择
先用轻量模型测试,再用高级模型优化# 先用GPT-4o Mini测试
# 再用GPT-4o完善
智能缓存
对重复请求进行缓存,避免重复计费import hashlib
cache = {}
def cached_completion(prompt):
key = hashlib.md5(prompt.encode()).hexdigest()
if key in cache:
return cache[key]
# 调用API...
批量处理
将多个简单任务合并为一个请求# 合并多个翻译任务
batch_prompt = """
请翻译以下句子:
1. Hello world
2. Good morning
3. Thank you
"""
精确控制长度
设置合适的max_tokens避免浪费# 根据任务设置精确的token限制
max_tokens = estimate_needed_tokens(task_type)
错误处理和重试
import time
import random
from openai import OpenAI
def robust_completion(client, **kwargs):
"""带重试机制的API调用"""
max_retries = 3
base_delay = 1
for attempt in range(max_retries):
try:
response = client.chat.completions.create(**kwargs)
return response
except Exception as e:
if attempt == max_retries - 1:
raise e
# 指数退避重试
delay = base_delay * (2 ** attempt) + random.uniform(0, 1)
print(f"重试 {attempt + 1}/{max_retries},等待 {delay:.2f} 秒...")
time.sleep(delay)
# 使用示例
try:
response = robust_completion(
client,
model="gpt-4o",
messages=[{"role": "user", "content": "Hello!"}]
)
except Exception as e:
print(f"API调用失败: {e}")
流式响应处理
对于长文本生成,建议使用流式响应提升用户体验:
def stream_completion(client, **kwargs):
"""流式响应处理"""
kwargs['stream'] = True
try:
stream = client.chat.completions.create(**kwargs)
for chunk in stream:
if chunk.choices[0].delta.content is not None:
content = chunk.choices[0].delta.content
print(content, end='', flush=True)
yield content
except Exception as e:
print(f"流式响应错误: {e}")
# 使用示例
for chunk in stream_completion(
client,
model="gpt-4o",
messages=[{"role": "user", "content": "写一篇关于AI的文章"}]
):
# 实时处理每个文本块
pass
探索Claude模型
了解Claude系列模型的独特优势和使用方法
查看完整模型列表
浏览老张API支持的所有200+AI模型