claude-api

Compare original and translation side by side

🇺🇸

Original

English

🇨🇳

Translation

Chinese

Claude API (Anthropic Messages API)

Claude API（Anthropic Messages API）

Status: Production Ready Last Updated: 2025-10-25 Dependencies: None (standalone API skill) Latest Versions: @anthropic-ai/sdk@0.67.0

状态：可用于生产环境 最后更新：2025-10-25 依赖：无（独立API技能） 最新版本：@anthropic-ai/sdk@0.67.0

Quick Start (5 Minutes)

快速入门（5分钟）

1. Get API Key

1. 获取API密钥

bash

undefined

bash

undefined

Sign up at https://console.anthropic.com/

在 https://console.anthropic.com/ 注册账号

Navigate to API Keys section

进入API密钥页面

Create new key and save securely

创建新密钥并安全保存

export ANTHROPIC_API_KEY="sk-ant-..."


**Why this matters:**
- API key required for all requests
- Keep secure (never commit to git)
- Use environment variables

export ANTHROPIC_API_KEY="sk-ant-..."


**重要性说明**：
- 所有请求都需要API密钥
- 务必妥善保管（绝不要提交到git）
- 使用环境变量存储

2. Install SDK (Node.js)

2. 安装SDK（Node.js）

bash

npm install @anthropic-ai/sdk

typescript

import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const message = await anthropic.messages.create({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1024,
  messages: [{ role: 'user', content: 'Hello, Claude!' }],
});

console.log(message.content[0].text);

CRITICAL:

Always use server-side (never expose API key in client code)
Set
```
max_tokens
```
(required parameter)
Model names are versioned (use latest stable)

bash

npm install @anthropic-ai/sdk

typescript

import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const message = await anthropic.messages.create({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1024,
  messages: [{ role: 'user', content: 'Hello, Claude!' }],
});

console.log(message.content[0].text);

关键注意事项：

务必仅在服务端使用（绝不要在客户端代码中暴露API密钥）
必须设置
```
max_tokens
```
参数
模型名称带有版本号（请使用最新稳定版）

3. Or Use Direct API (Cloudflare Workers)

3. 或直接使用API（Cloudflare Workers）

typescript

// No SDK needed - use fetch()
const response = await fetch('https://api.anthropic.com/v1/messages', {
  method: 'POST',
  headers: {
    'x-api-key': env.ANTHROPIC_API_KEY,
    'anthropic-version': '2023-06-01',
    'content-type': 'application/json',
  },
  body: JSON.stringify({
    model: 'claude-sonnet-4-5-20250929',
    max_tokens: 1024,
    messages: [{ role: 'user', content: 'Hello!' }],
  }),
});

const data = await response.json();

typescript

// 无需SDK - 使用fetch()
const response = await fetch('https://api.anthropic.com/v1/messages', {
  method: 'POST',
  headers: {
    'x-api-key': env.ANTHROPIC_API_KEY,
    'anthropic-version': '2023-06-01',
    'content-type': 'application/json',
  },
  body: JSON.stringify({
    model: 'claude-sonnet-4-5-20250929',
    max_tokens: 1024,
    messages: [{ role: 'user', content: 'Hello!' }],
  }),
});

const data = await response.json();

The Complete Claude API Reference

完整Claude API参考

Core API (Messages API)

核心API（Messages API）

Available Models (October 2025)

可用模型（2025年10月）

Model	ID	Context	Best For	Cost (per MTok)
Claude Sonnet 4.5	claude-sonnet-4-5-20250929	200k tokens	Balanced performance	$3/$15 (in/out)
Claude 3.7 Sonnet	claude-3-7-sonnet-20250228	2M tokens	Extended thinking	$3/$15
Claude Opus 4	claude-opus-4-20250514	200k tokens	Highest capability	$15/$75
Claude 3.5 Haiku	claude-3-5-haiku-20241022	200k tokens	Fast, cost-effective	$1/$5

模型	ID	上下文窗口	最佳适用场景	成本（每百万令牌）
Claude Sonnet 4.5	claude-sonnet-4-5-20250929	20万令牌	平衡性能	$3/$15（输入/输出）
Claude 3.7 Sonnet	claude-3-7-sonnet-20250228	200万令牌	扩展思考	$3/$15
Claude Opus 4	claude-opus-4-20250514	20万令牌	最高能力	$15/$75
Claude 3.5 Haiku	claude-3-5-haiku-20241022	20万令牌	快速、高性价比	$1/$5

Basic Message Creation

基础消息创建

typescript

import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const message = await anthropic.messages.create({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1024,
  messages: [
    { role: 'user', content: 'Explain quantum computing in simple terms' }
  ],
});

console.log(message.content[0].text);

typescript

import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const message = await anthropic.messages.create({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1024,
  messages: [
    { role: 'user', content: '用简单的语言解释量子计算' }
  ],
});

console.log(message.content[0].text);

Multi-Turn Conversations

多轮对话

typescript

const messages = [
  { role: 'user', content: 'What is the capital of France?' },
  { role: 'assistant', content: 'The capital of France is Paris.' },
  { role: 'user', content: 'What is its population?' },
];

const message = await anthropic.messages.create({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1024,
  messages,
});

typescript

const messages = [
  { role: 'user', content: '法国的首都是什么？' },
  { role: 'assistant', content: '法国的首都是巴黎。' },
  { role: 'user', content: '它的人口是多少？' },
];

const message = await anthropic.messages.create({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1024,
  messages,
});

System Prompts

系统提示词

typescript

const message = await anthropic.messages.create({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1024,
  system: 'You are a helpful Python coding assistant. Always provide type hints and docstrings.',
  messages: [
    { role: 'user', content: 'Write a function to sort a list' }
  ],
});

CRITICAL:

System prompt MUST come before messages array
System prompt sets behavior for entire conversation
Can be 1-10k tokens (affects context window)

typescript

const message = await anthropic.messages.create({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1024,
  system: '你是一个乐于助人的Python编程助手。请始终提供类型提示和文档字符串。',
  messages: [
    { role: 'user', content: '写一个排序列表的函数' }
  ],
});

关键注意事项：

系统提示词必须放在messages数组之前
系统提示词会设置整个对话的行为模式
长度可为1-10000令牌（会影响上下文窗口）

Streaming Responses (SSE)

流式响应（SSE）

Using SDK Stream Helper

使用SDK流助手

typescript

const stream = anthropic.messages.stream({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1024,
  messages: [{ role: 'user', content: 'Write a short story' }],
});

// Method 1: Event listeners
stream
  .on('text', (text) => {
    process.stdout.write(text);
  })
  .on('message', (message) => {
    console.log('\n\nFinal message:', message);
  })
  .on('error', (error) => {
    console.error('Stream error:', error);
  });

// Wait for completion
await stream.finalMessage();

typescript

const stream = anthropic.messages.stream({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1024,
  messages: [{ role: 'user', content: '写一个短篇故事' }],
});

// 方法1：事件监听器
stream
  .on('text', (text) => {
    process.stdout.write(text);
  })
  .on('message', (message) => {
    console.log('\
\
最终消息:', message);
  })
  .on('error', (error) => {
    console.error('流错误:', error);
  });

// 等待完成
await stream.finalMessage();

Streaming with Manual Iteration

手动迭代流式响应

typescript

const stream = await anthropic.messages.create({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1024,
  messages: [{ role: 'user', content: 'Explain AI' }],
  stream: true,
});

for await (const event of stream) {
  if (event.type === 'content_block_delta' && event.delta.type === 'text_delta') {
    process.stdout.write(event.delta.text);
  }
}

typescript

const stream = await anthropic.messages.create({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1024,
  messages: [{ role: 'user', content: '解释AI' }],
  stream: true,
});

for await (const event of stream) {
  if (event.type === 'content_block_delta' && event.delta.type === 'text_delta') {
    process.stdout.write(event.delta.text);
  }
}

Streaming Event Types

流式事件类型

Event	When	Use Case
`message_start`	Message begins	Initialize UI
`content_block_start`	New content block	Track blocks
`content_block_delta`	Text chunk received	Display text
`content_block_stop`	Block complete	Format block
`message_delta`	Metadata update	Update stop reason
`message_stop`	Message complete	Finalize UI

事件	触发时机	使用场景
`message_start`	消息开始时	初始化UI
`content_block_start`	新内容块开始时	跟踪内容块
`content_block_delta`	收到文本片段时	显示文本
`content_block_stop`	内容块完成时	格式化内容块
`message_delta`	元数据更新时	更新停止原因
`message_stop`	消息完成时	完成UI渲染

Cloudflare Workers Streaming

Cloudflare Workers流式实现

typescript

export default {
  async fetch(request: Request, env: Env): Promise<Response> {
    const response = await fetch('https://api.anthropic.com/v1/messages', {
      method: 'POST',
      headers: {
        'x-api-key': env.ANTHROPIC_API_KEY,
        'anthropic-version': '2023-06-01',
        'content-type': 'application/json',
      },
      body: JSON.stringify({
        model: 'claude-sonnet-4-5-20250929',
        max_tokens: 1024,
        messages: [{ role: 'user', content: 'Hello!' }],
        stream: true,
      }),
    });

    // Return SSE stream directly
    return new Response(response.body, {
      headers: {
        'Content-Type': 'text/event-stream',
        'Cache-Control': 'no-cache',
        'Connection': 'keep-alive',
      },
    });
  },
};

CRITICAL:

Errors can occur AFTER initial 200 response
Always implement error event handlers
Use
```
stream.abort()
```
to cancel
Set proper Content-Type headers

typescript

export default {
  async fetch(request: Request, env: Env): Promise<Response> {
    const response = await fetch('https://api.anthropic.com/v1/messages', {
      method: 'POST',
      headers: {
        'x-api-key': env.ANTHROPIC_API_KEY,
        'anthropic-version': '2023-06-01',
        'content-type': 'application/json',
      },
      body: JSON.stringify({
        model: 'claude-sonnet-4-5-20250929',
        max_tokens: 1024,
        messages: [{ role: 'user', content: 'Hello!' }],
        stream: true,
      }),
    });

    // 直接返回SSE流
    return new Response(response.body, {
      headers: {
        'Content-Type': 'text/event-stream',
        'Cache-Control': 'no-cache',
        'Connection': 'keep-alive',
      },
    });
  },
};

关键注意事项：

错误可能在初始200响应之后发生
务必实现错误事件处理器
使用
```
stream.abort()
```
取消流
设置正确的Content-Type头

Prompt Caching (⭐ 90% Cost Savings)

提示缓存（⭐ 节省90%成本）

Overview

概述

Prompt caching allows you to cache frequently used context (system prompts, documents, codebases) to:

Reduce costs by 90% (cache reads = 10% of input token price)
Reduce latency by 85% (time to first token)
Cache lifetime: 5 minutes (default) or 1 hour (configurable)

提示缓存允许您缓存频繁使用的上下文（系统提示词、文档、代码库），以实现：

降低90%成本（缓存读取的成本为输入令牌价格的10%）
降低85%延迟（首令牌响应时间）
缓存生命周期：默认5分钟，可配置为1小时

Minimum Requirements

最低要求

Claude 3.5 Sonnet: 1,024 tokens minimum
Claude 3.5 Haiku: 2,048 tokens minimum

Claude 3.5 Sonnet：至少1024令牌
Claude 3.5 Haiku：至少2048令牌

Basic Prompt Caching

基础提示缓存

typescript

const message = await anthropic.messages.create({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1024,
  system: [
    {
      type: 'text',
      text: 'You are an AI assistant analyzing the following codebase...',
    },
    {
      type: 'text',
      text: LARGE_CODEBASE_CONTENT, // 50k tokens
      cache_control: { type: 'ephemeral' },
    },
  ],
  messages: [
    { role: 'user', content: 'Explain the auth module' }
  ],
});

// Check cache usage
console.log('Cache read tokens:', message.usage.cache_read_input_tokens);
console.log('Cache creation tokens:', message.usage.cache_creation_input_tokens);

typescript

const message = await anthropic.messages.create({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1024,
  system: [
    {
      type: 'text',
      text: '您是一个分析以下代码库的AI助手...',
    },
    {
      type: 'text',
      text: LARGE_CODEBASE_CONTENT, // 5万令牌
      cache_control: { type: 'ephemeral' },
    },
  ],
  messages: [
    { role: 'user', content: '解释认证模块' }
  ],
});

// 检查缓存使用情况
console.log('缓存读取令牌数:', message.usage.cache_read_input_tokens);
console.log('缓存创建令牌数:', message.usage.cache_creation_input_tokens);

Caching in Messages

消息中的缓存

typescript

const message = await anthropic.messages.create({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1024,
  messages: [
    {
      role: 'user',
      content: [
        {
          type: 'text',
          text: 'Analyze this documentation:',
        },
        {
          type: 'text',
          text: LONG_DOCUMENTATION, // 20k tokens
          cache_control: { type: 'ephemeral' },
        },
        {
          type: 'text',
          text: 'What are the main API endpoints?',
        },
      ],
    },
  ],
});

typescript

const message = await anthropic.messages.create({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1024,
  messages: [
    {
      role: 'user',
      content: [
        {
          type: 'text',
          text: '分析这份文档:',
        },
        {
          type: 'text',
          text: LONG_DOCUMENTATION, // 2万令牌
          cache_control: { type: 'ephemeral' },
        },
        {
          type: 'text',
          text: '主要的API端点有哪些？',
        },
      ],
    },
  ],
});

Multi-Turn Caching (Chatbot Pattern)

多轮对话缓存（聊天机器人模式）

typescript

// First request - creates cache
const message1 = await anthropic.messages.create({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1024,
  system: [
    {
      type: 'text',
      text: SYSTEM_INSTRUCTIONS,
      cache_control: { type: 'ephemeral' },
    },
  ],
  messages: [
    { role: 'user', content: 'Hello!' }
  ],
});

// Second request - hits cache (within 5 minutes)
const message2 = await anthropic.messages.create({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1024,
  system: [
    {
      type: 'text',
      text: SYSTEM_INSTRUCTIONS, // Same content = cache hit
      cache_control: { type: 'ephemeral' },
    },
  ],
  messages: [
    { role: 'user', content: 'Hello!' },
    { role: 'assistant', content: message1.content[0].text },
    { role: 'user', content: 'Tell me a joke' },
  ],
});

typescript

// 第一次请求 - 创建缓存
const message1 = await anthropic.messages.create({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1024,
  system: [
    {
      type: 'text',
      text: SYSTEM_INSTRUCTIONS,
      cache_control: { type: 'ephemeral' },
    },
  ],
  messages: [
    { role: 'user', content: '你好！' }
  ],
});

// 第二次请求 - 命中缓存（5分钟内）
const message2 = await anthropic.messages.create({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1024,
  system: [
    {
      type: 'text',
      text: SYSTEM_INSTRUCTIONS, // 内容完全相同 = 缓存命中
      cache_control: { type: 'ephemeral' },
    },
  ],
  messages: [
    { role: 'user', content: '你好！' },
    { role: 'assistant', content: message1.content[0].text },
    { role: 'user', content: '讲个笑话' },
  ],
});

Cost Comparison

成本对比

Without Caching:
- 100k input tokens = 100k × $3/MTok = $0.30

With Caching (after first request):
- Cache write: 100k × $3.75/MTok = $0.375 (first request)
- Cache read: 100k × $0.30/MTok = $0.03 (subsequent requests)
- Savings: 90% per request after first

CRITICAL:

```
cache_control
```
MUST be on LAST block of cacheable content
Cache shared across requests with IDENTICAL content

Monitor

cache_creation_input_tokens

cache_read_input_tokens

5-minute TTL refreshes on each use

无缓存：
- 10万输入令牌 = 10万 × $3/百万令牌 = $0.30

有缓存（首次请求后）：
- 缓存写入：10万 × $3.75/百万令牌 = $0.375（首次请求）
- 缓存读取：10万 × $0.30/百万令牌 = $0.03（后续请求）
- 节省：首次请求后每次可节省90%

关键注意事项：

```
cache_control
```
必须放在可缓存内容的最后一个块上
内容完全相同的请求会共享缓存

监控

cache_creation_input_tokens

与

cache_read_input_tokens

的对比

5分钟TTL会在每次使用时刷新

Tool Use (Function Calling)

工具调用（函数调用）

Basic Tool Definition

基础工具定义

typescript

const tools = [
  {
    name: 'get_weather',
    description: 'Get the current weather in a given location',
    input_schema: {
      type: 'object',
      properties: {
        location: {
          type: 'string',
          description: 'City name, e.g. San Francisco, CA',
        },
        unit: {
          type: 'string',
          enum: ['celsius', 'fahrenheit'],
          description: 'Temperature unit',
        },
      },
      required: ['location'],
    },
  },
];

const message = await anthropic.messages.create({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1024,
  tools,
  messages: [{ role: 'user', content: 'What is the weather in NYC?' }],
});

if (message.stop_reason === 'tool_use') {
  const toolUse = message.content.find(block => block.type === 'tool_use');
  console.log('Claude wants to use:', toolUse.name);
  console.log('With parameters:', toolUse.input);
}

typescript

const tools = [
  {
    name: 'get_weather',
    description: '获取指定地点的当前天气',
    input_schema: {
      type: 'object',
      properties: {
        location: {
          type: 'string',
          description: '城市名称，例如：San Francisco, CA',
        },
        unit: {
          type: 'string',
          enum: ['celsius', 'fahrenheit'],
          description: '温度单位',
        },
      },
      required: ['location'],
    },
  },
];

const message = await anthropic.messages.create({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1024,
  tools,
  messages: [{ role: 'user', content: '纽约的天气怎么样？' }],
});

if (message.stop_reason === 'tool_use') {
  const toolUse = message.content.find(block => block.type === 'tool_use');
  console.log('Claude想要使用:', toolUse.name);
  console.log('参数:', toolUse.input);
}

Tool Execution Loop

工具执行循环

typescript

async function chatWithTools(userMessage: string) {
  const messages = [{ role: 'user', content: userMessage }];

  while (true) {
    const response = await anthropic.messages.create({
      model: 'claude-sonnet-4-5-20250929',
      max_tokens: 1024,
      tools,
      messages,
    });

    // Add assistant response
    messages.push({
      role: 'assistant',
      content: response.content,
    });

    // Check if tools need to be executed
    if (response.stop_reason === 'tool_use') {
      const toolResults = [];

      for (const block of response.content) {
        if (block.type === 'tool_use') {
          // Execute tool
          const result = await executeToolFunction(block.name, block.input);

          toolResults.push({
            type: 'tool_result',
            tool_use_id: block.id,
            content: JSON.stringify(result),
          });
        }
      }

      // Add tool results
      messages.push({
        role: 'user',
        content: toolResults,
      });
    } else {
      // Final response
      return response.content.find(block => block.type === 'text')?.text;
    }
  }
}

typescript

async function chatWithTools(userMessage: string) {
  const messages = [{ role: 'user', content: userMessage }];

  while (true) {
    const response = await anthropic.messages.create({
      model: 'claude-sonnet-4-5-20250929',
      max_tokens: 1024,
      tools,
      messages,
    });

    // 添加助手响应
    messages.push({
      role: 'assistant',
      content: response.content,
    });

    // 检查是否需要执行工具
    if (response.stop_reason === 'tool_use') {
      const toolResults = [];

      for (const block of response.content) {
        if (block.type === 'tool_use') {
          // 执行工具
          const result = await executeToolFunction(block.name, block.input);

          toolResults.push({
            type: 'tool_result',
            tool_use_id: block.id,
            content: JSON.stringify(result),
          });
        }
      }

      // 添加工具结果
      messages.push({
        role: 'user',
        content: toolResults,
      });
    } else {
      // 最终响应
      return response.content.find(block => block.type === 'text')?.text;
    }
  }
}

Beta Tool Runner (SDK Helper)

Beta工具运行器（SDK助手）

typescript

import { betaZodTool } from '@anthropic-ai/sdk/helpers/zod';
import { z } from 'zod';

const weatherTool = betaZodTool({
  name: 'get_weather',
  inputSchema: z.object({
    location: z.string(),
    unit: z.enum(['celsius', 'fahrenheit']).optional(),
  }),
  description: 'Get the current weather in a given location',
  run: async (input) => {
    // Execute actual API call
    const weather = await fetchWeatherAPI(input.location, input.unit);
    return `The weather in ${input.location} is ${weather.temp}°${input.unit || 'F'}`;
  },
});

const finalMessage = await anthropic.beta.messages.toolRunner({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1000,
  messages: [{ role: 'user', content: 'What is the weather in San Francisco?' }],
  tools: [weatherTool],
});

console.log(finalMessage.content[0].text);

CRITICAL:

Tool schemas MUST be valid JSON Schema
```
tool_use_id
```
MUST match in
```
tool_result
```
Handle tool execution errors gracefully
Set reasonable
```
max_iterations
```
to prevent loops

typescript

import { betaZodTool } from '@anthropic-ai/sdk/helpers/zod';
import { z } from 'zod';

const weatherTool = betaZodTool({
  name: 'get_weather',
  inputSchema: z.object({
    location: z.string(),
    unit: z.enum(['celsius', 'fahrenheit']).optional(),
  }),
  description: '获取指定地点的当前天气',
  run: async (input) => {
    // 执行实际的API调用
    const weather = await fetchWeatherAPI(input.location, input.unit);
    return `${input.location}的天气是${weather.temp}°${input.unit || 'F'}`;
  },
});

const finalMessage = await anthropic.beta.messages.toolRunner({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1000,
  messages: [{ role: 'user', content: '旧金山的天气怎么样？' }],
  tools: [weatherTool],
});

console.log(finalMessage.content[0].text);

关键注意事项：

工具模式必须是有效的JSON Schema
```
tool_use_id
```
必须与
```
tool_result
```
中的ID匹配
优雅处理工具执行错误
设置合理的
```
max_iterations
```
以防止循环

Vision (Image Understanding)

视觉（图像理解）

Supported Image Formats

支持的图像格式

Formats: JPEG, PNG, WebP, GIF (non-animated)
Max size: 5MB per image
Input methods: Base64 encoded, URL (if accessible)

格式：JPEG、PNG、WebP、GIF（非动画）
最大尺寸：每张图片5MB
输入方式：Base64编码、可访问的URL

Single Image

单张图片

typescript

import fs from 'fs';

const imageData = fs.readFileSync('./photo.jpg', 'base64');

const message = await anthropic.messages.create({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1024,
  messages: [
    {
      role: 'user',
      content: [
        {
          type: 'image',
          source: {
            type: 'base64',
            media_type: 'image/jpeg',
            data: imageData,
          },
        },
        {
          type: 'text',
          text: 'What is in this image?',
        },
      ],
    },
  ],
});

typescript

import fs from 'fs';

const imageData = fs.readFileSync('./photo.jpg', 'base64');

const message = await anthropic.messages.create({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1024,
  messages: [
    {
      role: 'user',
      content: [
        {
          type: 'image',
          source: {
            type: 'base64',
            media_type: 'image/jpeg',
            data: imageData,
          },
        },
        {
          type: 'text',
          text: '这张图片里有什么？',
        },
      ],
    },
  ],
});

Multiple Images

多张图片

typescript

const message = await anthropic.messages.create({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1024,
  messages: [
    {
      role: 'user',
      content: [
        {
          type: 'text',
          text: 'Compare these two images:',
        },
        {
          type: 'image',
          source: {
            type: 'base64',
            media_type: 'image/jpeg',
            data: image1Data,
          },
        },
        {
          type: 'image',
          source: {
            type: 'base64',
            media_type: 'image/png',
            data: image2Data,
          },
        },
        {
          type: 'text',
          text: 'What are the differences?',
        },
      ],
    },
  ],
});

typescript

const message = await anthropic.messages.create({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1024,
  messages: [
    {
      role: 'user',
      content: [
        {
          type: 'text',
          text: '比较这两张图片:',
        },
        {
          type: 'image',
          source: {
            type: 'base64',
            media_type: 'image/jpeg',
            data: image1Data,
          },
        },
        {
          type: 'image',
          source: {
            type: 'base64',
            media_type: 'image/png',
            data: image2Data,
          },
        },
        {
          type: 'text',
          text: '有什么不同？',
        },
      ],
    },
  ],
});

Vision with Tools

结合工具的视觉能力

typescript

const message = await anthropic.messages.create({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1024,
  tools: [searchTool, saveTool],
  messages: [
    {
      role: 'user',
      content: [
        {
          type: 'image',
          source: {
            type: 'base64',
            media_type: 'image/jpeg',
            data: productImage,
          },
        },
        {
          type: 'text',
          text: 'Search for similar products and save the top 3 results',
        },
      ],
    },
  ],
});

CRITICAL:

Images count toward context window
Base64 encoding increases size (~33% overhead)
Validate image format before encoding
Consider caching for repeated image analysis

typescript

const message = await anthropic.messages.create({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1024,
  tools: [searchTool, saveTool],
  messages: [
    {
      role: 'user',
      content: [
        {
          type: 'image',
          source: {
            type: 'base64',
            media_type: 'image/jpeg',
            data: productImage,
          },
        },
        {
          type: 'text',
          text: '搜索相似产品并保存前3个结果',
        },
      ],
    },
  ],
});

关键注意事项：

图片会占用上下文窗口空间
Base64编码会增加大小（约33%的额外开销）
编码前验证图片格式
重复分析的图片可考虑使用缓存

Extended Thinking Mode

扩展思考模式

⚠️ Model Availability

⚠️ 模型可用性

Extended thinking is ONLY available in:

Claude 3.7 Sonnet (
```
claude-3-7-sonnet-20250228
```
)
Claude 4 models (Opus 4, Sonnet 4)

NOT available in Claude 3.5 Sonnet

扩展思考仅在以下模型中可用：

Claude 3.7 Sonnet (
```
claude-3-7-sonnet-20250228
```
)
Claude 4系列模型（Opus 4、Sonnet 4）

Claude 3.5 Sonnet不支持

How It Works

工作原理

Extended thinking allows Claude to "think out loud" before responding, showing its reasoning process. This is useful for:

Complex STEM problems (physics, mathematics)
Software debugging and architecture
Legal analysis and financial modeling
Multi-step reasoning tasks

扩展思考模式允许Claude在回复前“大声思考”，展示其推理过程。适用于：

复杂STEM问题（物理、数学）
软件调试与架构设计
法律分析与金融建模
多步骤推理任务

Basic Usage

基础用法

typescript

// Only works with Claude 3.7 Sonnet or Claude 4
const message = await anthropic.messages.create({
  model: 'claude-3-7-sonnet-20250228', // NOT claude-sonnet-4-5
  max_tokens: 4096, // Higher token limit for thinking
  messages: [
    {
      role: 'user',
      content: 'Solve this physics problem: A ball is thrown upward with velocity 20 m/s. How high does it go?'
    }
  ],
});

// Response includes thinking blocks
for (const block of message.content) {
  if (block.type === 'thinking') {
    console.log('Claude is thinking:', block.text);
  } else if (block.type === 'text') {
    console.log('Final answer:', block.text);
  }
}

typescript

// 仅适用于Claude 3.7 Sonnet或Claude 4
const message = await anthropic.messages.create({
  model: 'claude-3-7-sonnet-20250228', // 不是claude-sonnet-4-5
  max_tokens: 4096, // 思考过程需要更高的令牌限制
  messages: [
    {
      role: 'user',
      content: '解决这个物理问题：一个球以20 m/s的速度向上抛出。它能达到多高？'
    }
  ],
});

// 响应包含思考块
for (const block of message.content) {
  if (block.type === 'thinking') {
    console.log('Claude正在思考:', block.text);
  } else if (block.type === 'text') {
    console.log('最终答案:', block.text);
  }
}

Thinking vs Regular Response

思考模式与常规响应对比

Regular Response:
"The ball reaches a height of approximately 20.4 meters."

With Extended Thinking:
[Thinking block]: "I need to use kinematic equations. The relevant formula is v² = u² + 2as, where v=0 at max height, u=20 m/s, a=-9.8 m/s². Solving: 0 = 400 - 19.6s, so s = 400/19.6 = 20.4m"
[Text block]: "The ball reaches a height of approximately 20.4 meters."

CRITICAL:

Check model name before expecting extended thinking
Requires higher
```
max_tokens
```
(thinking consumes tokens)
Thinking blocks are NOT cacheable
Use only when reasoning depth is needed (costs more)

常规响应:
"球的最大高度约为20.4米。"

开启扩展思考模式:
[思考块]: "我需要使用运动学方程。相关公式是v² = u² + 2as，其中最高点v=0，u=20 m/s，a=-9.8 m/s²。计算：0 = 400 - 19.6s，所以s = 400/19.6 = 20.4m"
[文本块]: "球的最大高度约为20.4米。"

关键注意事项：

使用前检查模型名称
需要设置更高的
```
max_tokens
```
（思考过程会消耗令牌）
思考块不可缓存
仅在需要深度推理时使用（成本更高）

Rate Limits

速率限制

Understanding Rate Limits

理解速率限制

Claude API uses token bucket algorithm:

Capacity continuously replenishes (not fixed intervals)
Three types: Requests per minute (RPM), Tokens per minute (TPM), Tokens per day

Claude API使用令牌桶算法：

容量持续补充（非固定间隔）
三种类型限制：每分钟请求数（RPM）、每分钟令牌数（TPM）、每日令牌数

Rate Limit Tiers

速率限制层级

Tier	Criteria	Example Limits
Tier 1	New accounts	50 RPM, 40k TPM
Tier 2	$10 spend	1000 RPM, 100k TPM
Tier 3	$50 spend	2000 RPM, 200k TPM
Tier 4	$500 spend	4000 RPM, 400k TPM

Limits vary by model. Check Console for exact limits.

层级	判定标准	示例限制
Tier 1	新账户	50 RPM, 4万 TPM
Tier 2	消费满10美元	1000 RPM, 10万 TPM
Tier 3	消费满50美元	2000 RPM, 20万 TPM
Tier 4	消费满500美元	4000 RPM, 40万 TPM

限制因模型而异。请查看控制台获取确切限制。

Handling 429 Errors

处理429错误

typescript

async function makeRequestWithRetry(
  requestFn: () => Promise<any>,
  maxRetries = 3,
  baseDelay = 1000
): Promise<any> {
  for (let attempt = 0; attempt < maxRetries; attempt++) {
    try {
      return await requestFn();
    } catch (error) {
      if (error.status === 429) {
        const retryAfter = error.response?.headers?.['retry-after'];
        const delay = retryAfter
          ? parseInt(retryAfter) * 1000
          : baseDelay * Math.pow(2, attempt);

        console.warn(`Rate limited. Retrying in ${delay}ms...`);
        await new Promise(resolve => setTimeout(resolve, delay));
      } else {
        throw error;
      }
    }
  }
  throw new Error('Max retries exceeded');
}

// Usage
const message = await makeRequestWithRetry(() =>
  anthropic.messages.create({
    model: 'claude-sonnet-4-5-20250929',
    max_tokens: 1024,
    messages: [{ role: 'user', content: 'Hello' }],
  })
);

typescript

async function makeRequestWithRetry(
  requestFn: () => Promise<any>,
  maxRetries = 3,
  baseDelay = 1000
): Promise<any> {
  for (let attempt = 0; attempt < maxRetries; attempt++) {
    try {
      return await requestFn();
    } catch (error) {
      if (error.status === 429) {
        const retryAfter = error.response?.headers?.['retry-after'];
        const delay = retryAfter
          ? parseInt(retryAfter) * 1000
          : baseDelay * Math.pow(2, attempt);

        console.warn(`触发速率限制。将在${delay}ms后重试...`);
        await new Promise(resolve => setTimeout(resolve, delay));
      } else {
        throw error;
      }
    }
  }
  throw new Error('已达到最大重试次数');
}

// 使用示例
const message = await makeRequestWithRetry(() =>
  anthropic.messages.create({
    model: 'claude-sonnet-4-5-20250929',
    max_tokens: 1024,
    messages: [{ role: 'user', content: '你好' }],
  })
);

Check Rate Limit Headers

检查速率限制头信息

typescript

const response = await fetch('https://api.anthropic.com/v1/messages', {
  // ... request config
});

console.log('Limit:', response.headers.get('anthropic-ratelimit-requests-limit'));
console.log('Remaining:', response.headers.get('anthropic-ratelimit-requests-remaining'));
console.log('Reset:', response.headers.get('anthropic-ratelimit-requests-reset'));

CRITICAL:

Always respect
```
retry-after
```
header
Implement exponential backoff
Monitor usage in Console
Consider batch processing for high volume

typescript

const response = await fetch('https://api.anthropic.com/v1/messages', {
  // ... 请求配置
});

console.log('限制:', response.headers.get('anthropic-ratelimit-requests-limit'));
console.log('剩余:', response.headers.get('anthropic-ratelimit-requests-remaining'));
console.log('重置时间:', response.headers.get('anthropic-ratelimit-requests-reset'));

关键注意事项：

务必遵守
```
retry-after
```
头信息
实现指数退避策略
在控制台监控使用情况
高流量场景考虑批量处理

Error Handling

错误处理

Common Error Codes

常见错误码

Status	Error Type	Cause	Solution
400	invalid_request_error	Bad parameters	Validate request body
401	authentication_error	Invalid API key	Check env variable
403	permission_error	No access to feature	Check account tier
404	not_found_error	Invalid endpoint	Check API version
429	rate_limit_error	Too many requests	Implement retry logic
500	api_error	Internal error	Retry with backoff
529	overloaded_error	System overloaded	Retry later

状态码	错误类型	原因	解决方案
400	invalid_request_error	参数错误	验证请求体
401	authentication_error	API密钥无效	检查环境变量
403	permission_error	无功能访问权限	检查账户层级
404	not_found_error	端点无效	检查API版本
429	rate_limit_error	请求过多	实现重试逻辑
500	api_error	内部错误	带退避策略重试
529	overloaded_error	系统过载	稍后重试

Comprehensive Error Handler

全面错误处理器

typescript

import Anthropic from '@anthropic-ai/sdk';

async function safeAPICall(request: Anthropic.MessageCreateParams) {
  try {
    return await anthropic.messages.create(request);
  } catch (error) {
    if (error instanceof Anthropic.APIError) {
      console.error('API Error:', error.status, error.message);

      switch (error.status) {
        case 400:
          console.error('Invalid request:', error.error);
          throw new Error('Request validation failed');

        case 401:
          console.error('Authentication failed. Check API key.');
          throw new Error('Invalid credentials');

        case 429:
          console.warn('Rate limited. Implement retry logic.');
          // Implement retry (see Rate Limits section)
          break;

        case 500:
        case 529:
          console.warn('Service unavailable. Retrying...');
          // Implement retry with exponential backoff
          break;

        default:
          console.error('Unexpected error:', error);
          throw error;
      }
    } else {
      console.error('Non-API error:', error);
      throw error;
    }
  }
}

typescript

import Anthropic from '@anthropic-ai/sdk';

async function safeAPICall(request: Anthropic.MessageCreateParams) {
  try {
    return await anthropic.messages.create(request);
  } catch (error) {
    if (error instanceof Anthropic.APIError) {
      console.error('API错误:', error.status, error.message);

      switch (error.status) {
        case 400:
          console.error('无效请求:', error.error);
          throw new Error('请求验证失败');

        case 401:
          console.error('认证失败。请检查API密钥。');
          throw new Error('无效凭证');

        case 429:
          console.warn('触发速率限制。请实现重试逻辑。');
          // 实现重试（参见速率限制章节）
          break;

        case 500:
        case 529:
          console.warn('服务不可用。正在重试...');
          // 实现带指数退避的重试
          break;

        default:
          console.error('意外错误:', error);
          throw error;
      }
    } else {
      console.error('非API错误:', error);
      throw error;
    }
  }
}

Streaming Error Handling

流式错误处理

typescript

const stream = anthropic.messages.stream({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1024,
  messages: [{ role: 'user', content: 'Hello' }],
});

stream
  .on('error', (error) => {
    console.error('Stream error:', error);
    // Error can occur AFTER initial 200 response
    // Implement fallback or retry logic
  })
  .on('abort', (error) => {
    console.warn('Stream aborted:', error);
  })
  .on('end', () => {
    console.log('Stream ended successfully');
  });

CRITICAL:

Errors in SSE streams occur AFTER 200 response
Always implement error event listeners
Log errors with context for debugging
Have fallback strategies for critical operations

typescript

const stream = anthropic.messages.stream({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1024,
  messages: [{ role: 'user', content: '你好' }],
});

stream
  .on('error', (error) => {
    console.error('流错误:', error);
    // 错误可能在初始200响应之后发生
    // 实现降级或重试逻辑
  })
  .on('abort', (error) => {
    console.warn('流已中止:', error);
  })
  .on('end', () => {
    console.log('流已成功结束');
  });

关键注意事项：

SSE流的错误可能在200响应之后发生
务必实现错误事件监听器
记录错误上下文以便调试
关键操作要有降级策略

Platform Integrations

平台集成

Cloudflare Workers

typescript

export interface Env {
  ANTHROPIC_API_KEY: string;
}

export default {
  async fetch(request: Request, env: Env): Promise<Response> {
    const { messages } = await request.json();

    const response = await fetch('https://api.anthropic.com/v1/messages', {
      method: 'POST',
      headers: {
        'x-api-key': env.ANTHROPIC_API_KEY,
        'anthropic-version': '2023-06-01',
        'content-type': 'application/json',
      },
      body: JSON.stringify({
        model: 'claude-sonnet-4-5-20250929',
        max_tokens: 1024,
        messages,
      }),
    });

    return new Response(await response.text(), {
      headers: { 'Content-Type': 'application/json' },
    });
  },
};

typescript

export interface Env {
  ANTHROPIC_API_KEY: string;
}

export default {
  async fetch(request: Request, env: Env): Promise<Response> {
    const { messages } = await request.json();

    const response = await fetch('https://api.anthropic.com/v1/messages', {
      method: 'POST',
      headers: {
        'x-api-key': env.ANTHROPIC_API_KEY,
        'anthropic-version': '2023-06-01',
        'content-type': 'application/json',
      },
      body: JSON.stringify({
        model: 'claude-sonnet-4-5-20250929',
        max_tokens: 1024,
        messages,
      }),
    });

    return new Response(await response.text(), {
      headers: { 'Content-Type': 'application/json' },
    });
  },
};

Next.js API Route (App Router)

Next.js API路由（App Router）

typescript

// app/api/chat/route.ts
import Anthropic from '@anthropic-ai/sdk';
import { NextRequest } from 'next/server';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

export async function POST(request: NextRequest) {
  try {
    const { messages } = await request.json();

    const stream = anthropic.messages.stream({
      model: 'claude-sonnet-4-5-20250929',
      max_tokens: 1024,
      messages,
    });

    // Return stream to client
    return new Response(
      new ReadableStream({
        async start(controller) {
          for await (const event of stream) {
            if (event.type === 'content_block_delta' && event.delta.type === 'text_delta') {
              controller.enqueue(new TextEncoder().encode(event.delta.text));
            }
          }
          controller.close();
        },
      }),
      {
        headers: {
          'Content-Type': 'text/event-stream',
          'Cache-Control': 'no-cache',
        },
      }
    );
  } catch (error) {
    console.error('Chat error:', error);
    return new Response(JSON.stringify({ error: 'Internal error' }), {
      status: 500,
    });
  }
}

typescript

// app/api/chat/route.ts
import Anthropic from '@anthropic-ai/sdk';
import { NextRequest } from 'next/server';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

export async function POST(request: NextRequest) {
  try {
    const { messages } = await request.json();

    const stream = anthropic.messages.stream({
      model: 'claude-sonnet-4-5-20250929',
      max_tokens: 1024,
      messages,
    });

    // 将流返回给客户端
    return new Response(
      new ReadableStream({
        async start(controller) {
          for await (const event of stream) {
            if (event.type === 'content_block_delta' && event.delta.type === 'text_delta') {
              controller.enqueue(new TextEncoder().encode(event.delta.text));
            }
          }
          controller.close();
        },
      }),
      {
        headers: {
          'Content-Type': 'text/event-stream',
          'Cache-Control': 'no-cache',
        },
      }
    );
  } catch (error) {
    console.error('聊天错误:', error);
    return new Response(JSON.stringify({ error: '内部错误' }), {
      status: 500,
    });
  }
}

Next.js API Route (Pages Router)

Next.js API路由（Pages Router）

typescript

// pages/api/chat.ts
import type { NextApiRequest, NextApiResponse } from 'next';
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

export default async function handler(
  req: NextApiRequest,
  res: NextApiResponse
) {
  if (req.method !== 'POST') {
    return res.status(405).json({ error: 'Method not allowed' });
  }

  try {
    const { messages } = req.body;

    const message = await anthropic.messages.create({
      model: 'claude-sonnet-4-5-20250929',
      max_tokens: 1024,
      messages,
    });

    res.status(200).json(message);
  } catch (error) {
    console.error('API error:', error);
    res.status(500).json({ error: 'Internal server error' });
  }
}

typescript

// pages/api/chat.ts
import type { NextApiRequest, NextApiResponse } from 'next';
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

export default async function handler(
  req: NextApiRequest,
  res: NextApiResponse
) {
  if (req.method !== 'POST') {
    return res.status(405).json({ error: '不允许的请求方法' });
  }

  try {
    const { messages } = req.body;

    const message = await anthropic.messages.create({
      model: 'claude-sonnet-4-5-20250929',
      max_tokens: 1024,
      messages,
    });

    res.status(200).json(message);
  } catch (error) {
    console.error('API错误:', error);
    res.status(500).json({ error: '内部服务器错误' });
  }
}

Critical Rules

关键规则

Always Do

务必遵守

✅ Store API key in environment variables (never hardcode) ✅ Set

max_tokens

parameter (required) ✅ Use latest stable model IDs (check docs regularly) ✅ Implement error handling for all API calls ✅ Respect rate limits with exponential backoff ✅ Place

cache_control

at END of cacheable content ✅ Validate tool input schemas strictly ✅ Handle streaming errors (can occur after 200) ✅ Monitor token usage (input + output + cache) ✅ Use server-side only (never expose key in client)

✅ 将API密钥存储在环境变量中（绝不要硬编码） ✅ 设置

max_tokens

参数（必填） ✅ 使用最新的稳定模型ID（定期查看文档） ✅ 为所有API调用实现错误处理 ✅ 遵守速率限制，实现指数退避策略 ✅ 将

cache_control

放在可缓存内容的末尾 ✅ 严格验证工具输入模式 ✅ 处理流式错误（可能在200响应后发生） ✅ 监控令牌使用情况（输入+输出+缓存） ✅ 仅在服务端使用（绝不要在客户端暴露密钥）

Never Do

绝对禁止

❌ Expose API key in client-side code (security risk) ❌ Ignore

retry-after

header on 429 errors ❌ Use extended thinking on Claude 3.5 Sonnet (not supported) ❌ Cache content under minimum token threshold (1024/2048) ❌ Put system prompt after messages array (must be first) ❌ Assume stream success after initial 200 response ❌ Send unvalidated user input directly to API ❌ Forget to handle tool execution errors ❌ Exceed context window without pruning messages ❌ Use outdated model IDs (e.g., claude-2.1)

❌ 在客户端代码中暴露API密钥（安全风险） ❌ 忽略429错误中的

retry-after

头信息 ❌ 在Claude 3.5 Sonnet上使用扩展思考模式（不支持） ❌ 缓存低于最小令牌阈值的内容（1024/2048） ❌ 将系统提示词放在messages数组之后（必须放在最前面） ❌ 收到初始200响应后就认为流一定会成功 ❌ 将未验证的用户输入直接发送到API ❌ 忘记处理工具执行错误 ❌ 不修剪消息就超过上下文窗口限制 ❌ 使用过时的模型ID（例如claude-2.1）

Known Issues Prevention

已知问题与预防

This skill prevents 12 documented issues:

本技能可预防12个已记录的问题：

Issue #1: Rate Limit 429 Errors Without Backoff

问题#1：无退避策略的速率限制429错误

Error:

429 Too Many Requests: Number of request tokens has exceeded your per-minute rate limit

Source: https://docs.claude.com/en/api/errors Why It Happens: Exceeding RPM, TPM, or daily token limits Prevention: Implement exponential backoff with

retry-after

header respect

错误信息：

429 Too Many Requests: Number of request tokens has exceeded your per-minute rate limit

来源：https://docs.claude.com/en/api/errors 原因：超过RPM、TPM或每日令牌限制 预防措施：实现指数退避策略，遵守

retry-after

头信息

Issue #2: Streaming SSE Parsing Errors

问题#2：流式SSE解析错误

Error: Incomplete chunks, malformed SSE events Source: Common SDK issue (GitHub #323) Why It Happens: Network interruptions, improper event parsing Prevention: Use SDK stream helpers, implement error event listeners

错误信息：不完整的片段、格式错误的SSE事件来源：常见SDK问题（GitHub #323）原因：网络中断、事件解析不当 预防措施：使用SDK流助手，实现错误事件监听器

Issue #3: Prompt Caching Not Activating

问题#3：提示缓存未激活

Error: High costs despite cache_control blocks Source: https://docs.claude.com/en/docs/build-with-claude/prompt-caching Why It Happens:

cache_control

placed incorrectly (must be at END) Prevention: Always place

cache_control

on LAST block of cacheable content

错误信息：已添加cache_control块但成本仍很高来源：https://docs.claude.com/en/docs/build-with-claude/prompt-caching 原因：

cache_control

放置位置错误（必须在末尾） 预防措施：始终将

cache_control

放在可缓存内容的最后一个块上

Issue #4: Tool Use Response Format Errors

问题#4：工具调用响应格式错误

Error:

invalid_request_error: tools[0].input_schema is invalid

Source: API validation errors Why It Happens: Invalid JSON Schema, missing required fields Prevention: Validate schemas with JSON Schema validator, test thoroughly

错误信息：

invalid_request_error: tools[0].input_schema is invalid

来源：API验证错误原因：无效的JSON Schema、缺少必填字段 预防措施：使用JSON Schema验证器验证模式，充分测试

Issue #5: Vision Image Format Issues

问题#5：视觉图像格式问题

Error:

invalid_request_error: image source must be base64 or url

Source: API documentation Why It Happens: Incorrect encoding, unsupported formats Prevention: Validate format (JPEG/PNG/WebP/GIF), proper base64 encoding

错误信息：

invalid_request_error: image source must be base64 or url

来源：API文档原因：编码错误、不支持的格式 预防措施：验证格式（JPEG/PNG/WebP/GIF），正确进行base64编码

Issue #6: Token Counting Mismatches for Billing

问题#6：计费时令牌计数不匹配

Error: Unexpected high costs, context window exceeded Source: Token counting differences Why It Happens: Not accounting for special tokens, formatting Prevention: Use official token counter, monitor usage headers

错误信息：意外的高成本、上下文窗口超限来源：令牌计数差异原因：未考虑特殊令牌、格式 预防措施：使用官方令牌计数器，监控使用情况头信息

Issue #7: System Prompt Ordering Issues

问题#7：系统提示词顺序问题

Error: System prompt ignored or overridden Source: API behavior Why It Happens: System prompt placed after messages array Prevention: ALWAYS place system prompt before messages

错误信息：系统提示词被忽略或覆盖来源：API行为原因：系统提示词放在messages数组之后 预防措施：始终将系统提示词放在messages之前

Issue #8: Context Window Exceeded (200k)

问题#8：上下文窗口超限（20万令牌）

Error:

invalid_request_error: messages: too many tokens

Source: Model limits Why It Happens: Long conversations without pruning Prevention: Implement message history pruning, use caching

错误信息：

invalid_request_error: messages: too many tokens

来源：模型限制原因：长对话未修剪 预防措施：实现消息历史修剪，使用缓存

Issue #9: Extended Thinking on Wrong Model

问题#9：在错误的模型上使用扩展思考

Error: No thinking blocks in response Source: Model capabilities Why It Happens: Using Claude 3.5 Sonnet instead of 3.7/4 Prevention: Only use extended thinking with Claude 3.7 Sonnet or Claude 4

错误信息：响应中没有思考块来源：模型能力原因：使用Claude 3.5 Sonnet而非3.7/4系列 预防措施：仅在Claude 3.7 Sonnet或Claude 4上使用扩展思考

Issue #10: API Key Exposure in Client Code

问题#10：客户端代码中暴露API密钥

Error: CORS errors, security vulnerability Source: Security best practices Why It Happens: Making API calls from browser Prevention: Server-side only, use environment variables

错误信息：CORS错误、安全漏洞来源：安全最佳实践原因：在浏览器中直接调用API 预防措施：仅在服务端使用，使用环境变量

Issue #11: Rate Limit Tier Confusion

问题#11：速率限制层级混淆

Error: Lower limits than expected Source: Account tier system Why It Happens: Not understanding tier progression Prevention: Check Console for current tier, auto-scales with usage

错误信息：限制比预期低来源：账户层级系统原因：不了解层级升级规则 预防措施：在控制台查看当前层级，使用量达标后自动升级

Issue #12: Message Batches Beta Headers Missing

问题#12：消息批量Beta头信息缺失

Error:

invalid_request_error: unknown parameter: batches

Source: Beta API requirements Why It Happens: Missing

anthropic-beta

header Prevention: Include

anthropic-beta: message-batches-2024-09-24

header

错误信息：

invalid_request_error: unknown parameter: batches

来源：Beta API要求原因：缺少

anthropic-beta

头信息 预防措施：添加

anthropic-beta: message-batches-2024-09-24

头信息

Dependencies

依赖

Required (if using SDK):

@anthropic-ai/sdk@0.67.0+ - Official TypeScript SDK

Optional (for enhanced features):

zod@3.23.0+ - Type-safe tool schemas with betaZodTool
@types/node@20.0.0+ - TypeScript types for Node.js

Platform-specific:

Cloudflare Workers: None (use fetch API)
Next.js: next@14.0.0+ or 15.x.x
Node.js: v18.0.0+ (for native fetch)

必填（如果使用SDK）：

@anthropic-ai/sdk@0.67.0+ - 官方TypeScript SDK

可选（增强功能）：

zod@3.23.0+ - 配合betaZodTool实现类型安全的工具模式
@types/node@20.0.0+ - Node.js的TypeScript类型定义

特定平台：

Cloudflare Workers：无（使用fetch API即可）
Next.js：next@14.0.0+ 或 15.x.x
Node.js：v18.0.0+（支持原生fetch）

Official Documentation

官方文档

Claude API: https://docs.claude.com/en/api
Messages API: https://docs.claude.com/en/api/messages
Prompt Caching: https://docs.claude.com/en/docs/build-with-claude/prompt-caching
Tool Use: https://docs.claude.com/en/docs/build-with-claude/tool-use
Vision: https://docs.claude.com/en/docs/build-with-claude/vision
Rate Limits: https://docs.claude.com/en/api/rate-limits
Errors: https://docs.claude.com/en/api/errors
TypeScript SDK: https://github.com/anthropics/anthropic-sdk-typescript
Context7 Library ID: /anthropics/anthropic-sdk-typescript

Claude API：https://docs.claude.com/en/api
Messages API：https://docs.claude.com/en/api/messages
提示缓存：https://docs.claude.com/en/docs/build-with-claude/prompt-caching
工具调用：https://docs.claude.com/en/docs/build-with-claude/tool-use
视觉：https://docs.claude.com/en/docs/build-with-claude/vision
速率限制：https://docs.claude.com/en/api/rate-limits
错误：https://docs.claude.com/en/api/errors
TypeScript SDK：https://github.com/anthropics/anthropic-sdk-typescript
Context7库ID：/anthropics/anthropic-sdk-typescript

Package Versions (Verified 2025-10-25)

包版本（2025-10-25已验证）

json

{
  "dependencies": {
    "@anthropic-ai/sdk": "^0.67.0"
  },
  "devDependencies": {
    "@types/node": "^20.0.0",
    "typescript": "^5.3.0",
    "zod": "^3.23.0"
  }
}

json

{
  "dependencies": {
    "@anthropic-ai/sdk": "^0.67.0"
  },
  "devDependencies": {
    "@types/node": "^20.0.0",
    "typescript": "^5.3.0",
    "zod": "^3.23.0"
  }
}

Production Examples

生产示例

This skill is based on official Anthropic documentation and SDK patterns:

Live Examples: Anthropic Cookbook (https://github.com/anthropics/anthropic-cookbook)
Validation: ✅ All patterns tested with SDK 0.67.0
Cost Optimization: Prompt caching verified 90% savings
Platform Support: Cloudflare Workers, Next.js, Node.js tested

本技能基于官方Anthropic文档和SDK模式：

在线示例：Anthropic Cookbook（https://github.com/anthropics/anthropic-cookbook）
验证：✅ 所有模式均使用SDK 0.67.0测试通过
成本优化：提示缓存已验证可节省90%成本
平台支持：Cloudflare Workers、Next.js、Node.js均已测试

Troubleshooting

故障排除

Problem: 429 Rate Limit Errors Persist

问题：429速率限制错误持续出现

Solution: Check current tier in Console, implement proper backoff, consider batch processing

解决方案：在控制台查看当前层级，实现正确的退避策略，考虑批量处理

Problem: Prompt Caching Not Working

问题：提示缓存不生效

Solution: Ensure content >= 1024 tokens, place

cache_control

at end, check usage headers

解决方案：确保内容≥1024令牌，将

cache_control

放在末尾，检查使用情况头信息

Problem: Tool Use Loop Never Ends

问题：工具调用循环无法结束

Solution: Set

max_iterations

, add timeout, validate tool responses

解决方案：设置

max_iterations

，添加超时，验证工具响应

Problem: Streaming Cuts Off Mid-Response

问题：流式响应中途中断

Solution: Increase

max_tokens

, check network stability, implement reconnection logic

解决方案：增加

max_tokens

，检查网络稳定性，实现重连逻辑

Problem: Extended Thinking Not Showing

问题：扩展思考模式未显示

Solution: Verify using Claude 3.7 Sonnet or Claude 4 (NOT 3.5 Sonnet)

解决方案：确认使用的是Claude 3.7 Sonnet或Claude 4（不是3.5 Sonnet）

claude-api

Original

Translation

Claude API (Anthropic Messages API)

Claude API（Anthropic Messages API）

Quick Start (5 Minutes)

快速入门（5分钟）

1. Get API Key

1. 获取API密钥

Sign up at https://console.anthropic.com/

在 https://console.anthropic.com/ 注册账号

Navigate to API Keys section

进入API密钥页面

Create new key and save securely

创建新密钥并安全保存

2. Install SDK (Node.js)

2. 安装SDK（Node.js）

3. Or Use Direct API (Cloudflare Workers)

3. 或直接使用API（Cloudflare Workers）

The Complete Claude API Reference

完整Claude API参考

Table of Contents

目录

Core API (Messages API)

核心API（Messages API）

Available Models (October 2025)

可用模型（2025年10月）

Basic Message Creation

基础消息创建

Multi-Turn Conversations

多轮对话

System Prompts

系统提示词

Streaming Responses (SSE)

流式响应（SSE）

Using SDK Stream Helper

使用SDK流助手

Streaming with Manual Iteration

手动迭代流式响应

Streaming Event Types

流式事件类型

Cloudflare Workers Streaming

Cloudflare Workers流式实现

Prompt Caching (⭐ 90% Cost Savings)

提示缓存（⭐ 节省90%成本）

Overview

概述

Minimum Requirements

最低要求

Basic Prompt Caching

基础提示缓存

Caching in Messages

消息中的缓存

Multi-Turn Caching (Chatbot Pattern)

多轮对话缓存（聊天机器人模式）

Cost Comparison

成本对比

Tool Use (Function Calling)

工具调用（函数调用）

Basic Tool Definition

基础工具定义

Tool Execution Loop

工具执行循环

Beta Tool Runner (SDK Helper)

Beta工具运行器（SDK助手）

Vision (Image Understanding)

视觉（图像理解）

Supported Image Formats

支持的图像格式

Single Image

单张图片

Multiple Images

多张图片

Vision with Tools

结合工具的视觉能力

Extended Thinking Mode

扩展思考模式

⚠️ Model Availability

⚠️ 模型可用性

How It Works