wenwen
  1. 语音
wenwen
  • (必读)使用说明
  • Base URL地址
  • 列出模型
    • Models(列出模型)
      GET
  • OpenAI 格式(支持各大原厂模型)
    • OpenAI SDK使用指南
    • Responses API 接口使用指南
    • 对话(openai, gemini, claude, deepseek...)
      • 聊天(chat)
      • 流式返回(chat)
      • 思考模式(chat)
      • 结构化输出(chat)
      • 工具调用(chat)
      • MCP调用(chat)
      • web search(chat)
      • 聊天(responses)
      • 流式返回(responses)
      • 思考模式(responses)
      • web search(responses)
    • 图像(gpt, dalle, banana, jimeng)
      • 生成图片(chat)
      • 分析图片(chat)
      • 修改图片(chat)
      • 生成图片(images)
      • 修改图片(images)
    • 视频(sora, veo, 可灵)
      • VEO, SORA 接口参数信息汇总
      • 文生视频-同步 (sora, veo)
      • 图生视频-同步 (sora, veo)
      • 首尾帧视频-同步 (veo)
      • 文生视频-异步 (sora, veo)
      • 图生视频-异步 (sora, veo)
      • 查询视频状态 (sora, veo)
      • 获取视频内容 (sora, veo)
      • 文生视频-异步 (可灵)
      • 图生视频-异步 (可灵)
    • 语音
      • 语音回复(chat)
        POST
      • 语音识别(audio)
        POST
      • 语音合成(audio)
        POST
    • 向量化
      • 文本向量化
  • Anthropic 格式
    • Anthropic SDK使用指南
    • 聊天
      POST
    • 聊天(prompt cache)
      POST
    • 流式返回
      POST
    • 聊天(深度思考)
      POST
    • 工具调用(function call)
      POST
    • 工具调用(MCP)-目前不支持
      POST
    • 分析图片
      POST
  • Gemini 格式
    • Gemini SDK使用指南
    • 聊天
      POST
    • 生成图片(nano banana)
      POST
    • 编辑图片(nano banana)
      POST
  • Midjourney 格式
    • 任务查询接口
    • 获取种子(Seed)
    • 文生图(Imagine)
    • 图片融合(Blend)
    • 图生文(Describe)
    • 换脸(FaceSwap)
    • 上传(upload)
    • 任务批量查询接口
    • 按钮点击(Action)
    • 窗口执行(Modal)
    • 刷新链接(Refresh)
    • 编辑图片(Edit)
  • 数据模型
    • 示例数据模型
      • Pet
      • Category
      • Tag
  1. 语音

语音回复(chat)

POST
/v1/chat/completions
支持文本输入,语音回复,使用gpt-4o-audio模型
如果需要语音输入,语音输出,需要先使用语音转写将输入的语音转写为文本,参考接口「语音识别」

请求参数

Header 参数

Body 参数application/json

示例
{
  "model": "gpt-4o-audio-preview",
  "modalities": [
    "audio",
    "text"
  ],
  "audio": {
    "format": "wav",
    "voice": "alloy"
  },
  "messages": [
    {
      "role": "user",
      "content": "请用中文回答:你能听到我的声音吗?并用语音回复我。"
    }
  ]
}

请求示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST 'https://api.wenwen-ai.com/v1/chat/completions' \
--header 'Authorization: Bearer {API_KEY}' \
--header 'Content-Type: application/json' \
--data-raw '{
  "model": "gpt-4o-audio-preview",
  "modalities": [
    "audio",
    "text"
  ],
  "audio": {
    "format": "wav",
    "voice": "alloy"
  },
  "messages": [
    {
      "role": "user",
      "content": "请用中文回答:你能听到我的声音吗?并用语音回复我。"
    }
  ]
}'

返回响应

🟢200成功
application/json
Body

示例
{
    "id": "chatcmpl-BqebNpDZkLbdiwDBINEDTuUBCQK5L",
    "choices": [
        {
            "finish_reason": "stop",
            "index": 0,
            "logprobs": null,
            "message": {
                "content": null,
                "refusal": null,
                "role": "assistant",
                "annotations": [],
                "audio": {
                    "id": "audio_686bb3bec2608191b1d7efbfbd8bdb51",
                    "data": "UklGRv////9XQVZFZ......AB4AgABcAFQAAwA=",
                    "expires_at": 1751892430,
                    "transcript": "是的,我可以听到你的声音。"
                },
                "function_call": null,
                "tool_calls": null
            }
        }
    ],
    "created": 1751888829,
    "model": "gpt-4o-audio-preview-2024-12-17",
    "object": "chat.completion",
    "service_tier": "default",
    "system_fingerprint": "fp_bf8dbd2ceb",
    "usage": {
        "completion_tokens": 67,
        "prompt_tokens": 27,
        "total_tokens": 94,
        "completion_tokens_details": {
            "accepted_prediction_tokens": 0,
            "audio_tokens": 50,
            "reasoning_tokens": 0,
            "rejected_prediction_tokens": 0,
            "text_tokens": 17
        },
        "prompt_tokens_details": {
            "audio_tokens": 0,
            "cached_tokens": 0,
            "text_tokens": 27,
            "image_tokens": 0
        }
    }
}
修改于 2025-10-25 15:04:21
上一页
图生视频-异步 (可灵)
下一页
语音识别(audio)
Built with