Vocu AI 开发者文档
API文档(当前)使用指南返回创作中心
API文档(当前)使用指南返回创作中心
  1. API文档(当前)
  • 概览
  • 鉴权方式
  • 毫秒级低延迟WebSocket实时生成
  • 语音角色
    • 创建新的语音角色
      POST
    • 为指定 ID 的语音角色添加风格
      POST
    • 为指定 ID 的语音角色上传头像
      POST
    • 通过分享 ID 将语音角色添加到账户中
      POST
    • 获取当前用户的语音角色列表
      GET
    • 获取指定 ID 的语音角色详情
      GET
    • 获取指定ID语音角色的一次性分享链接ID
      GET
    • 删除指定 ID 的语音角色
      DELETE
    • 删除指定 ID 的语音角色的指定 ID 风格
      DELETE
  • 语音生成
    • 同步实时生成语音
      POST
    • 创建异步语音生成任务
      POST
    • 重新生成指定 ID 的异步生成任务
      POST
    • 简易流式生成语音
      GET
    • 获取当前用户的异步生成任务列表
      GET
    • 获取指定 ID 的异步生成任务详情
      GET
    • 删除指定 ID 的异步生成任务
      DELETE
  • 用户账户
    • 获取当前用户账户信息
      GET
  • 文件管理
    • 创建分片上传文件,以便于后续专业克隆使用
      POST
    • 上传分片文件
      POST
    • 完成文件分片上传
      POST
    • 简单上传文件
      POST
  • 内容模板
    • 创建新的模板
      POST
    • 更新指定 ID 的模板
      POST
    • 获取用户的模板列表
      GET
    • 获取指定 ID 的模板详情
      GET
    • 删除指定 ID 的模板
      DELETE
  1. API文档(当前)

毫秒级低延迟WebSocket实时生成

本文档将帮助您了解您应当如何使用Vocu的毫秒级低延迟WebSocket实时生成方案;通过该方案,不论目标文本长度如何,均可将语音生成延迟控制在700ms左右。

前提条件#

请您于Vocu创作中心的 开发者中心 - 配额与限制 - 配额 中查看您是否拥有毫秒级低延迟并发配额,如果没有配额请点击需要更多配额并与销售团队洽谈以获取毫秒级低延迟实时生成的配额与报价详情。

打开Turbo通道#

低延迟实时生成需要在WebSocket通道中完成,首先您需要通过请求相关接口来打开Turbo生成通道。
需要注意的是,Turbo一旦打开便不能切换角色,并且只能使用在开启通道时选择的角色,并且仅限v2.0+角色可使用。
按照cancelAfter所述,您需要在60秒内连接wsUrl所给出的WebSocket地址,否则通道会自动取消,届时您需要重新打开Turbo通道。

连接通道进行生成#

连接通道后,如果没有问题,您将会收到一条200消息。
您可使用您的客户端发送一条JSON消息以开始生成。
您可以使用选择的角色中存在的风格的promptId来选择使用其他风格。
如果您发送的synthesis_request请求没有问题,后端则会立即开始生成任务并在可用时立即发送audio_chunk消息
其中hex为PCM音频数据的16进制hex编码,pcm为PCM音频数据的参数信息。如果您收到了空的hex,则代表该段音频生成已经结束了。
在每段音频生成结束后您将收到如下所示的消息。
在有音频进行生成时您也可以照常发送synthesis_request,所有生成请求将被排队并按请求顺序生成。

连接保持#

在websocket链接成功建立后,请每间隔一段时间发送
服务端会立即响应
如果连接长时间无数据收发(~1分钟),连接可能会被释放以回收资源,如不希望连接被回收可定时发送ping消息。

关闭通道#

在无任何客户端连接后60秒,通道将自动关闭。您也可以发送下方所示的消息来立即关闭通道。
并且在通道关闭时,您将收到下方所示的消息。
通道关闭后所有连接将被立即关闭,占用的并发将被立即释放。

使用HTTP API管理Turbo通道#

该请求将列出目前账户中活动的所有Turbo通道。响应如下。

该请求将关闭:id所传递的通道。
修改于 2025-02-18 15:44:18
上一页
鉴权方式
下一页
创建新的语音角色