优惠套餐

新用户专享资源包

    • 一句话识别5,000次调用
    • 实时语音识别5小时时长
    • 录音文件识别10小时时长
    • 语音流异步识别5小时时长
    • 录音文件识别极速版5小时时长
    • 自购买之日起当月有效

    一句话识别资源包

      • 30,000次调用
      • 自购买之日起一年有效

      实时语音识别资源包

        • 30小时时长
        • 自购买之日起一年有效

        录音文件识别资源包

          • 60小时时长
          • 自购买之日起一年有效

          产品子功能

          实时语音识别

          对不限时长的实时音频流进行识别,识别结果自动断句,标记每句话的开始和结束时间;可应用于智能语音助手等实时音频流场景。

          录音文件识别

          对用户上传的五小时之内的录音文件进行识别;可应用于呼叫中心语音质检、视频字幕生成,会议语音资料转写等场景。

          一句话识别

          对一分钟之内的短音频文件进行识别;可应用于语音输入法、语音消息转文字、语音搜索等场景。

          语音流异步识别

          对直播协议语音流进行识别,准实时返回识别结果,支持音视频场景专用模型;可用于直播流质检等场景。

          录音文件识别极速版

          对用户上传的较大的录音文件进行极速识别,半实时返回识别结果;可应用于音视频字幕、准实时质检分析场景等场景。

          产品特性

          价格低

          购买预付费包更加优惠,识别1小时语音不到1元。每月赠送免费额度,最大程度降低客户成本。

          效果好

          字准率97%处于业界领先水平,与微信、王者荣耀的语音转文字使用一套服务,效果一样好。

          语种多

          已经支持中文普通话、英语、粤语、日语、泰语和上海话等23种方言的语音识别,后续将持续开放其他语种和语言的识别能力。

          算法强大

          基于创新网络结构 TLC-BLSTM,利用 ATTENTION 机制有效地对语音信号进行建模,通过 Teacher-Student 方式提升系统鲁棒性,对通用以及垂直领域下场景有领先业界的识别精度和效率。

          自助提升准确率

          针对垂直领域,上传词表或句子即可完成语言模型的自动优化,借助自训练平台,不懂算法也可轻松实现定制化模型,进一步提升识别准确率。

          支持场景丰富

          经过内部微信、腾讯视频、王者荣耀等大流量产品的充分验证,在互联网、金融、教育等领域,基于海量数据实现分场景优化,积累了多行业的最佳实践。

          应用场景

          • 呼叫中心录音质检
          • 短视频字幕
          • 视频理解

          业务痛点

          传统质检严重受限于人的工作效率和人力成本,只能抽检不能全检,难以评估客服的真实工作质量。

          解决方案

          语音识别将电话录音识别为文本,再通过质检规则对文本进行分析,识别不符合规范的服务通话记录。

          价值提升

          大幅提升呼叫中心工作质量管控能力,完成人力不可能完成的超大规模电话录音质检工作,提升呼叫中心人员的服务质量。

          常见问题

          语音识别服务如何开通?

          需要用户在 语音识别控制台 开通服务,默认开通的是后付费购买方式。

          语音识别服务每月有免费额度吗?

          语音识别服务如何计费?

          更多问题请查看 常见问题,也可在 问答社区 中进行提问 。

          按照我们的 入门指南,只需点几次鼠标,即可创建您的首个语音识别实例。
          http://www.vxiaotou.com