# 建议

  1. 如果想要识别英文,建议使用 IBM/Azure/Amazon
  2. 如果想要识别中文,建议使用 腾讯云/阿里云
  3. 对于其他语言,比如想识别法语或韩语,可以自己多配置几家服务商,都试试,对比下质量

# IBM

# 本篇教程教你如何配置 IBM 的语音转文字


IBM 识别英文不错,识别中文不行
如果需要识别中文建议使用阿里云/腾讯云

# 第一步:注册并登录 IBM Cloud

  1. 注册不需要信用卡,不需要手机号,只需要邮箱就行
  2. 无法访问 IBM Cloud 或者网站很慢的话,建议翻墙访问

# 第二步:点击页面右上角"创建资源"

# 第三步:搜索 "speech", 开启 Speech to Text 服务

# 第四步:复制 "API 密钥" 和 "URL"

# 第五步: 粘贴进 IBM 设置页

# 腾讯云

# 本篇教程教你如何配置 腾讯云 的语音转文字

# 第1步: 登录 腾讯云

(如果没有账号就注册然后再登录)

# 第2步:开启语音识别服务

左上角搜索 "语音识别",点击进去,开启即可

# 第3步:获取 访问密钥

复制 APPID, SecretId, SecretKey 三样信息

# 第4步:复制粘贴到软件里

# Azure

# 本篇教程教你如何配置 Azure 的语音转文字

接下来我们要:

  1. 配置一个 Storage Account, 得到一个叫 connection string 的东西
    这个负责存你的文件

  2. 配置一个 Speech 服务, 得到 key 和 region
    这个负责进行语音转文字

一共两件事

# 第一步:登录 Azure

如果没有账号就先注册账号,Azure 会送新账号 200 美金试用(有效期30天)
(需要填入支持美金的信用卡)

# 第二步:新建一个 Storage Account

第二步的最终目的,是获得 Connection String, 它长这样:

DefaultEndpointsProtocol=https;AccountName=anynameisfine;AccountKey=krVoq8GHDu4bm4z/tlIlPrgqJbtb83CU146TichH1janq/xxxxxJbAzWQSD1czNkhZLiR37E4OWAy216xxxxxx==;EndpointSuffix=core.windows.net

# 点击左上角 Create a resource

# 搜索 storage

点击这个绿色图标的 Storage account - blob, file, table, queue
(第一行从左到右第二个)

# 点击 Create

# 填写信息这里:区域选择 (US) East US

然后点击左下角的 Review + create

# 点击 Create 即可

# 等待创建完成

# 点击 Go to resource

# 点击左边的 Access Keys

# 复制 Connection String

复制的结果类似

DefaultEndpointsProtocol=https;AccountName=anynameisfine;AccountKey=krVoq8GHDu4bm4z/tlIlPrgqJbtb83CU146TichH1janq/xxxxxJbAzWQSD1czNkhZLiR37E4OWAy216xxxxxx==;EndpointSuffix=core.windows.net

# 粘贴到软件里即可

# 第三步:获取 Speech 服务所需的 key 和 region

# 还是点击左上角 Create a resource

# 搜索 Speech, 选择第一个

# 创建时,区域选择 eastus,注意要和前面的 Storage account 是同一个区域就行

# 等待创建完成

# 创建完成后点击 Go to resources

# 选择左侧 Keys and Endpoint

然后复制两项东西:

  • Key1 就是我们想要的 Key
  • Endpoint 里面前面的 region "eastus" 就是我们想要的 region

# 填入即可

# 最后一步:测试一下填的对不对

至此,Azure 语音转文字就配置完成了

# 补充说明:

前面的区域选择 eastus 只是举例而已,你也可以选择其他区域
根据文档,可选的区域如下:

  • australiaeast
  • brazilsouth
  • canadacentral
  • centralindia
  • eastasia
  • eastus
  • japaneast
  • northeurope
  • southcentralus
  • southeastasia
  • uksouth
  • westcentralus
  • westeurope
  • westus
  • westus2

# Amazon

# 本篇教程教你如何配置 Amazon 的语音转文字

# 第一步:登录 AWS

# 登录后长这样

# 第二步:点击右上角 My Security Credential

# 第三步:点击 Create New Access Key

# 会看到一个弹框

# 将弹出来的 Access Key ID 和 Secret Access Key 复制到软件里就行

# Region 可以填 us-west-2

# 阿里云

# 本篇教程教你如何配置 阿里云 的语音转文字

# 第1步:登录 阿里云

# 登录后长这样

# 先在左上角"橙色菜单"图标里,搜索 OSS

如果没有开通 OSS,就先开通

OSS 收费很低,可以先使用后收费,
用了一阵子语音转文字之后,应该会收到一个欠费1分钱的通知,
到时候充值1块钱就行,可以用很久

# 第2步:获取AccessKey,鼠标悬浮在右上角头像处,会弹出菜单,然后选 "AccessKey 管理"

# 如果有弹窗提示,选择左边的灰色按钮 "继续使用 AccessKey"


补充说明:
我开发和测试时,用的都是根账号,
如果你希望用子账号能更安全一些,子账号八成也是可以的,只不过我没测试过
子账号的权限给 OSS 和语音识别就行

# 然后会看到这个页面

# 复制 AccessKey ID 和 Access Key Secret 到软件里即可。

这里的"测试配置是否正确" 原理是用 AccessKey ID 和 Access Key Secret
在账号里新建一个桶,桶的名字就是 "Bucket 名"

这个桶的名字是全局唯一的,不能和別人重复,
所以建议用 "tern-[一串数字]" 比如 "tern-1928314141"
反正不要和別人重复就行,
如果创建桶成功了,就说明有权限,就会显示"配置正确"

# 第3步:获取语言对应的 appKey,鼠标悬浮在左上角图标处,显示出菜单,

# 搜索"语音",点击"智能语音交互"


# 会看到如下界面,选择左侧菜单"全部项目"

# 右侧选择"新建项目"


# "项目名称"可以填你想识别的语言,比如"中文"


此处可以随便填写任意名字,只是填写语言名在列表中比较好找

# 类别:非电话

# 然后选择语言,点击右下角"发布上线"

# 把 Appkey 复制到软件里即可


# 讯飞

本章节演示如何配置讯飞的语音转文字
注意,讯飞目前只支持 中文英文 ,如果需要处理其他语言,请用其他服务商

# 第一步:注册并登录 讯飞开放平台

登录后长这样, 点击'新建应用'并走完后续的流程

# 第二步:左侧导航栏选择"语音识别"->"语音转写"

# 点击页面底部的 '领取5小时免费试用体验包'

# 然后回到页面顶部

# 复制 "服务接口认证信息" 这里显示的 APPID 和 SecretKey

# 第三步:复制并粘贴到软件 "设置"->"讯飞" 中对应的输入框即可

Last Updated: 6/22/2020, 2:54:23 AM