怎样用Python进行语音识别

发布时间：2021-03-12 13:11:55 所属栏目：传媒来源：互联网

导读：找到一些例子，有一些成熟的模型，可以将语音转成文字。例如Cloud Speech API，但是需要你使用google云平台的前提。 speech recognition 对于python这一非常成熟的胶水语言，在网上找一些现成的工具包真的不是一个太难的问题。在GitHub上就发现了这样一个神

找到一些例子，有一些成熟的模型，可以将语音转成文字。例如Cloud Speech API，但是需要你使用google云平台的前提。

speech recognition

对于python这一非常成熟的胶水语言，在网上找一些现成的工具包真的不是一个太难的问题。在GitHub上就发现了这样一个神奇的包：speech recognition

它可以支持实时翻译，当然前提是需要在机器上安装有关麦克风的依赖包；还可以支持将语音文件中的文字直接提取出来。通过speech recognition可以调用多种平台上的模型，比如google API，CMU sphinx，Microsoft Bing Speech，IBM Speech to Text，Wit.ai 等

离线转换

对于国内的网络环境，无法用google API来将语音数据转换成文本文件，因为在调用这个包的时候，需要连接到google。当然，你可以租用一个国外的VPS来做这件事情。

这里讲一下如何在不联网的情况下，依然可以通过python来将语音文件转换成文字。这里用到的包为sphinx，sphinx是由美国卡内基梅隆大学开发的大词汇量、非特定人、连续英语语音识别系统。

安装 sphinx

我本人所用的环境为ubuntu。

（编辑：信阳站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!