ASR,英文的全称是Automated Speech Recognition,即自动语音识别技术,它是一种将人的语音转换为文本的技术。今天我们主要了解pytorch实现语音到文本的端到端模型。
speech
speech是一个开源软件包,用于构建自动语音识别的端到端模型。目前支持具有注意力和连接主义时间分类的序列 - 序列模型。
这个软件的目标是促进语音识别端到端模型的研究。这些模型在PyTorch中实现。
该软件仅在Python2.7中测试过,但我们打算同时支持2.7和3.5。
安装
我们建议创建一个虚拟环境并在那里安装python需求。
virtualenv
source /bin/activate
pip install -r requirements.txt
然后按照适用于您的机器的PyTorch版本的安装说明进行操作 。
在安装了所有python需求之后,从顶层目录运行:
make
构建过程需要CMake以及Make。
之后,setup.sh从源码安装。
source setup.sh
考虑把这个添加到你的bashrc。
您可以通过运行tests目录中的测试来验证安装是否成功。
cd tests
pytest
运行
训练模型运行
python train.py
模型完成训练后,您可以使用
python eval.py
要查看每个脚本使用的可用选项-h:
python {train, eval}.py -h
例子
有关模型配置和数据集的示例,请访问示例目录。每个示例数据集应具有用于下载和准备数据的指令和/或脚本。还应该有一个或多个模型配置可用。每个配置的结果将记录在每个对应的例子中README.md。
姓名地址:Github
原创文章,转载请注明 :PyTorch通过ASR实现语音到文本端的模型以及pytorch语音识别(speech) - pytorch中文网
原文出处: /news/81.html
问题交流群 :168117787
python pytorch语音识别_PyTorch通过ASR实现语音到文本端的模型以及pytorch语音识别(speech) - pytorch中文网...