语音识别网站及相关语料库

2018-09-07  本文已影响0人  MADAO123

OpenSLR

OpenSLR是一个致力于提供语音和语言资源的网站,例如语音识别培训语料库和与语音识别相关的软件

语料库语言学在线

中文语言资源联盟(资源收费)

TIMIT数据库

TIMIT数据库(一) :介绍

TIMIT数据库(二) :文件目录与结构

AISHELL-1中文语音数据库

希尔贝壳中文普通话开源语音数据库AISHELL-ASR0009-OS1录音时长178小时。录制过程在安静时内环境中,同时使用3种不同的设备:高保真麦克风(44.1kHz, 16bit)、Android系统手机(16kHz,16bit)、iOS系统手机(16kHz,16bit)。高保真麦克风录制的音频降采样为16kHz,400名来自中国不同口音区域的发言人参与录制。

希尔贝壳AISHELL-1官网

AISHELL-1下载地址 

gale_mandarin: 中文新闻广播数据集(LDC2013S08)

链接地址(不是下载地址)

hkust: 中文电话数据集(LDC2005S15, LDC2005T32)

LDC2005S15链接地址(非免费)

LDC2005T32链接地址(非免费)

上一篇下一篇

猜你喜欢

热点阅读