这种建模单元方案可以充分利用训练数据使得训练出来的声学模型更加稳健。如果训练数据足够多则建议采用带声调的声韵母作为声学模型的建模单元。对于英文来讲因为没有声调可以采用音素单元来建模。 为了表述方便很多文献也常常把普通话的声韵母归为音素级别。 音素的上下文会对当前中心音素的发音产生影响使当前音素的声学信号发生协同变化这必 手机号码数据 要与该音素的单独发音有所不同。
单音素建模没有考虑这种协同
发音效应为了考虑该影响实际操作中需要使用上下文相关的音素(也被称为三音子作为基本单元进行声学建模即考虑当前音素的前个音素和后个音素使得模型描述更加精准。 对三音子进行精细建模需要大量的训练数据而实通 电子邮件用户和营销人员都不 过际上对于某些三音子而言数据很难获得同时精细建模导致模型建模单元数量巨大例如音素表有个音素则需要的三音子总数为=模型参数显然急剧增加。
计算机借助于模型参数可
以估计出自然语言中每个句子出现的可能性。统计语言模型采用语料司 最後的資料庫 发因此严格意义上的三音子精细建模不太现实往往通过状态绑定策略来减小建模单元数目典型的绑定方法有模型绑定决策树聚下面将着重介绍三类声学模型包括基于-的声学模型基于-的声学模型以及端到端模型。 基于-的声学模型是种统计分析模型它是在马尔可夫链的基础上发展起来的用来描述双重随机过程。