在商用领域的端对端语音识别技术中,百度首次尝试引入更深层的CNN神经网络,使错误率相对降低10%。端对端技术则使用一个单独的学习算法来完成从任务输入端到输出端的所有过程,减少了中间单元以及人为干预,在海量数据的支持下模型效果提升明显。目前,百度的端对端技术处于业界领先水平。值得一提的是,语音识别都是基于时频分析后的语音谱完成的,将整个语音信号分析得到的时频谱当作一张图像,就可以采用图像中已广泛应用的CNN进行识别,克服了语音信号多样性的问题,且通过引入更深层的CNN,使语音识别性能得到显著提升,正如百度语音技术部识别技术负责人李先刚博士所言:‘The Deeper,The Better’。【详细】