百度推AI语音转录软件wiftScribe 还可以自我学习和完善

时间:2020-09-27 10:40:37       来源:微信公众号:新智元

1新智元编译来源:research.baidu.com译者:刘小芹

【新智元导读】速记员的工作可能是世界上最单调乏味而且耗时耗力的工作之一,AI 中的语音识别技术正是拯救这种乏味工作的手段。百度最新推出的语音转录软件 SwiftScribe 基于百度的 Deep Speech 2,采用端到端的学习方法使其区别于其他转录软件。

百度深度学习研究院昨天推出百度第一个 AI 驱动的转录软件 SwiftScribe 的 beta 版。百度在其研究博客中写道:我们开发 SwiftScribe 的初衷是解决一个用户痛点——非常耗时的人工逐字转录过程。现在,通过百度最先进的语音识别技术和易于编辑的工具的集成,SwiftScribe 能够让用户快速、轻松地进行语音的转录,提高生产率,简化工作流程。

SwiftScribe 的核心技术是百度的语音识别引擎 Deep Speech 2。它的神经网络使用数千小时的有标注语音数据训练,学习将声音与特定的词汇和短语对应起来。除了先进的 ASR 技术,百度还设计了一个直观的快捷键和创新的人机交互系统,以解决不连续的问题,这是用户在转录时的最大障碍之一。

百度 SVAIL 开发了 SwiftScribe 的各个组件,包括语音识别系统和用户界面。

这种方法的一个很大的有点是,当用户在使用 SwiftScribe 进行转录和编辑时,系统同时也在学习和提升。正是这种精细的端到端的方法,使 SwiftScribe 不同于市场上其他同类产品。

对于专业转录员来说,SwiftScribe 能带来更好的工作效率和项目回报。通常,转录1小时的语音数据需要4至6小时的工作,而转录的线性率约为每分钟1美元。使用 SwiftScribe 的话,转录员在一个项目上花费的时间平均可以减少40%。

SwiftScribe 是为需要经常进行转录工作的人们量身打造的,包括自由职业者、转录服务公司的专业转录员,以及数据录入的专门人士。在广泛的用户基础之上,SwiftScribe 有潜力影响一系列受益于转录的行业,包括医疗保健、法律与执法、商业、媒体以及其他行业。

文章来源:微信公众号新智元

关键词: 百度 swiftscribe