微软的自定义语音识别服务点击公共测试版
建设利用语音识别的公司建立应用程序具有新的基于机器学习的工具来提高其工作。公司周二表示,微软正在为其定制演讲服务开设公共测试。
该服务以前被称为CRIS,允许客户培训语音识别系统以在特定场景中工作,使其能够产生更准确的结果。例如,自定义语音服务可以接受培训,以便在嘈杂的机场提供更好的结果,或者在特定群体中的声音更好地完成工作,如孩子或具有不同口音的人。
现在,自定义语音服务与英文合作,但其优势之一是它可以接受培训,以便与非母语人员的口音合作。
Microsoft正在作为其套件套件的一部分,这是一组基于云的工具,旨在打开公司的人工智能和机器学习研究的成果,以至于世界其他地区。
现在,通常有八种这样的认知服务,并且额外的17次赌注。微软说,超过424,000名开发人员已经尝试了这些服务。世界各地的开发人员都可以通过微软Azure访问这些服务,其中许多可供购买。
每个服务都有一个自由层,其使用浓郁,因此开发商有自由来测试API的情况下,而不花一分钱。自定义语音服务具有复杂的分层定价模型,包括订阅费,以及基于进入系统中的语音样本数量的指控以及声学适应培训的数量。
自定义语音服务是人类互动阿森纳的一个关键工具,一个小型游戏开发商店,使用语音命令作为其即将到来的游戏星舰指挥官的互动手段。自定义语音识别,以及Microsoft的语言了解智能服务(LUIS),构成了语音识别的关键部分,并理解玩家用于指导船舶的系统。
该服务允许人类互动,以创建特定于星舰指挥官的自己的字典,这意味着系统可以在询问Ecknians,这是游戏的外星人敌人。在玩家“演讲已被翻译成机器可读文本后,LUIS处理它并将其转换为游戏命令。
两个系统对星舰指挥官的核心游戏很重要。人类互动向虚拟现实进行互动体验,广泛地访问广泛的球员,而不仅仅是那些多年来一直在玩电子游戏的人,创意总监Alexander Mejia表示。
“答案很清楚,”梅杰说。“如果你和某人交谈怎么办?我的意思是,如果我们把一个人放在你面前,他们开始跟你说话,你会回来吗?“
为此,该公司选择使用内置在Oculus Rift和Gear VR系统中的麦克风,并创建一个感觉就像一个更加开放和沉浸式选择的游戏的游戏。
Mejia说,微软远非唯一提供基于机器学习的云语音识别的公司,但它的服务是团队在做的事情中最好的。这些服务提供了不仅是自定义词典的需求,还提供了快速响应时间和能够看到和验证语音识别系统所出版的结果的能力。
来自Microsoft的另外两个认知服务将于下个月达到一般可用性。内容主持人服务旨在自动阻止文本,视频和图像中的令人反感的内容,同时允许人类审查可疑情况。它可以以100多种语言检测亵渎,并允许客户包含令人反感的文本的自定义列表。
Bing语音API旨在为开发人员提供一种简单,广义的方式来将语音转换为文本,反之亦然。它支持从28个国家的18种语言和方言的语音识别,包括德国,法语,中文,西班牙语和阿拉伯语。开发人员还可以使用API以10种语言进行文本与语音工作,支持来自18个国家的方言。
微软正在与此区域的许多其他云公司作斗争,包括谷歌,亚马逊和IBM,每个都有自己的基于机器智能的工具。