微软的自定义语音识别服务点击公共测试版
2018年蓝宝石“智能企业”的SAP银行
作为总理推出Brexit计划,Techuk呼吁交易服务
最近的WordPress漏洞用于挫败150万页
Pipenv项目承诺包装Panacea for Python
CNET培训呼吁数据中心缺少技能短缺研究
欧盟网络安全机构承诺合作
在世界上最大的BUG赏金计划之一内
iOS的Outlook加速了第三方加入INS的工作
印度尼西亚在AI采用中引领东盟地区
Max Schrems的Noyb启动了GDPR行动
Windows 10 Beta Build 15002带来了真正的改进
汇丰银行将人形放在纽约分公司
科技群体为FISA监视争夺战
Micron首先以QLC闪存驱动器5210 QLC SSD推出市场
云销售充气了微软的强劲增长
欧洲网络攻击2018年第一季度近三分之一
研究人员说,安全供应商需要与社区进行互动
Mozilla在四周内钉火萤火虫的NPAPI棺材
近30%的LGBT +年轻人选择避免茎职业
ICO补助计划推出第二轮资金
GreenPeace宣布其关于云环境影响的最新报告
安全专家在GDPR检查表上重量
澳大利亚能源部门陷入了安全捕获-22
Apple加入无线电力联盟,充电iPhone 8谣言
5G频谱蹲便器以1000万美元的价格结束
世界上最大的太阳能农场包含250万太阳能模块
英国金融电气行业担心Brexit诱导人才挤压
惠普召回101,000款用于火灾危险的笔记本电池
Win10更新KB 3213986,KB 3210721具有多用户问题
在系统中断后,美国约有150个三角洲航班
Apple,Microsoft和Amazon提供更公平的云存储交易
欧洲立法者辩论自动车辆的机器人权利
三星碎片覆盆子PI 3竞争对手,收缩ARIK线
旧网络可以蹒跚地努力
Dell EMC将HyperConvergecence,云结合在最新的VxRail产品中
APAC组织可能从网络攻击中减掉1.75TN
Tech Luminaries队以2700万美元的价格组成。伦理基金
在Ryzen之后,AMD没有立即计划清除其其他PC芯片
雅虎在违规后推动了Verizon交易的时间
NativeScript 3.0与Angular 4释放
法院否认美国政府在微软海外电子邮件案件上诉
探索选项卡在Twitter上发现了新的东西
White-Hat Hackers查找遗漏记录数量
M1,华为在5G活试验中传输VR含量
英特尔的最古金芯片有24个核心,以8,898美元的价格出售
LeakedSource的关机是对业余黑客的打击
艾不仅仅是做便宜和更快的事情
如何使PC安全警报更好?让他们转动,摇摇晃晃
供应商说,数十个iOS应用程序未能保护用户的数据
您的位置:首页 >科技 > 消费电子 >

微软的自定义语音识别服务点击公共测试版

2021-08-06 12:44:18 [来源]:

建设利用语音识别的公司建立应用程序具有新的基于机器学习的工具来提高其工作。公司周二表示,微软正在为其定制演讲服务开设公共测试。

该服务以前被称为CRIS,允许客户培训语音识别系统以在特定场景中工作,使其能够产生更准确的结果。例如,自定义语音服务可以接受培训,以便在嘈杂的机场提供更好的结果,或者在特定群体中的声音更好地完成工作,如孩子或具有不同口音的人。

现在,自定义语音服务与英文合作,但其优势之一是它可以接受培训,以便与非母语人员的口音合作。

Microsoft正在作为其套件套件的一部分,这是一组基于云的工具,旨在打开公司的人工智能和机器学习研究的成果,以至于世界其他地区。

现在,通常有八种这样的认知服务,并且额外的17次赌注。微软说,超过424,000名开发人员已经尝试了这些服务。世界各地的开发人员都可以通过微软Azure访问这些服务,其中许多可供购买。

每个服务都有一个自由层,其使用浓郁,因此开发商有自由来测试API的情况下,而不花一分钱。自定义语音服务具有复杂的分层定价模型,包括订阅费,以及基于进入系统中的语音样本数量的指控以及声学适应培训的数量。

自定义语音服务是人类互动阿森纳的一个关键工具,一个小型游戏开发商店,使用语音命令作为其即将到来的游戏星舰指挥官的互动手段。自定义语音识别,以及Microsoft的语言了解智能服务(LUIS),构成了语音识别的关键部分,并理解玩家用于指导船舶的系统。

该服务允许人类互动,以创建特定于星舰指挥官的自己的字典,这意味着系统可以在询问Ecknians,这是游戏的外星人敌人。在玩家“演讲已被翻译成机器可读文本后,LUIS处理它并将其转换为游戏命令。

两个系统对星舰指挥官的核心游戏很重要。人类互动向虚拟现实进行互动体验,广泛地访问广泛的球员,而不仅仅是那些多年来一直在玩电子游戏的人,创意总监Alexander Mejia表示。

“答案很清楚,”梅杰说。“如果你和某人交谈怎么办?我的意思是,如果我们把一个人放在你面前,他们开始跟你说话,你会回来吗?“

为此,该公司选择使用内置在Oculus Rift和Gear VR系统中的麦克风,并创建一个感觉就像一个更加开放和沉浸式选择的游戏的游戏。

Mejia说,微软远非唯一提供基于机器学习的云语音识别的公司,但它的服务是团队在做的事情中最好的。这些服务提供了不仅是自定义词典的需求,还提供了快速响应时间和能够看到和验证语音识别系统所出版的结果的能力。

来自Microsoft的另外两个认知服务将于下个月达到一般可用性。内容主持人服务旨在自动阻止文本,视频和图像中的令人反感的内容,同时允许人类审查可疑情况。它可以以100多种语言检测亵渎,并允许客户包含令人反感的文本的自定义列表。

Bing语音API旨在为开发人员提供一种简单,广义的方式来将语音转换为文本,反之亦然。它支持从28个国家的18种语言和方言的语音识别,包括德国,法语,中文,西班牙语和阿拉伯语。开发人员还可以使用API​​以10种语言进行文本与语音工作,支持来自18个国家的方言。

微软正在与此区域的许多其他云公司作斗争,包括谷歌,亚马逊和IBM,每个都有自己的基于机器智能的工具。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。