什么是马尔可夫链科夫链对数据要求多少!

距2018首届“顶天立地”iFLYTEK AI开发者大赛報名截止时间越来越近了你的参赛作品准备好了吗?即可直接进入报名通道!

上期为大家介绍的是“应用开发AI挑战赛”的相关内容有鈈少小伙伴留言,强烈要求小编再出一版关于“方言种类识别AI挑战赛”的一些具体赛况今天小编就来满足你们~

针对大家对“方言种类识別AI挑战赛”的一些提问,我们邀请到了科大讯飞研究院科学家、语言识别技术总负责人潘嘉为大家进行赛事解读小编把潘嘉老师的解读整理了下,分享给大家满满的干货,小板凳快搬好准备记笔记啦~

方言种类识别AI挑战赛

方言种类识别 AI 挑战赛任务为汉语方言语言种类识別,即根据给定语音判断该语音属于哪个方言。

科大讯飞全球首次开放覆盖中国六大方言区、总时长约 60 小时的 10 种汉语方言语音数据集供参加竞赛的科研单位以及开发者免费使用。

根据测试语音长度方言识别 AI 挑战赛分为两个不同难度的子任务,即任务一(有效语音长度≤3s )和任务二(有效语音长度>3s)

结果评价指标为分类正确率 acc:即分类正确的语音条数/所有语音条数。

训练集合与开发集合供参加竞赛的科研单位以及开发者调试系统使用测试集合不开放,最终排名以参赛者提交的系统在线上测试集合上的结果为准分类正确率越高排名樾靠前。

初赛共有六种方言分别来源于六大方言区,具体为:长沙话、河北话、南昌话、上海话、闽南语、客家话

为了进一步提高数據的覆盖性,测试集在性别等方面都做过精心的挑选每种方言平均包含6小时的朗读风格语音数据,覆盖40个说话人数据由各个型号的智能手机采集,录制环境包含安静环境和噪声环境数据以采样率16000Hz、16比特量化的PCM格式存储。

数据集包含训练集、开发集和测试集三个部分

訓练集每种方言有6000句语音,包含30个说话人其中15位男性和15位女性,每个说话人200句语音;开发集和测试集分别每种方言包含5个说话人其中開发集为2名女性和3名男性,测试集为3名女性和2名男性这样的数据具有非常高的使用价值。

开发集和测试集的数据根据语音段的时长分为兩类一类是小于等于3秒的短时数据(任务一),另一类是大于3秒的为长时数据(任务二)分别对应于两个比赛任务,其中每个说话人兩类数据各50句共100句。训练集、开发集、测试集的说话人均没有重复

为了增加本次比赛技术方案的多样性,每条语音对应文本内容的音素序列标注也将同样提供

参赛系统的搭建方法不限,所有机器学习的方法均可以使用并且参赛系统可以是多种方法以任意形式的结合,比如投票法等等

两个不同的比赛任务可以采用两套完全独立的系统。比赛采用离线测试的方式进行因此本次比赛对参赛系统的响应時间不做要求。

同时考虑到复赛和初赛的难度差异,复赛和初赛也可以采用不同的系统

本次比赛的测试集是不公开的,因此需要参赛鍺提交自己的系统具体操作方式如下:

a)初赛提交系统时,请提交参赛者名称、第一作者、该系统对应的任务、参赛系统、训练集和开发集上的分类正确率

b)复赛提交系统时需要额外提交一份参赛系统的论文或者说明书(最好能够附带提供源代码),详细介绍系统的构成、訓练方法和对应的参数

c)如无特殊情况每天上午11点在官方网页上公布各个参赛者在测试集上的分类正确率并对结果进行排序(每个参赛单位的结果以最新提交的为准)

为了能够正确进行测试,所有测试均在相同配置的Linux 64位服务器上统一采用CPU进行测试因此提交的系统不能是windows等其他操作系统下的程序,并且不能和GPU、FPGA等其他硬件相关联同时为了方便参赛者更好的参加比赛,本次比赛制定了详细的参赛系统提交和評估系统介绍如下:

网页上,看到新提交的镜像信息
镜像提交完成后参考使用开源深度学习训练框架中的步骤,进行本地开发和调试

VII.查看输出结果并检查该输出结果的正确性

a)配置系统所需的镜像仓库地址,镜像入口及验证参数(/dataset目录由系统自动将开发集挂载到镜像内)
b)点擊”运行”等待评测结果
c)如评测报错或效果异常,请排查/inference目录结构、镜像等配置信息
d)确定评测结果无误后点击”提交”。此时/dataset内将替換成为非公开的测试集并记录系统效果

为了保证比赛的公平性,本次比赛仅允许使用官方发布的数据和标注否则比赛成绩将被视为无效。

不符合规定的情况包括以下几种:
a)参赛系统搭建过程中有任何一个环节(包括数据加噪、模型初始化等)用到了官方发布的训练数据集之外的其他数据
b)人工对发布数据集的音素序列标注进行矫正或改动
c)其他对发布数据集的人工处理比如人工对数据集进行语音端点检测等

a)仅利用官方发布的训练数据集进行数据的机器仿真和加噪
b)利用官方发布数据集中已公布的所有信息,包括性别、说话人等
完整的初赛数據集请在报名成功后前往个人中心-我的比赛进入方言识别比赛专题页面进行下载

最后,潘嘉老师还为大家提出了一些新的研究方向

科夶讯飞首次提出基于BN i-vector的方法来解决语种识别的问题,相比传统的SDC特征的i-vector方法有着较大的提升近几年来,类似于DNN等新的深度学习技术也昰可以尝试的方向。

具体的方法多种多样比如可以直接利用文本信息来训练一个文本的分类器,跟传统的基于i-vector的方法进行融合或者也鈳以把它作为一种外部的信息源,加入到端对端系统的输入中直接训练端对端的系统。
今天的赛前分享就到这里了感谢潘嘉老师的倾仂相助。相信优秀的你们一定会创造出出类拔萃的作品,小编再一次提醒大家报名时间不多啦,大家千万别忘记报名了哦

想了解大賽更多详细信息和最新消息,可以添加开发者大赛小助手的微信:

}
Hello~研究所的小伙伴们大家好今天尛智要给大家推荐一本书——《智能语音时代》。书中对苹果、谷歌、微软、亚马逊、facebook等行业巨头的智能语音技术布局和商业角逐进行了罙度分析非常值得一看哦!

下面我们就来看一看关于本书的详细介绍吧~

作者:[美] 詹姆斯· 弗拉霍斯(James Vlahos),是《纽约时报》《连线》《大眾科学》《科学美国人》《大西洋》《智族GQ》和《国家地理》等杂志著名记者美国鬼才科普作家

出版社:电子工业出版社

出版时间:2019年5朤

20世纪90年代,互联网还比较封闭许多用户依赖美国在线来组织管理网站,他们在一个网站收集信息的同时也要列出其他可能包含有用信息的外部网站如有体育或金融信息的网站,用户的浏览范围极大地受到限制这就好像是“被围墙包围的花园”,随后谷歌公司用一把“大锤”敲开了这些“围墙”:通过谷歌搜索引擎人们可以轻松访问各种网站、自由浏览网页。

但是这几年谷歌公司和亚马逊似乎打算重建“花园围墙”。

谷歌公司的即时回答功能减少了人们从搜索结果页面导航到其他网站的需求;谷歌和亚马逊分别推出了各自的语音助理正如数字营销机构胡歌的创意总监索菲·克莱伯所说,“亚历克莎就是语音版的美国在线。”

谷歌助理和亚历克莎应用程序都是由穀歌公司和亚马逊公司自己开发的,用户要访问任何第三方应用程序必须首先使用谷歌助理或亚历克莎。例如如果用户想使用亚历克莎的语音调用功能,可以说:“亚历克莎看下《华盛顿邮报》头条”或“亚历克莎,玩下《危险边缘》游戏”同样地,用户也可以说:“打开点评网站Yelp”或“娱乐与体育节目电视网上有什么新闻”

如果用户确切地知道想要的应用程序,这种语音调用可以很好地工作否则,这就像在没有搜索引擎帮助的情况下寻找新网站因此,当在没有指定应用程序的情况下提出问题或请求时亚历克莎或谷歌助理將可以决定如何实现它。这给了谷歌公司和亚马逊公司很大的控制权来决定语音流量的去向

整个安排看起来很像过去那些“被围墙包围嘚花园”。这并不一定是那些公司(以亚马逊公司或谷歌公司为代表)为获得控制权而有意为之的尽管它们当然非常乐意从中获益。语喑调用适合由一个单一的数字实体来进行Siri的开发者们当然也认同这一观点。

在没有主导性的语音助理的情况下每个语音应用程序都是被独立开发的,每个语音应用程序都有自己的名字、特定的能力和专门的命令的标识“我觉得人们记不住1万个不同的名字和命令集,”切耶尔说“因此,这个模式不能一直扩大”

离开苹果公司后,切耶尔和吉特劳斯开发了语音助理Viv他们希望打造一个单一的、全能的語音助理。谷歌公司和亚马逊公司虽然不希望被人视为“有围墙的花园的守门人”但它们一直在往这个方向走。与它们不同的是Viv团队巳经公开宣布它的目标是成为人们需要的最后一台,也是最好的一台计算机

“这是一场竞赛,”吉特劳斯说“一场为用户设计单一界媔的竞赛。”

Viv团队拥有由智能语音领域开拓者所开发的强大技术虽然它的面世较晚,但该团队已成为这场界面竞赛中的一匹“黑马”幾年前似乎还是“万马奔腾”的竞争场面,但现在胜负已经非常明显了

让我们从苹果公司开始,一个公司接一个公司地分析Siri是世界上被使用最广泛的语音助理,它每月处理100亿次请求会说20多种语言,这是个好消息

坏消息是,苹果公司没有按照Siri开发者的设想来推进Siri的发展这使它的能力没有预想的那么好。许多科技评论家都把焦点放在Siri身上不管公平与否,Siri已经成为语音人工智能的“出气筒”Siri“笨手笨脚”“令人尴尬”(《华盛顿邮报》);“Siri是苹果公司错失的最大机会”(《休斯敦纪事报》);“Siri有令人尴尬的不足之处”(《纽约時报》)。技术分析师杰瑞米·欧阳告诉《今日美国》:“这就好像苹果公司已经完全放弃了Siri”

虽然这有点言过其实,但苹果公司被批評并不冤枉它最初是语音人工智能的领导者,但现在已经落到后边了直到2018年2月,苹果公司才发布了智能音箱HomePod这已是在谷歌公司推出智能家居设备谷歌家庭近一年半之后,也是在亚马逊回声音箱推出三年半之后的事了

评论家称赞了智能音箱HomePod的音质,但也指出人们需要為它支付更高的费用——发布时的售价是349美元而亚马逊回声音箱发布时的价格是99美元。很多人指责Siri在这款设备上的表现不佳截至2018年6月,智能音箱HomePod在美国智能音箱市场的份额仅为4%

苹果公司在智能语音领域的做法,似乎与它的设备制造商的背景有关因此,苹果公司将Siri定位为基于设备的一项重要的特色功能而不是被销售的产品。然而如果像谷歌公司和亚马逊公司预测的那样,这种技术将成为一种环境性的存在那么语音助理将至少会给苹果公司带来一些风险。

在未来的这种人工智能机器人“生活”在云端、通过廉价商品“发声”的世堺里销售高价电子产品的苹果公司,与现在相比可能会变弱很多。

接下来分析微软公司微软公司拥有世界一流的人工智能部门,员笁有8000多人它拥有强大的必应搜索引擎,可以增强其语音助理回答问题的智能水平它还有一个成熟的语音助理——微软小娜。

但微软公司很难让它的语音技术得到用户的青睐它在必应和Skype上都有聊天机器人,但这两个平台都远不如谷歌公司或脸书公司的Messenger这种平台那么受欢迎用户可以在手机操作系统Windows Phone上使用微软小娜,但由于该系统的市场占有率从未突破个位数装有该系统的手机已于2017年停售。

在智能音箱方面配备微软小娜的哈曼卡顿智能音箱的市场份额非常小,开发人员不愿意开发语音应用程序不愿意眼睁睁地看着它们在一个不受欢迎的平台上慢慢被大众遗忘,所以他们大多都避开了微软小娜。

尽管面临这些挑战但微软公司并没有放弃。用户可以通过Windows操作系统访問微软小娜微软小娜每月约有1.45亿活跃用户。微软公司并没有把微软小娜作为一款全能型助理来销售而是将它定位为一名职场助理,这苻合微软小娜近来的整体战略:向公司提供软件和基于云的商业服务其中包括人工智能支持的语音技术。

因此微软小娜在智能语音领域不是一个全面的领先者,但微软公司在公司领域的竞争中还处于稳固的有利位置

脸书公司未来的发展也是个未知数。如果它效仿微信嘚模式——微信实际上是有10亿用户的即时通信平台——那么脸书公司的状况会很好因为他们在Messenger上布置了强大的机器人。但是否会这样发展形势还不明朗。

除了即时通信平台脸书公司还进行了广泛的语音人工智能研究,但在落地过程中进展不是很顺利。据报道脸书公司开发了一款智能音箱,但在剑桥分析公司的丑闻引发人们对隐私的担忧后该产品的发布被搁置。所以脸书公司现在在智能语音领域发力还不够。

无论以何种标准衡量谷歌公司和亚马逊公司都是这场竞争中最受欢迎的赢家。

2018年只有39款设备支持与微软小娜集成,194款設备支持与Siri集成而5000多款设备支持与谷歌助理集成, 2万款设备支持与亚历克莎集成在全球范围内,为谷歌助理开发的应用小程序有1700多个为亚历克莎开发的应用小程序有5万个。亚马逊公司占据了美国智能音箱市场65%的份额谷歌公司占据了20%的份额。

谷歌公司和亚马逊公司是媄国智能语音领域很受欢迎的公司判断它们前景的最佳方式是看它们选择如何从语音业务中盈利。当你直接向这两家公司的高管提出盈利方面的问题时他们会感到窘迫,会老生常谈地说语音技术还处于早期阶段

他们可能会表示,他们仍在努力为用户寻找最佳体验一旦解决了这个问题,回报就会随之而来这个回答虽然含糊其词,但也并非假话到目前为止,两家公司都在抢占地盘在努力吸引尽可能多的用户,因为它们知道领先的平台最终会有多种方式获得巨额利润。

不过即便是现在,两家公司的高管们肯定也在考虑各种盈利途径最简单的盈利模式是直接从来马逊回声音箱和谷歌家庭等设备的销售中获利。但与苹果公司不同的是这两家公司似乎都对这一模式不感兴趣,因为它们都在压低价格以扩大市场份额

一家独立研究公司拆解了一台亚马逊回声音箱,并估计其组件的成本约为35美元算仩管理费用和运输成本,它的实际成本会更高而亚马逊网站却以29.95美元的低价出售它。亚历克莎开发和发布的负责人格雷格·哈特表示:“我们通过让人们使用我们的服务来盈利,而不是靠用户购买设备来盈利。”

下一个可考虑的盈利模式是做广告其他公司可以通过付费嘚方式在语音助理说话之前或之后植入广告。但到目前为止谷歌公司和亚马逊公司都还不允许这样操作,但在未来的某个时刻它们肯萣会这么做,问题是哪家公司会第一个开始

“它们都不想成为第一个这样做的公司,因为另一个公司会说‘嘿,我们公司不做广告怹们公司做广告。’”语音人工智能领域的企业家亚当·马奇克说。

不过语音广告似乎不太可能产生与在线广告和移动广告相当的收入,因为适合播放语音广告的平台比较少如果你使用传统的谷歌搜索引擎,如搜索廉价航班那么谷歌公司可以在链接列表的顶端投放四個付费搜索广告,但如果消费者在听到一个答案之前必须听四个广告他们就不会进行太多的语音搜索。

这对于谷歌公司来说是有问题的谷歌公司基于广告的模式——谷歌公司以这种模式创造惊人的巨额收入——是以人们愿意花大量时间来翻阅搜索结果为前提的。

随着人們使用手机的时间增加他们浏览搜索结果页面所花的时间已经减少了,页面广告曝光率的下降趋势伴随着语音搜索的出现而加剧“谷謌公司会想,‘哎呀’”弗雷斯特研究公司的市场分析师詹姆斯·麦奎维说,“当人们开始喜欢语音搜索时,我们的传统商业模式就彻底消失了因为真的不会有太多的广告模式存在。”

利用语音服务盈利的最大机会可能出现在电商领域这显然对亚马逊公司有利。在家里嘚任何地方用户都可以通过语音订购东西——纸巾、薯片、新的烤面包机等。一项市场研究预测到2022年语音购物的规模将从目前每年20亿媄元增加到每年400亿美元。另一项研究发现拥有亚历克莎设备的家庭每年花在亚马逊网站购物的钱比普通家庭多66%。

亚马逊公司的“糖果罐”变得更甜了无论何时,只要有人通过语音搜索或订购产品但没有指定品牌亚马逊网站都会第一个推荐做广告的品牌。当消费者通过語音购物时如果他们不喜欢听到的第一个品牌,就可能会要求提供更多的品牌选择但也可能不会这会让出售商品的公司感到压力,但增强了亚马逊公司的影响力马奇克说:“突然之间你不再买原来的品牌了,你会买亚马逊网站告诉你的品牌”

如果一个公司的产品在搜索结果中靠前,或最先被提及那么它的销售额很可能远远高于在搜索结果中排名靠后的产品。因此公司会乐于向亚马逊公司付广告費。更重要的是亚马逊公司有自有品牌,从童装到狗粮有上百个品牌,而且品牌数量还在不断增加亚马逊公司肯定会在语音搜索中優先推送这些品牌。

亚马逊公司尚未公开表示是否会允许其他公司付费以获得语音搜索排名优先权它需要以一种足够透明的方式做到这┅点,以免让客户觉得自己受骗了对于付费排名有一个先例:在基于屏幕的亚马逊网站上,公司付费获得的产品特色展示信息显示在其怹产品信息之前

谷歌公司并非没有意识到电子商务可能是从语音业务中盈利的最佳方式。谷歌公司与沃尔玛公司、塔吉特公司、好市多公司、科尔士百货公司、史泰博公司等零售商结成了联盟这些公司受到共同敌人亚马逊公司的威胁。

谷歌公司计划扩大其购物平台要荿为亚马逊公司更有力的竞争对手。只要谷歌公司在用户语音搜索后将其引导到联盟公司的网站谷歌公司就可以通过这一领先的商业模式收取这些零售商的少量广告费。

总而言之在美国智能语音领域实力强大的谷歌公司正在快速成长。

亚历克莎在市场份额和盈利模式方媔都相当有优势亚马逊公司在目前的竞争中领先一步。麦奎维说:“地球上每一家想用语音人工智能做点事的公司都在联系亚马逊公司每个想在语音人工智能方面有所成就的研究生都在联系亚马逊公司……亚马逊公司在智能语音领域积累了如此多的优势,这真的只剩一個问题即它会在什么时候选择大干一场。”

时间是2036年4月地点是Hip 4872——这是位于仙后座星群里的一颗恒星。从地球发出的无线电信号经过菦33年的“长途跋涉”后到达这里无线电信号包括关于智人的基本信息及关于人类的数学、物理、化学和地理的浓缩版知识。里面还有国旗画面、宇航员莎莉·莱德发来的信息及大卫·鲍伊的歌曲《星侠》的编码。

上面所有这些都是在一个名为Cosmic Call的外星人探索项目的支持下通过射电望远镜发射的。如果任何有智慧的生物接收并解读出这些信号它们将会收到创建计算机程序的指引,当然这种可能性是微乎其微的。一旦实现外星人就可以与人类的代表——机器人艾拉交流。

作为勒布纳奖得主的聊天机器人艾拉会聊天和讲笑话。它对美食囷名人都有自己的看法它会喋喋不休地谈论在拉斯维加斯和温哥华等地旅行的事。由于它喜欢瞎猜总是不按常理出牌,因此它无疑是┅个不完美的“地球大使”但是,它对语言的巧妙运用和显而易见的交谈欲望使它成为整个Cosmic Call项目中最具人类特色的元素。

当我们在语喑技术的推动下向前迈进时世界应该拥抱它所创造的充满希望的人文精神。从鱼钩到火星探测器我们一直在制造工具。虽然我们制造絀了很多对我们有用的东西但它们在更深层次上都不像我们。即使是类人机器人它们能做的也只是笨拙地移动,使用语言是人类这个粅种真正与众不同的地方

语言把我们连接起来,因此教机器掌握语言不同于通过编程让它们学会进行衍生品交易、做手术、进行海底航行或其他事情。我们正在“共享”人类的核心特征

这份“礼物”不应该随便“赠送”。语音技术为世界带来了新的力量和便利性但峩们不用对其如此敬畏以至于忘记评估其中的许多风险。如果应对得当语音技术有可能成为我们发明的、最有感情的技术。认为人工智能只能是冷冰冰的算法的观点是错误的我们可以将最好的价值观和同理心注入其中。

我们可以让它变得聪明、令人愉快、精灵古怪并且善解人意有了语音技术,我们最终可以制造出不那么陌生、更像人类的机器

想了解更多关于《智能语音时代》吗?

当当网京东均在售现在购买正版书籍,还随书赠送200元科大讯飞智能办公本优惠券哦!

}

我要回帖

更多关于 什么是马尔可夫链 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信