移动灵犀语音助手收费吗云的语音合成都支持哪些中文方言?

热词:&&&&&&&&
科大讯飞发布智能家庭语音新品
通信世界网
http://www.
标签:科大讯飞
智能家庭 语音产品
通信世界网消息()日,科大讯飞在北京国家会议中心举办“语音点亮生活――科大讯飞智能家庭语音产品发布会”,发布了面向智能家庭领域的软硬件产品,包括灵犀语音助手3.0、讯飞语音云3.0、以智能语音为核心交互方式的讯飞智能音箱、以及面向智能电视交互的“未来遥控”等,助推硬件厂商抢占智能家庭市场入口,帮助广大开发者布局家电、汽车、智能硬件等领域。同时,科大讯飞宣布启动人工智能计划――“讯飞超脑”,不断推动智能语音和人工智能深入到生活的方方面面。
灵犀3.0与硬件厂商深度合作
发布会现场,科大讯飞董事长刘庆峰演示了与联合推出的最新升级版语音助手灵犀3.0。该产品在原有的语音拨号、发短信、本地查询、声纹锁屏等基础功能之上,又增加了秒呼、语音唤醒、音乐随心听、有声“悦”读、男女声识别等个性化功能,同时面向用户开放300万首正版歌曲、40万册正版图书访问。今后,灵犀3.0语音唤醒与执行拨号的结合,让手机拨号在锁频界面就能现实秒呼,大大缩短了交互过程;同时支持原音搜索、语音搜索、哼唱搜索三种功能,让你音乐随心听。此外,灵犀3.0还内置了业界领先的男女声识别技术,通过辨识男女进而提供不同的语音服务。比如男生咨询灵犀“我想买件新衣服”,灵犀经过声音识别就会给你建议“男人简单就好,纯色的POLO正是今夏男装最流行的清新简约风格”,如果女生咨询灵犀“我想买件新衣服”,灵犀经过声音识别就会给你不一样的建议“今夏的流行女装是小清新风格,夏天短裤和T恤的随性装扮就挺好的”等等,通过声音识别性别,进而让你拥有更加个性化的服务。
除了以上个性化手机服务功能之外,刘庆峰董事长还展示了灵犀3.0与智能家庭硬件之间的互动,包括对电视、电视、电灯、空调、热水器等家电的语音操控。比如,对灵犀说“中央一套”,电视频道就自动切换到中央一套,对灵犀说“帮我煮杯咖啡”,咖啡机开始工作,对灵犀说“我五分钟之后到家”,灵犀会回复“好的,按照您的习惯,空调已经调到26度,热水器调到35度”,空调显示调至26度,热水器显示调至35度……
目前,灵犀已经与创维、长虹、海信、TCL、康佳、海尔、迈乐机顶盒、海尔、美的、智能手表Z-Watch等垂直门户和终端厂商建立了广泛合作关系,OVS开放平台与200多个垂直领域最优质的信源展开合作。同时,语音助手也开始走向汽车领域,与奥迪、宝马、奔驰、福特、长安、上汽、广汽、江淮、奇瑞等汽车制造厂商都已展开深度合作。
语音云3.0助力开发者创业
发布会上,科大讯飞还发布了新一代讯飞语音云3.0。在语音合成、识别、搜索等基础智能语音功能之上,讯飞语音云3.0还新增方言语音识别、多语种识别、个性化识别、人脸识别、手势识别、声纹识别等创新功能,以及各类彩铃、广告、数据分析等增值服务,进一步增强了产品的实用性、易用性和通用性。同时,发布会还对“讯飞语音云创新应用大赛”的获奖开发者进行了颁奖,其中盲人应用争渡读屏获得大赛金奖,高德地图、Glass x分别获得了用户体验奖和创业团队奖,得到了大赛评委的一致认可。
以智能语音交互为核心的讯飞语音云,通过智能语音基础功能、个性化语音功能、语音定制服务、数据分析、增值服务等吸引开发者共同创业。首先,它适用人群广泛,平台语音技术可以覆盖多个语种、多种方言,甚至是四五线城市的方言人群都能通过平台上完成语音交互,让开发者与用户在语音交互上不受人群限制;其次,它适用场景广泛,基于麦克风阵列的远场识别和高抗噪性,在极其恶劣的噪声环境中仍然可以不受“污染”完成交互识别,让开发者与用户在语音交互上不受环境限制;最后,支持更多的交互模式,语音识别、人脸识别、手势识别、声纹识别等融为一体,让开发者与用户的交互更立体生动。
目前,讯飞语音云平台合作伙伴已超过40000家,其中包括腾讯QQ、小米手机、新浪微博、58同城、携程旅行、高德地图等各类主流应用,支撑用户数百万级以上应用超过1000多个,终端用户数量超5亿。
同时,科大讯飞还宣布启动人工智能计划――“讯飞超脑”,让机器像人脑一样做到学习和思考,进而实现机器从“能听会说”到能理解会思考的跨越。“讯飞超脑”计划聚集了来自语音及语言国家工程实验室、清华大学、 加拿大约克大学等10多位人工智能领域顶级专家,致力于人工智能的探索和应用,让机器能听话更能懂你,让人工智能深度应用于生活的方方面面。
发布全新智能硬件产品
发布会上,中国移动无线音乐基地总经理朱泓发布了科大讯飞与中国移动联合推出的全球首款支持4G的讯飞智能音箱。音箱既可轻松联网,又可APP远程语音遥控,完全智能语音交互的同时,又可随口挑选中国移动海量正版音乐。
此外,科大讯飞联合CNTV旗下未来电视发布了面向智能电视的“未来遥控”,用语音实现遥控器的交互,比如换频道、调音量等,电视都可以理解并立即执行。面对智能电视的无穷菜单和海量内容,你再也不会无从操作和选择,“未来遥控”让你仅需0.5秒就能找到想要的节目与内容。
科大讯飞以智能语音技术位切入智能家庭市场,必将全新定义国内智能家庭市场的交互入口,推动智能语音在家电、汽车、可穿戴设备等领域的应用。同时,智能家庭领域的布局以及智能硬件产品的发力,也将造福更多普通百姓的日常智能生活。
来 源:通信世界网
编 辑:刘高坤&&|&
&&&&昵称:
72小时排行
1&2&3&4&5&6&
关注通信世界网
“cww-weixin”(或扫描下图二维码),即可于获得独家的CWW视点分析、最新的通信资讯。
基于民资企业仍将是共建共享基站建设主力军的现实,以国动通信为代表的民资..
IDC需要加强信息安全管理互联网接入服务管理是互联网管理的重要组成部分..比特客户端
您的位置:
详解大数据
详解大数据
详解大数据
详解大数据
中国移动灵犀云免费开放语音评测能力
  近日,灵犀云正式对外免费开放了语音评测能力,广大应用开发者们可通过标准化的灵犀云SDK获取来自灵犀云的在线语音评测服务,为应用集成中文普通话或英文的语音评测功能。
  近年来,语音评测已经越来越多地出现在高考等重要考试场合中。得益于这项技术,现在高考里的英文口语考试,与不少70、80后们当年参加过的口语考试已经不一样了。过去考试时所面对的考官(老师),今天已经由一台电脑替代了。
  显而易见地,过去那种人工考试所面对的最大的问题是:评价考生水平的好坏主要根据考官的主观印象。对于追求公开、公平、公正的考试而言,依靠主观印象的评价结果往往难以符合统一标准的评价要求。
  于是,最大限度消除考评过程的主观成分,无疑是多年来考生和教育部门最希望实现的考试改革目标之一。
  幸运的是,随着智能技术一路蓬勃发展到今天,我们终于看到了以机器取代人工进行口语考评得到全面普及了。语音评测就是这么一种技术,它通过智能语音技术自动对发音人水平进行评价、发音错误、缺陷定位和问题分析。在它面前,你的发音是否标准、是否因为带有口音,都难以躲过它敏锐而精准的判断。
  在语音评测技术上走得最快的,是国内智能语音行业领军者科大讯飞。从1999年起,科大讯飞就开始了在语音评测领域的理论研究和实验工作,经过了长期技术积累,陆续获得了各类技术难点的突破,是业界唯一通过国家语委鉴定并达到使用水平的成果。目前,自动评分效果已经超过人工专家的打分水平。
  基于科大讯飞语音评测技术的中文、英文评测产品近年来已在国内展开了成熟的市场应用。目前普通话评测系统已在全国31个省市普通话水平测试中应用,累计测试考生超过1600万人次,受教育界好评,反响优秀,业界领先。
  而现在,除了在考试场景中的应用,语音评测技术还可以应用在我们每天都会用到的里。
  2015年伊始,科大讯飞就正式宣布其领先业界的语音评测技术将通过语音云平台免费开放。
  而作为承继了科大讯飞核心语音技术的智能语音云平台,中国移动的灵犀云平台在全面引入了讯飞语音评测技术后,近日也正式面向移动应用免费开放了此项能力服务。
  应用开发者只需利用免费申请所得的灵犀云SDK,集成到应用中,即可向用户提供对其朗读的字、词、句在发音、流畅度方面评分(包含中文和英文)的功能。该功能包含了三大核心技术,即:中文普通话发音水平自动评测技术、英文发音水平自动评测技术、中英文发音自动评测框架。可满足不同用户的各类语音评测需求。
  据相关机构统计,2015年中国在线教育市场规模预计将超过1600亿元,各种教育平台的快速崛起及发展成为投资界“新宠”。而这块市场中,英语培训机构一直以来都占据着相当大的比重。因此,对于很多有志于到在线教育领域进行创业的开发者或创业公司而言,利用移动互联网应用作为最主要的服务渠道,为用户提供随时随地的教育培训服务,自然是顺应潮流的选择。
  因此,灵犀云所开放的语音评测能力服务,相信能对语言教育类的互联网应用,以及广大有着语言学习需求的用户们带来福音。想象一下,你只需要打开里的APP,对着屏幕逐句朗读出单词或句子(英文或普通话),之后就可以得到软件对你每一句发音效果是否准确的反馈和评分。这种足不出户就能了解自身口语水平的学习方式,对于大多数希望低成本学习或抽不出上课时间的求学者而言,都是一个便捷实用的解决。
  此前,已有包括灵犀语音助手附带的“读你妹”语音休闲游,以及“听说无忧”这类英语学习app等应用都使用了源自科大讯飞语音评测技术的服务。此次灵犀云免费开放的语音评测能力,将可惠及更多的教育培训类应用和广大使用手机应用辅助语言学习的用户们。
  随着未来更多特色语音能力的对外开放,灵犀云将会为更多不同行业、不同领域的移动互联网应用提供更具实用价值的服务,让更多的应用开发者们通过创新应用而获益,让更多的用户们获得更优秀便捷的生活体验。
[ 责任编辑:lf ]
互联网+,云,大数据时代,外部…
甲骨文的云战略已经完成第一阶段…
软件信息化周刊
比特软件信息化周刊提供以数据库、操作系统和管理软件为重点的全面软件信息化产业热点、应用方案推荐、实用技巧分享等。以最新的软件资讯,最新的软件技巧,最新的软件与服务业内动态来为IT用户找到软捷径。
商务办公周刊
比特商务周刊是一个及行业资讯、深度分析、企业导购等为一体的综合性周刊。其中,与中国计量科学研究院合力打造的比特实验室可以为商业用户提供最权威的采购指南。是企业用户不可缺少的智选周刊!
比特网络周刊向企业网管员以及网络技术和产品使用者提供关于网络产业动态、技术热点、组网、建网、网络管理、网络运维等最新技术和实用技巧,帮助网管答疑解惑,成为网管好帮手。
服务器周刊
比特服务器周刊作为比特网的重点频道之一,主要关注x86服务器,RISC架构服务器以及高性能计算机行业的产品及发展动态。通过最独到的编辑观点和业界动态分析,让您第一时间了解服务器行业的趋势。
比特存储周刊长期以来,为读者提供企业存储领域高质量的原创内容,及时、全面的资讯、技术、方案以及案例文章,力求成为业界领先的存储媒体。比特存储周刊始终致力于用户的企业信息化建设、存储业务、数据保护与容灾构建以及数据管理部署等方面服务。
比特安全周刊通过专业的信息安全内容建设,为企业级用户打造最具商业价值的信息沟通平台,并为安全厂商提供多层面、多维度的媒体宣传手段。与其他同类网站信息安全内容相比,比特安全周刊运作模式更加独立,对信息安全界的动态新闻更新更快。
新闻中心热点推荐
新闻中心以独特视角精选一周内最具影响力的行业重大事件或圈内精彩故事,为企业级用户打造重点突出,可读性强,商业价值高的信息共享平台;同时为互联网、IT业界及通信厂商提供一条精准快捷,渗透力强,覆盖面广的媒体传播途径。
云计算周刊
比特云计算周刊关注云计算产业热点技术应用与趋势发展,全方位报道云计算领域最新动态。为用户与企业架设起沟通交流平台。包括IaaS、PaaS、SaaS各种不同的服务类型以及相关的安全与管理内容介绍。
CIO俱乐部周刊
比特CIO俱乐部周刊以大量高端CIO沙龙或专题研讨会以及对明星CIO的深入采访为依托,汇聚中国500强CIO的集体智慧。旨为中国杰出的CIO提供一个良好的互融互通 、促进交流的平台,并持续提供丰富的资讯和服务,探讨信息化建设,推动中国信息化发展引领CIO未来职业发展。
IT专家新闻邮件长期以来,以定向、分众、整合的商业模式,为企业IT专业人士以及IT系统采购决策者提供高质量的原创内容,包括IT新闻、评论、专家答疑、技巧和白皮书。此外,IT专家网还为读者提供包括咨询、社区、论坛、线下会议、读者沙龙等多种服务。
X周刊是一份IT人的技术娱乐周刊,给用户实时传递I最新T资讯、IT段子、技术技巧、畅销书籍,同时用户还能参与我们推荐的互动游戏,给广大的IT技术人士忙碌工作之余带来轻松休闲一刻。
微信扫一扫
关注Chinabyte附近人在搜什么
灵犀云于2014中国移动合作伙伴大会正式发布
  12月18日至20日,以“和4Go汇聚新动力”为主题的2014中国移动全球合作伙伴大会在广州琶洲保利世贸博览馆举行,超过5000位全球终端产业链企业代表、应用开发者及企业代表和移动互联网产业链企业代表参加大会,中国移动期望通过本次大会与更多伙伴开展更广泛、更丰富、更开放的合作,携手共建4G移动互联产业新生态。
  在19号的“移动互联网专题”分论坛上,中国移动互联网基地白琳总经理宣布灵犀云智能语音能力正式公开发布。灵犀云成为继应用内计费、有数、有推、统一认证等能力后,又一个对外开放的中移动开发者社区核心能力。
  中国移动互联网基地白琳总经理发布现场
  同时,这也标志着灵犀云智能语音能力平台在上线后由服务移动自有业务为主(包括灵犀语音助手、飞信、139邮箱、语音信箱等),发展至正式面向移动互联网应用免费开放主流能力服务。这是国内首个由运营商推出的,面向互联网开放的智能语音云能力平台。
  中国移动董事长奚国华在本届大会上提出,2015年移动将以“端更优、管更精、云更强”的发展策略打造产业竞争优势。若以此对应移动在智能语音领域的布局来看,至今已实现累计下载量行业第一的灵犀语音助手APP,以及今年已达到8000万用户、覆盖300多个城市的4G业务,分别为“端更优”及“管更精”的成功打下了坚实的基础;而灵犀云作为实现语音能力生产及输出的核心平台,也是移动为完成语音产业链布局的最重要一步,将为“云更强”的实现提供充分保证。
  灵犀云能力特性介绍
  发布会上,白琳总经理对灵犀云的能力特性进行了具体介绍。基于中国移动与智能语音行业的领军者科大讯飞的战略合作背景,灵犀云采用的正是来自科大讯飞的核心语音技术。因此,灵犀云无论在技术上,还是在能力应用上,都占据优势。
  1)能力支持丰富
  灵犀云平台目前已具备语音识别、语音合成、语义理解、声纹识别、语音评测等能力;后续将会陆续上线更多特色能力。
  2)支持多种语言
  支持中文、英文、法语、俄语、西班牙语、意大利语、葡萄牙语、日语、越南语、印地语等多语种合成;
  支持东北话、四川话、河南话、湖南话、陕西话、台湾普通话等多方言合成。
  3)平台性能领先
  语音识别率达97%以上;语义理解线上综合正确率达92%;均为行业领先。
  语音合成技术源自科大讯飞连获国际语音合成大赛“Blizzard Challenge”九连冠的核心技术,全球领先。
  4)支持个性化场景
  支持个性化用户热词识别;支持多种不同音色的合成发音人选择;支持20多种个性化语义场景选择。
  平台技术的优秀特性,配合中国移动4G网络的优势,使灵犀云可以向所有接入平台的移动互联网应用及其用户带来稳定、智能、准确、高效的智能语音服务,实现人机交互体验的显著提升。
  开发者现可通过登录中国移动开发者社区进行灵犀云能力申请,通过下载SDK进行集成接入即可(支持Android、iOS等平台)。中国移动灵犀云平台,将助力更多的移动互联网应用开创语音交互新世代的潮流。您正在使用IE低版浏览器,为了您的IThao123账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
影响语音交互普及起来的心理因素有哪些?
影响语音交互普及起来的心理因素有哪些?
什么会成为互联网时代里下一代的交互方式呢?以目前来看,语音交互无疑是接班键鼠交互、触控交互的最大热门。这一点,其实早在很多科幻电影中都可以预见到。
但为什么到今天,我们仍然没见到语音交互全面替代了原来的那些交互方式,用户在使用电脑、随身终端时,依然还是以键盘鼠标、触摸屏为主呢?
前些天在网上看到了一篇文章,叫《为什么语音交互有个心理学问题》(作者@酱卤)。文中首先抛出的问题,正是上面这个。
是的,为什么呢?作者结合老罗(没错就是崇尚情怀的罗永浩)曾经提到过的观点,从心理学的角度提出了以下三个影响了语音交互普及的问题:
问题1:智能语音并不能真正理解人的语言,它不具备人类的智力。
问题2:当人们用语言进行交流的时候,通常希望立即获得回应。
问题3:语言交流的即时性还有一个结果,就是人们期望对声音的反馈也是声音。
文中的观点确实有一定道理。客观来说,目前语音交互之所以还没能完全普及,与这几个问题确实存在一定关系。
但是必须看到,当前在这几大方面上,当前最新的语音技术已经创造了不少突破,用户体验也得到了很好的优化。
以中国移动灵犀云智能语音平台所具备的技术特点为例,我想说一下原文提到的这几个问题:
问题1:智能语音并不能真正理解人的语言,它不具备人类的智力。
原文:现在的智能语音停留在对关键词的内容识别和上下文分析,而机器是没有“语感”的,也不懂得什么语法。这样一来,以人类智力来理解,机器就显得很蠢,而试图和它沟通交流的行为也就显得很蠢。类似的行为其实也适用于文字交流,一旦对话的情境被建立起来,人们就希望对话者的智力水平足以和自己相当。
目前的人工智能水平,确实还不足以使机器具备如人类一般的智力。但以灵犀云为例,目前已经可以向移动应用提供20+种最常见的垂直领域开放语义场景,结合利用知识库和搜索技术实现的智能问答功能,可为用户提供各分领域下的智能语义理解。这样的能力在线上的综合正确率,可达到92%以上。
怎么理解呢?就是说虽然机器目前还无法做到像一个普通人一样跟你谈天说地、大侃家常,但是当你跟它谈的话题落在上图的这些领域时,它已经可以较准确地理解你话语中的含义和所指了。这样的机器可能还不算很聪明,但至少它不蠢。
当你跟灵犀说你饿了,它会聪明地为你搜索附近的美食。
问题2:当人们用语言进行交流的时候,通常希望立即获得回应。
原文:与文字书信不同,语言交流在过去往往是面对面,所以交流是即时完成。但对讲机和即时通讯应用的出现打破了这种即时性:对话者的语言是“互斥”的,不会出现声音的重叠和打断,因此对话者也就没有被置于一个共通的虚拟空间中。它所造成的结果,是这两种形式的语音交流无法提供面对面或电话交流时的畅快感和现场感,也就缺少一部分“对话”的体验。
与之同理,语音交互因为互斥性的特点,很难被当作是和机器对话。所以Siri式的仿自然语言交流也会缺少对话的现场感。
虽然这里提到的互斥性问题目前确实存在,对用户的现场感有一定影响。但现有的语音处理技术已能把反应速度提高到相当不错的水平,使用户不会感觉到明显滞后了。
以灵犀云服务的第一大应用灵犀语音助手为例(见下图),在wifi和4G网络环境下进行语音识别的响应速度只有0.6秒多些,即使在3G环境下也不超过1秒。也就是说当你说完一句话后,半秒至一秒的时间内系统就可以识别出你说的话,然后马上作出回应。这样的速度,应该能让你感到舒心。
问题3:语言交流的即时性还有一个结果,就是人们期望对声音的反馈也是声音。
原文:……问题在于,语音合成的技术实力还没有达到人们的期待。生硬的、机器化的声音表达,无时无刻不在提醒着这个对话者是“非我族类”,语音合成的生硬效果也在阻碍着人们将机器视为同等智力水平的个体。
灵犀云具备的语音合成能力,来自科大讯飞的核心语音合成技术,此技术已经连续九年获得国际语音合成大赛“Blizzard Challenge”的桂冠,在语音合成自然度指标上达到了4.2的分值,已经超越了一般真人的发音水平(4.0分)。“生硬而笨拙”的合成效果,已经成为了过去式。
此外,灵犀云提供多达18种以上的不同音色、不同性别、不同年龄段的发音人音库,无论是成熟稳重的男声,还是温柔娇俏的女声,你都可以在这里找到心仪的那把声音;再者,灵犀云对各地方言发音人的支持(粤语、四川话、东北话、河南话、湖南话、陕西话、台湾普通话等),能使你与机器的对话倍感亲切。这种情况下,“非我族类”的心理暗示还会存在么?或者你需担心的,可能是怎么不被合成出来的声音吸引了。
Laravel是一套简洁、优雅的PHP Web开发框架(PHP Web Framework)。它可以让你从面条一样杂乱的代码中解脱出来;它可以帮你构建一个完美的网络APP,而且每行代码都可以简洁、富于表达力。
Hadoop是一个由Apache基金会所开发的分布式系统基础架构。
用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。
Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access)文件系统中的数据。
Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。
产品设计是互联网产品经理的核心能力,一个好的产品经理一定在产品设计方面有扎实的功底,本专题将从互联网产品设计的几个方面谈谈产品设计
随着国内互联网的发展,产品经理岗位需求大幅增加,在国内,从事产品工作的大部分岗位为产品经理,其实现实中,很多从事产品工作的岗位是不能称为产品经理,主要原因是对产品经理的职责不明确,那产品经理的职责有哪些,本专题将详细介绍产品经理的主要职责
IThao123周刊}

我要回帖

更多关于 灵犀语音助手 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信