课程咨询 :18487146383     QQ:570023382

长沙ios培训 > 达内新闻 > 苹果神秘AI技术:VocalIQ和Siri 2.0
  • 苹果神秘AI技术:VocalIQ和Siri 2.0

    发布:水木之向      来源:威锋网      时间:2016-05-30

  • 当整个科技行业都在争先恐后进军人工智能领域的时候,苹果公司却好像按兵不动,一点都不着急。其实相比其他科技公司将他们的最新开发成果都展示出来相比,苹果公司的暗流涌动好像才更可怕。在这个领域他们已经收购 多家公司,收购的这些技术将促使 Siri 在上线 5 年后迎来一次重大更新。

    在今年的谷歌 I/O 大会上 CEO Pichai 表示,人工智能和深度学习将会是未来发展方向。在这次大会上,谷歌升级了 Google Now,称之为Google Assistant。在整场发布会中,Google Assistant 贯穿其中。Google Assistant 基于语音和文字搜索,不只是点对点的查询,而是通过数据和人工智能技术实现人机沟通双向对话,并且在与人的沟通中学习自然语言方式。和微软的语音助手 Cortana 一样,他们的设计理念是植根于最先进的机器学习和数据挖掘算法。

    很自然苹果公司的 Siri 再次被拿出来和谷歌、微软的语音助手进行对比。Siri 在众多语音助手中,算是上线时间比较长的一项服务。可惜这几年它好像并没有特别重大的进步,苹果在这方面技术的开发能力也受到了质疑。

    有人认为苹果公司根本不懂人工智能是什么。对于这些人的质疑,有30年行业经验的支付领域业内人士 Brian Roemmele 认为,质疑苹果的人只是看到了冰山一角,“我认为那些人根本没有了解苹果公司已经完成的那些重要收购。”苹果首先收购了 Siri,接下来是 Emotient、Perceptio 和 VocalIQ,可能还有很多没有公开的收购。在苹果收购的这些公司里,他们都拥有一些专属的非常独特的技术。比如 Emotient 的技术能够读懂用户面部 43 块肌肉的运动,解密这些表情中的情感意图,帮助设备理解用户。这项技术对于机器学习以及苹果的人工智能项目开发来说非常重要。

    而苹果也不是一家不思进取的公司。Siri 在 2011 年登陆 iPhone 4S,目前已经成为包括iPad在内的所有 iOS 设备不可或缺的一部分。Siri去年登陆 Apple Watch 和第四代 Apple TV。

    从苹果最近的一系列动作来看,苹果对于 Siri 的重视程度越来越高。日前泄露的 OS X 10.12 截图显示,苹果将把 Siri 移植到 2016 年发布的 OS X 版本中,与此同时 OS X 10.12 中的 Siri 应用,同样支持语音唤醒。另外,如果 Mac 计算机插入电源,OS X 10.12 还将支持 Hey Siri 功能。也有传言表示,苹果会推出智能语音管家设备,并且还将整合苹果的智能个人助理 Siri 与其他 iOS 应用。

    除了将 Siri 整合到旗下产品,最新消息称苹果正在计划针对 Siri 进行一次重大升级,升级之后 Siri 的性能将会超越现阶段移动平台上的所有对手,包括谷歌的 Google Now、微软的 Cortana 以及亚马逊的 Alexa。据了解,苹果最快将会在 WWDC 全球开发者大会上公布这一重大更新。

    其实苹果在 2015 年收购了三家人工智能相关企业,在这里我们主要来了解 VocalIQ 这家在 Siri 接下来更新中发挥重要作用的公司。

    2015 年晚些时候苹果公司与英国剑桥这家名为 VocalIQ 的语音人工智能公司接触,他们在人工智能领域有一定的先进水平。VocalIQ 最让人称道的是其语音识别率,当时无论是 Google Now、Cortana 还是 Siri 的正确率只有大约 20%,而 VocalIQ 则达到了 90%。

    据了解为了收购这家公司苹果给出了非常有诱惑力的条件,时任 VocalIQ 首席执行官布莱斯·汤普森(Blaise Thomson)根本无法拒绝苹果开出的价格。根据英国剑桥大学的介绍,VocalIQ 已经成立了两年多,Brian Roemmele 表示自己对他们的技术非常熟悉,他认为未来在日常生活中,我们都会用到 VocalIQ 开发的先进技术。

    此前 VocalIQ 的官网介绍是:VocalIQ 推出全球首个自主学习对话 API——用户和设备可以进行非常真实、自然的对话。你和它的每一次对话都能够让它变得更聪明。这些对话对于它的学习过程来说非常重要——系统可以更好理解用户未来可能提出的要求,机智回应用户的请求。

    VocalIQ 的几项基本技术:

    噪音鲁棒性——先进的噪音鲁棒系统,可以确保对所有输入的理解是基于用户当前对话的语境来完成的,这可以显著改善系统对用户对话的理解效果。

    快速成型——强大灵活的设计意味着软件开发者和合作伙伴可以快速成型,即刻获得反馈,迅速展开部署。

    平台架构——它的平台架构是一个支持延伸和云托管的混合系统,该系统可以用补充新数据和知识引擎。

    交互学习——这一技术控制着研究深层部分,这部分驱动着被设计用来通过语言分析、语义学及文本进行学习的系统。

    据介绍,VocalIQ 能够筛除额外的噪音,来辨识你在说什么,所以,它的准确度比当前的 Siri 要更高。它能够获取环境中所有的声音——电视、小孩的叫声,或者任何其它什么——然后选择最有可能是用户执行的那个声音。它甚至还能够渐渐学习适应不同的口音,来提高准确度。如果你曾有过难以让 Siri 理解你的经历,你会明白这有多么重要。

    另外,VocalIQ 的平台十分灵活,使得它能被修改以做任何你想让它做的事,一个例子是,你能教它当手机在口袋里时,如何成功管理邮件(就像电影 Her 中 Joaquin Phoenix 扮演的角色控制他的手机一样。)理论上讲,苹果将能够使用 VocalIQ 来大大提高 Siri 完成任何任务的能力。

    乔布斯生前最后一场收购

    乔布斯已经非常明显感觉到 Voice First 世界,这种感觉出现的时间可能早于他对 PC 革命和 Mobile First 世界的感觉。他对未来看的如此清晰因此 2010 年即使那时候病魔缠身,他还是做出了收购 Siri 的决定。当时乔布斯直接给 Siri 语音助手之父、开发团队的 CEO 及联合创始人Dag Kittlaus 打电话,说服他接受苹果的收购,让整个 Siri 团队都加盟苹果。几周之后双方就完成收购,2011 年 Siri 就登陆 iOS 了,在 iPhone 4S 的发布会上正式亮相。

    可惜的是如今 Siri 的发展速度并没有达到我们的预期,Siri 团队的成员也先后离开了苹果公司。乔布斯在这方面的热情并没有感染到苹果公司,但是 Dag 和 Adam Cheyer 并没有停下脚步,他们离开苹果之后成立了 Six Five Labs,开发了新的语音助手 Viv。

    Siri 团队原始成员 Tom Gruber 是 Siri 技术最重要的开发者之一,他还留在苹果继续该语音助手的开发工作,也许在 2016 年或 2017 年我们就能看到他的开发成功。在这里我们暂且把它称为 Siri 2,而苹果很有可能会给它起一个新的名字。

    苹果公司很多产品上同时融合了他们自己开发的技术和他们通过收购得来的技术。从 iTunes 到 Touch ID ,苹果公司都成功发现了行业中一些有活力的初创公司,收购这些公司将它们的技术整合到苹果产品核心中。

    新革命将始于“车库”

    如果苹果能够充分利用 VocalIQ 的一项技术,那我们将能够看到一个更加先进的 Siri,不过 Brian Roemmele 认为苹果也会利用 Tom Gruber的开发成果。当然 Emotient、Perception 的技术和其他未公开的收购、未来的收购所获得技术都会成为苹果人工智能的重要一部分。未来在 Voice First 设备上,有的不是广告,而是 Voice Commerce 和 Voice Payments。

    苹果公司已经进入一个新的时代。乔布斯在生命的最后时期看到 Voice First,所以他做出了一个决定希望自己的这家公司能在未来站稳脚跟。未来将由 Viv、Alexa、Google Home 和 Facebook M 等数百家公司引领,不过这些公司没有哪家公司像苹果一样,在 1975 年从一个车库中发展起来的。

    相信苹果能够围绕 Voice First,在 Voice Commerce 的基础上建立一个更强的体验。Brian Roemmele 表示,“我看过这个领域的发展,用过一些不怎么样的系统,看过一些设计不怎么样的硬件,比如 Raspberry PIs,但是我尝试过 Apple TV + Remote 和亚马逊的 AWS 的组合,在这个基础上 Siri 出乎意料地能够做到某些事情。”

    一些默默无闻的小型公司会不断挑战苹果公司和其他大型科技公司。这些小公司有些可能会被收购,有些可能会在应对各种挑战之后,发展成为大公司。但是就像当初 Apple II 和 Macintosh 引领的个人电脑革命一样,Voice First 革命带来的变化将很少为人所理解。也许苹果能够理解,他们知道在这个表面之下还有更多的东西等着他们探索。

    我们不能因为现在还未看到就认为是它不存在。

    推荐文章

上一篇:iOS 9.3.3越狱工具将至?这次来自希腊团队

下一篇:苹果的 DNA?一切都是为了那些群众和用户

最新开班日期  |  更多

3G-IOS软件工程师就业班

3G-IOS软件工程师就业班

开班日期:11/30

3G-IOS软件工程师就业班

3G-IOS软件工程师就业班

开班日期:11/30

3G-IOS软件工程师全日制班

3G-IOS软件工程师全日制班

开班日期:11/30

3G-IOS软件工程师周末班

3G-IOS软件工程师周末班

开班日期:11/30

  • 网址:http:/cs.ios.tedu.cn     地址:长沙市芙蓉中路一段479号建鸿达现代城27楼
  • 课程培训电话:18487146383     QQ:570023382     全国服务监督电话:400-827-0010
  • 服务邮箱 ts@tedu.cn
  • 2001-2016 达内国际公司(TARENA INTERNATIONAL,INC.) 版权所有 京ICP证08000853号-56