siri
Siri,是苹果公司于2010年推出的一款内置在苹果iOS系统中的人工智能助理软件。随后通过与全球最大的语音识别厂商Nuance合作,Siri实现了语音识别功能。
产品简介 编辑本段
产品历程 编辑本段
研究背景
Siri成立于2007年,2010年被苹果以2亿美金收购,最初是以文字聊天服务为主,随后通过与全球最大的语音识别厂商Nuance合作,Siri实现了语音识别功能。
技术来源
Siri 技术来源于美国国防部高级研究规划局所公布的 CALO 计划:一个让军方简化处理一些繁复庶务,并具学习、组织以及认知能力的数字助理,其所衍生出来的民用版软件 Siri 虚拟个人助理。
功能介绍
使用者可以通过声控、文字输入的方式,来搜寻餐厅、电影院等生活信息,同时也可以直接收看各项相关评论,甚至是直接订位、订票;另外其适地性(location based)服务的能力也相当强悍,能够依据用户默认的居家地址或是所在位置来判断、过滤搜寻的结果。不过其最大的特色,则是人机的互动方面,不仅有十分生动的对话接口,其针对用户询问所给予的回答,也不至于答非所问,有时候更是让人有种心有灵犀的惊喜,例如使用者如果在说出、输入的内容包括了『喝了点』、『家』这些字(甚至不需要符合语法,相当人性化...),Siri 则会判断为喝醉酒、要回家,并自动建议是否要帮忙叫出租车。
Siri 和系统的整合更加紧密
Siri 在并购前的版本整合了大量网络服务的 APIs 。比如 OpenTable,Tickets,Taxi Magic 等等。
而 Siri 被苹果收购了之后, 他已经被整合为系统的一部分了。
在 iOS5 的 Siri 视频中,出现新短消息之后,交互由 Siri 发起。说明他已经常驻系统后台并且可以接管重要的系统功能了。(除了短消息还有天气,时钟,Maps 等等)
Siri 支持的语言
截至IOS6.1,siri支持中文(普通话 - 中国),中文(粤语 - 香港),德文(德国),德文(瑞士),意大利文(意大利),意大利文(瑞士),日文,法文(加拿大),法文(法国),法文(瑞士)英文(澳大利亚),英文(美国),英文(英国),英文(澳大利亚),西班牙文(墨西哥),西班牙文(美国),西班牙文(西班牙)和韩文。
折叠编辑本段主要功能
概况介绍
Siri 所用到的技术,很多人会回答,人工智能以及云计算,的确,总体来说,是这两样技术,不过,这种概述感觉几乎没有任何意义,何不直接说“计算技术”(注意,不是计算机技术)呢。因此,在本文,我将介绍下我了解 Siri 可能采用的技术(由于有个人猜测,不一定准确)。
前端方面
在前端方面,即面向用户,和用户交互(User Interface,UI)的技术,主要是语音识别以及语音合成技术。语音识别技术是把用户的口语转化成文字,其中需要强大的语音知识库,因此需要用到所谓的“云计算”技术。而语音合成则是把返回的文字结果转化成语音输出,这个技术理论上本地就能完成,但不知道Siri是否如此,当然,在云端完成也并无不可,在当前无线带宽下,那点语音流量根本不算什么。
后台技术
后台技术,这些其实才是真正的大角色。这些技术的目的就是处理用户的请求,并返回最匹配的结果,这些请求类型很多,千奇百怪,要处理好并不简单。基本的结构猜测可能是分析用户的输入(已经通过语音转化),根据输入类型,分别采用合适的技术(合适的技术后台)进行处理。这些合适的后台技术包括,①以Google 为代表的网页搜索技术;②以Wolfram Alpha 为代表的知识搜索技术(或者知识计算技术);③以Wikipedia 为代表的知识库(和 Wolfram Alpha 不同的是,这些知识来自人类的手工编辑)技术(包括其他百科,如电影百科等);④以Yelp 为代表的问答以及推荐技术。
网页搜索
大家天天用的Google就是这个技术的代表,而国内则以百度为代表。
知识计算
不同于搜索互联网信息,Wolfram|Alpha将从公众的(包括公开的网页等)和获得授权的资源中,发掘、建立起一个异常庞大的经过组织的数据库,再利用高级的自然语言算法进行处理,最终构造出一个类似于谷歌搜索的工具。
和网页搜索技术不同的是,在这个系统中,得到的答案结构化程度很高,比如搜索China,能得到和中国相关的各种参数以及资料,并以接近表格的方式呈现。Wolfram|Alpha也能理解部分自然语言,比如输出How old are you,其会回答Wolfram|Alpha的年龄。想测试这项技术的请移步Wolfram|Alpha。
这个技术国内做的应该有,但还没有产品,也许百度的框计算算是半个。所以机会大大的有。
知识库技术
相比于网页搜索技术,基本以一个词条或者主题为单位,因此得到的数据价值高,知识量大,并且结构化程度好。相比于知识计算技术,这些技术需要人的参与,这有利也有弊,利就是,毕竟暂时人比机器聪明,编辑出来的知识更丰富,准确;弊就是,人力有限,即使像维基那样,发动社区的力量,也不能产生足够的知识,而知识计算,理论上,只需要算法够,是可以产生“无限”的知识的。
问答推荐技术
其实这不能称为一个技术,应该属于知识库的技术。不同的是,这个技术针对的是一些生活信息,这些信息的地域化程度很高,典型代表为Yelp。由于这东西比较简单,就不仔细介绍了。
语言模型技术
这是如何提升Siri识别企业和餐厅等本地兴趣点名称的方法,融合了用户所在地的知识,也就是所谓的Geo-LM,借此提升Siri的语音识别能力。这些模型让Siri可以更好地评估用户的发音。
使用方法 编辑本段
1.Siri 变身闹钟
这应该是用户最容易想到的Siri的“正经”用法了。按住“Home”键,告诉Siri,“早上7点15的时候叫醒我”;想打会儿小盹,就说“40分钟后叫醒我”。只要准确地报上时间,Siri将是最好用的闹钟。
2.用 Siri 寻找咖啡厅
喝咖啡是很多上班族的习惯,一杯咖啡能够迅速地将人调整成工作状态。出门在外的时候,想找个咖啡厅?利用Siri就可以搞定这一切。告诉Siri,寻找离当前位置最近的咖啡厅即可。如果你没有附加更多的要求,Siri将反馈给还算不错的答案,很可能是告诉你最近的星巴克在哪。如果星巴克还不能满足你的要求,还是用更专业的应用Yelp吧,它会给你更详细的答案。
3.想去哪,Siri 告诉你
查找出行路线的过程中往往要输入不少文字。想省事的话,还是用Siri完成这一切吧。报上要去的地点,Siri会调用 Google 地图来寻找出行路线的方案。从测试过的这种用法的用户的反馈上看,Siri还没有出过什么差错,就像GPS那样好使。
4.用 Siri 播放随机音乐
如果你厌倦了固定顺序的音乐播放列表,可以试着用Siri播放随机音乐。首先,你需要将喜欢的音乐导入到一个名为“最爱”的播放列表中。开始听音乐的时候,告诉Siri”放皇后乐队的歌曲”。紧接着,Siri就会在“最爱”列表中匹配皇后乐队的歌曲并将其播放。这样就实现了随机播放音乐的功能。
5.发送短信,Siri 代劳
还在边走路边发短信?行路不安全不说,发短信还费劲,以后用Siri代劳吧。走路的时候,将iPhone放在耳边,告诉Siri“用短信告诉她,我将晚点到家”。不用匆忙,告诉Siri你想表达的内容,即可轻轻松松地发送短信。
6.天气预报,Siri 知道
这也是Siri十分擅长的一项功能。关于气象信息的问题,Siri都能正确理解。想要知道明天的天气怎样,问问Siri就知道了。
7.用Siri提醒日程安排
既然能把Siri当闹钟用,你当然可以用它来提醒日程安排。很多人都有使用Google日历的习惯,用Google日历安排自己的各项日程。生活中的一些需要提醒的小事,完全没有必要一项项地加到Google日历中去,用Siri就可以搞定这个问题。比如说,“十点钟的时候,提醒我去刷牙”。
8.用 Siri 提醒地点
Siri 提醒地点的功能还不是很完善。除了“家”或“上班处”,Siri 对于一些位置称呼的理解能力不佳。但是,Siri 对“这里”的理解十分准确,即当前的GPS坐标位置。所以你可以这样用 Siri 的提醒功能,途经一家不错的小店时,可以将它的位置标记为“这里”并设置好提醒,以便日后有时间时再次光顾。
9.Siri 为你答疑解惑
珠穆朗玛峰多高?美国去年的GDP是多少?回答不上来的话,无需 Google,张嘴问问 Siri 吧。Siri 本身是不知道这些问题的答案的,它会从“知识问答引擎”Wolfram Alpha中寻找答案。所有的回答都会以自然语言的形式呈现。这也是 Siri 被认为将对 Google 重要威胁的原因。当然,Siri 在相当长的一段时间肯定不能取代Google,但对 Google 的威胁将是长远的。当 Siri 足够智能的时候,人们用它取代 Google 并不是没有可能。
10.用 Siri 发送微博(支持新浪微博)
不过在使用 Siri 发微博前,还得做一些必要的设置。
11.用 Siri来订电影票。(美国)
iOS 7 中的 Siri 拥有新外观、新声音和新功能。它的界面经过重新设计,以淡入视图浮现于任意屏幕画面的最上层。Siri 回答问题的速度更快,还能查询更多信息源,如维基百科。它可以承担更多任务,如回电话、播放语音邮件、调节屏幕亮度,以及更多。
新增功能
2016年6月14日,在2016全球开发者大会上,苹果已经对Siri进行大幅升级,允许外部开发者利用这款语音控制应用。现在,Siri可以做到很多事情,比如打车、通过聊天应用WhatsApp发送短信、使用Square Cash应有转账等。此举有助于苹果赶超亚马逊,后者已经允许第三方开发者向其智能扬声器Echo中添加功能。
2017年6月6日,在2016全球开发者大会上,Siri也得到了升级,她可以使用更加自然的声音,并加入了男声。使用全新的视觉界面和翻译功能,支持英语和中文之间的相互翻译。
2018年6月5日,2018年苹果WWDC开发者大会上,Siri小更新,增加Shortcut功能,打通第三方软件语音控制。
2021年4月1日,苹果发布iOS 14.5 beta 6测试版系统,对英语系统,苹果公司给Siri带来几项变化。从iOS 14.5开始,Siri将不再默认为女性语音,并且会添加两个其他语音选项供用户选择。
附件列表
词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。

