苹果新品Siri创新有多强?
程序员文章站
2022-03-15 11:40:54
Siri可以让你简单地通过大声询问来查询天气情况或进行预约。但是Siri,这个苹果最新产品iPhone 4S上的“个人助手”功能,就真的如此先进吗?...
Siri可以让你简单地通过大声询问来查询天气情况或进行预约。但是Siri,这个苹果最新产品iPhone 4S上的“个人助手”功能,就真的如此先进吗?
那是当然,麻省理工学院的一位人工智能研究员Boris Katz说道。他说,苹果将语音识别和自然语音处理等领域内的既有技术整合起来,创造出一件“非常了不起的工程设计作品”。
Phil Blunsom是牛津大学机器学习领域内的一名研究员,他强调说,苹果不只是将这些现有技术拼凑到一块儿。但他有所保留地说道:“难点在于,这些系统每一个都会出现错误,并且当它们之间彼此相互馈送信号时,这些错误会叠加。”
活跃本体的概念并不新鲜——Siri的其中一名发明人Tom Gruber早在1995年就正式定义了这样一个概念。马里兰大学帕克分校的一位计算机语言学家Philip Resnik 说道,与早期的大型人工智能项目不同,Siri不同寻常的地方是,它“十分具体地专注于协助某些特定方面。如果你超出这些方面,就没有效果了。”
Siri可以听出诸如“墨西哥”或“墨西哥薄饼卷”一类的关键词,以确定话题范围。它还可以计算出是否要提供更多信息——比如何时可以预定位置——或者计算出它是否获得了足够多的细节,以访问某个预定网站,并下单预定。最后一步是可能实现的,因为现在多数网站服务都提供应用程序接口,让相关应用程序可以向它们输入信息。“这就是现在Siri可以研发成功的原因之一,而在5年或10年前,这是不可能的。”Resnik说。
Siri可以理解日常语言中表达的请求,这个能力把Siri与其竞争对手区分开来,比如安卓的语音指令功能。该功能要求用户使用特定形式的指令——发出“导航到某地”指令,它就会指引方向,但如果发出“我要去某地该怎么走?”指令,就不行了。看来谷歌还没有计划与Siri竞争。上周,谷歌的安卓研发部主任Andy Rubin说:“我不认为你的手机应该成为一个助手。”
Siri只会变得越来越好用。因为,所有输入Siri的用户语音请求都会经苹果的服务器处理,这就为苹果提供了一个数据宝库,使其可以用来改进Siri。Katz建议说,苹果可以挖掘这些数据,以发现Siri尚不能处理的常见询问问题。这十分简单,但是如果要让Siri“在我全家所有人都有空的时候,为我们订餐”,情况会如何呢?
Resnik说:“你所试图让Siri解决的很多任务都包含社交因素,Siri 2可能会对这一事实加以利用。”所以,比如说,你家人的iPhone上的Siri可以一起合作,协同组织就餐事宜。Blunsom说,苹果必须使这些预期保持现实性,否则人们可能会抛弃Siri,因为它“不能回答难以理解的问题,即使它可以为你在附近找到一家很棒的寿司店” 。
超强X射线粒子束通道探测地心
粒子束通道样机:右下图显示了实际操作情况下,对放置在一个“原位”小槽中的催化剂样品进行加热的情景。研究人员利用时间分辨X射线吸收光谱对该催化剂进行了研究。欧洲同步加速辐射中心的一种新型粒子束通道的分辨率仅为几微秒。
很多人也许并不知道,飞到火星要比钻到地底更为容易,因此,对于地震、磁场等知识来说,我们对地球内部情况的了解真的十分贫乏。为了研究在地球内部巨大压力下各种金属是如何相互作用的,科学家在实验室里挤压粒子并将其加热——但这是一种不精确的实验并且很难操作。幸而,欧洲新改进型X射线粒子束通道可能可以改善相关实验,并帮科学家理解地心发生的事情。
欧洲同步加速辐射中心新型粒子束通道ID24已经落成,并在为明年春天的相关实验做准备。它将让科学家能够对各种金属精确施加极端压力和温度,以理解它们在地心的行为如何。在其他的原子反应实验中,它还将能用于研究新型化学催化剂和电池技术。
同步加速器可以为粒子加速——Tevatron(兆电子伏特加速器)就是这样一种装置——并且应用范围广泛。其中一项应用就是,利用加速粒子的电磁辐射进行科学成像。同步加速器光源利用一系列磁场,把这种辐射弯曲成不同波长的光线。而在欧洲同步加速辐射中心,粒子束通道从粒子加速环里分开,捕捉相应波长粒子(通常是电子)辐射。新的粒子束通道ID24将使得极速X射线吸收光谱实验成为可能。
利用X射线轰击某个样品,就可以进行X射线吸收光谱实验,观察样品内部不同元素的原子是如何吸收X射线的——这是动态探测,要对实验本身进行监测。据欧洲同步加速辐射中心在发布的新闻中称,新型粒子束通道装有大量锗探测器,每秒可以进行100万次测量。所以,科学家可以把一小块铁样品放在粒子束通道中,将其加热到1万度,然后进行观察。这可以令人信服地帮助科学家理解铁在1,500英里深的地下的行为如何,还能推测其他出现在地幔和地心的金属熔点是多少。进而,科学家就可以对地球发电机等问题有所理解了。地球发电生磁的机制就和普通发电机一样,藉由某个部份运动的动能,产生电流和磁场。
欧洲同步加速辐射中心计划花费2.45亿美元(1.8亿欧元)进行升级,筹建8个新粒子束通道是升级计划的一部分,而ID24粒子束通道是最先完成的。
HTML5技术改变网络
HTML5是对一系列编程技术的称呼。史蒂芬`乔布斯不同寻常地在一篇文章里对HTML5表示支持,一年半之后,它迅速占领整个网络。
这项技术可使浏览器显示丰富多彩的画面和效果,它们能够响应用户的操作,不需安装其他软件就能提供游戏般的互动效果。开发商可以利用HTML5为各种智能手机、平板电脑和个人电脑开发完全兼容的产品,不用专门针对特定硬件或在线商店进行修改。在线商店已然成了移动商务的控制者。
这种光明的应用前景——尤其是苹果公司相关设备的诱惑——逐渐让其他技术坐上冷板凳。在最新的进展中,Adobe Systems Inc.在周三说,它将撤回为移动设备开发Flash插件的计划,而乔布斯先生曾反对开发Flash插件。
风险资本家Marc Andreessen断言:“HTML5是一个重大进步。”Andreessen在20世纪90年代的时候,曾帮助投资了首款成功的浏览器Netscape。
另一位硅谷投资人Roger McNamee预测,HTML5技术将能让艺术家、媒体公司和广告商以从前无法实现的方式提供差异化的网络产品和服务。他说:“HTML5让那些具有创造力的人可以重新大显身手。”
许多公司都纷纷押注HTML5。亚马逊用HTML5开发了一款基于网页的应用程序Kindle Cloud Reader,规避它向iPhone和iPad销售内容时苹果公司所做的相关规定。
《愤怒的小鸟》开发商Rovio Entertainment为该游戏开发了HMTL5版,无需安装应用程序就可以享受向猪头抛射小鸟炮弹的乐趣。Pandora Media公司也已利用该技术全面革新其广受欢迎的互联网广播网站,让它打开速度更快,而且更方便用户追踪其他用户的收听爱好。此外,《花花公子》和《体育画报》也采用了HTML5技术,让其在线读者可以放大图片并迅速翻页。
对于人们广泛使用HMTL5技术的趋势,苹果、谷歌和微软起到了推动作用——尽管它们是竞争对手,一向在技术选择问题上各持己见——但都在其最新的浏览器里提供对HTML5的支持。火狐浏览器开发商、Molliza基金会和欧普拉软件公司同样如此。
binvisions.com是一个追踪互联网技术的科技博客,据其报道,截至9月底,第三季度中最受欢迎的100个网站中有34%采用了HTML5。技术职位网站Dice.com称,从第一季度到第三季度,人力资源经理对HTML5技术人才简历的搜索量增加了一倍多。
尽管HTML5缺少一些重要功能,但人们对它的激情还是蔓延开来。而且,许多用户并不会发现采用HTML5网站与采用Flash的网站有何明显差别。
然而,在智能手机出现之前,Flash一直是占据主导地位的网页技术,它依赖于下载Flash插件到浏览器中。乔布斯生前拒绝在iPhone和iPad中给浏览器下载Flash插件这一方法,并在2010年4月发表的《对Flash的几点看法》一文中抨击了Flash。
Pandora Media公司从Adobe的Flash技术转而采用HTML5,因而它的互联网广播网站加载速度更快。
除了担心Flash的技术缺陷外,乔布斯先生还认为苹果不能在如此关键的技术上仰仗Adobe。于是,在苹果的移动设备上,依赖Flash播放的网站中,应该出现视频或图片的地方都是黑框。
Adobe当时虽对乔布斯的观点予以了回击,但也通过开发同时支持HTML5和Flash的编程工具来对冲风险。本周三,Adobe宣布将不再为移动浏览器开发新版的Flash。
谷歌安卓系统上的浏览器继续支持Flash。不过,Adobe交互式开发业务总经理Danny Winokur表示,开发商希望开发那些同时支持安卓系统和iOS的网络应用程序。
他说:“如果想要提供跨平台的网络体验,那就必须用HTML5开发。”
HTML5全名为超文本标记语言(hypertext markup language,HTML),该语言是用于开发网页的标准指令。但是HTML5这个名词涵盖甚广,包括各种技术,解决诸如排版、图形和视频一类的问题,创造一种类似应用程序的体验。
主管微软IE浏览器业务的副总裁Dean Hachamovitch说:“当向人们展示HTML5应用时,他们说这感觉根本不像网站。”
移动广告公司InMobi Mobile Insights的副总裁James Lamberti表示,HTML5技术对于那些在移动应用程序中展示精致广告的企业同等重要。他说,9月份使用这项服务的大型广告商数量已经从1月份时的62家增至250家。“如果他们要提供富媒体广告,那就会使用HTML5。”
目前,一些基于Flash的游戏尚未登陆iPhone和iPad。例如Zynga公司开发的许多热门游戏。Zynga公司位于旧金山,在与Facebook合作。该公司充分利用Facebook最新的HTML5移动平台,近期已发布3款适用于苹果产品的HTML5游戏。
不久前在旧金山举行的2011新游戏大会上,游戏开发商们对HTML5的兴趣显而易见。与会者指出,尽管HTML5游戏在画面和操作方面还无法媲美PC和单机游戏,但免费的网页社交游戏确实在不断吸引用户。
艺电公司的创意总监Richard Hilleman说:“现在竞争的不是收益,而是用户的时间。因此,我们的游戏要无所不在,登陆用户拥有的各种设备。”
至少从理论上来看,向兼容许多设备的HTML5游戏转变会减少苹果的一大优势——那些仅在苹果特定设备上才可以使用的成千上万款应用程序。
Zynga的首席技术官Cadir Lee预测,一段时间内,各公司将继续修改应用程序,使之适用于苹果等公司的设备。但是,他认为,HTML5最终会发展成为一场更为广泛的技术革命,就像创造出可以显示几乎所有内容的网页的技术革命一样。Lee先生说:“这次技术革命的下一个浪潮即将到来。”
虚拟机器人的数字思考
虚拟机器人获得了一个在人类中常见的认知技巧——进一步的证据表明,如果计算机要变得像我们一样思考,就得需要身体。
人类大脑的一个奇特嗜好就是,我们往往会将小数字跟我们身体的左半部分联系起来,而将大数字跟右半部分联系起来。
现在,人造虚拟世界里的机器人也染上了这个怪癖。这有助于揭示这样一个谜团:诸如数字一类的高度抽象概念是如何植根于我们身体同这个世界的相互作用之中的。
英国普利茅斯大学(University of Plymouth)的Marek Rucinski说:“数字太抽象太纯粹了,它们似乎是与现实世界分离存在的。然而,我们拥有的每个概念都多多少少地基于现实世界。”7月份,在波士顿举行的认知科学大会(Cognitive Science conference )上,Rucinski展示了这个虚拟机器人。
这种叫做空间-数字的反应编码联合效应(spatial-numerical association of response codes,SNARC)的现象已得到公认:人们的左手对小数字反应更快,而右手对大数字反应更快(通过敲击按钮测试)。与此类似,那些由于脑损伤而失去左半部分身体知觉的患者,在被问及某个数值区间的中间值时,偏向于回答较大的数字。
Martin Fischer说,这类数字-空间联系体现了一种广泛存在的、令人惊讶的观点:人们认为抽象思维的其他许多方面都植根于我们在感觉上和运动上与这个世界的互动之中。Fischer是德国波茨坦大学(University of Potsdam)具身认知(Embodied cognition) 学方面的专家,他说:“SNARC效应表明,即使是抽象知识,也可以直接追溯到那些我们在获取它们时的感觉和运动体验之中。”
对SNARC效应的公认解释是:对于西方人来说,他们在学习数数的时候,很可能是在一块黑板上按从左到右的顺序学习,或者由父母指示着从左到右学习。这种学习方式让小数字跟控制我们左半部分身体的大脑部位产生了联系——反之亦然——这种联系会带到成年。还有证据表明,在那些具有从右至左阅读文化的地区,这种联系是相反的。
为了更好地理解这些联系是如何形成的,Rucinski及其同事转而研究一个虚拟儿童——数字模拟的iCub类人机器人——并将其置于那些可能有助于在人类中形成数字-空间联系的环境进程之中。
iCub的成长过程起始于一个叫做“运动喃语”( motor babbling)的阶段,它任意地活动自己的虚拟手臂,并到处看,人类婴儿也会用这样的方式意识到自己身体的存在。在对人类大脑结构的原始模拟中,研究人员在iCub大脑中设置了三个空间处理区域:其中两个各负责一只手臂,剩下一个负责视觉活动。
接下来,研究人员给iCub展示一组从1到15的数字,以此教它数数。为了模拟西方人从左到右的数数文化偏好,研究人员将小数字显示在iCub左边,大数字在右边。然后,一种模拟人类大脑中神经突触连接形成方式的学习软件把小数字跟左半部分视图范围和左臂联系起来——右半部分与大数字之间的联系亦是如此建立。
接着,iCub就要接受SNARC效应测试。研究人员随机给它展示奇偶数字。在第一项测试中,当出现的数字是奇数时,iCub必须要用左手按下按钮,而当是偶数时,必须用右手;第二项测试中,按钮的规则是相反的。就像进行这项测试的人类一样,当出现小数字时,iCub用左手按下按钮的速度更快;当出现大数字时,它用右手的速度更快。
在接下来的改进型SNARC效应测试中,研究人员给iCub展示数字之后,紧接着会展示某个物体,不是展示在左边就是右边。iCub对该物体产生注意所耗费的时间会被记录下来。结果是:当出现小数字后,iCub会更快注意到接着出现在左边的物体;而当大数字出现后,它会更快注意到接着出现在右边的物体。
Rucinski对此进行了解释。以上两种测试中,在运动喃语和学习数数过程中所产生的这些联系意味着,只要简单地展示数字,这些数字就可以自动地激活大脑中的空间想象区域,这些区域要么与iCub的左半部分身体相联系,要么与右半部分身体相联系。这使得iCub可以更快地利用相应身体部位完成相应任务——无论是在经典SNARC测试中敲击按钮,还是在改进型测试中对某物体产生注意,都是如此。
Rucinski说:“这个模型为数字-空间相互作用提供了一个具体解释。”这些结果显示,从左到右数数的学习方式和人类婴儿身体生长发育过程,两者的结合就会出现数字-空间联系。他说,这并不意味着iCub的思维处理精确反映了人类大脑的思维处理过程——但它的确暗示,这种联系可以仅由这两种因素产生而来,而这两种因素人类都具有。
Fischer说:“对于我们在实验心理学领域正在进行的研究而言,这真是一个很棒的实验方法。”Fischer还补充道,他希望有朝一日,在认知机器人中进行的研究可以对那些继而在人类中测试的认知情况进行预测,不必绕弯路再用其他方法。
光免疫疗法挑战癌细胞
一只携带有植入肿瘤的小鼠接受了光免疫疗法治疗,结果小鼠身体右边的肿瘤用光免疫疗法治愈了。
美国国家癌症研究所研究人员说,一项新的精准光疗法杀死了小鼠体内的癌细胞,同时不会伤害癌细胞周围的组织,并且相信该疗法能用来治疗范围广泛的各种人类癌症。迄今为止该疗法比人们所实验的其他光疗法都要精准得多,它有可能会替代化疗和放疗。
据悉,这是美国国家癌症研究所的研究人员的一项新研究,研究人员将癌症特异抗体跟一种热敏感染料结合起来。其中染料在特定波长光源下会损害细胞,而抗体可以识别癌细胞外部的蛋白质,因此它们可以轻易并精确地找到靶标癌细胞,而不侵犯健康细胞体。抗体一旦与癌细胞结合,它们负载的热敏感染料分子就会激活,损害癌细胞。
这项研究由Hisataka Kobayashi领衔推进,研究人员实验了数种光敏剂(光激活分子),最后才找到一种叫做IR700的光敏剂。IR700会被近红外线激活,还能发出荧光,因此研究人员可以方便地观察治疗过程。他们将IR700附着在可以与3种不同蛋白质结合的3种癌症抗体上,这3种蛋白质分别是:HER2,某些乳腺癌人造血液首次输入人体 可以过HER2;EGFR,某些肺癌、胰腺癌和结肠癌可以过EGFR;PSMA,前列腺癌可以过PSMA。
通过研究植入肿瘤的小鼠,研究人员发现癌细胞可以与蛋白抗体结合,并且当它们暴露于红外光下时,细胞就被杀死。即使单一剂量的红外光也可以带来显著差异。研究人员说,红外光有额外的优点,可以穿透组织几厘米深,比其他波长的光源都要深。
研究人员说,该疗法的一个关键点就是它具有选择性。其他光疗法会损害健康组织,就像放疗和化疗一样,但是该疗法仅会靶向瞄准那些过表达特定癌症相关蛋白质的细胞。
要证实该疗法在人类中也有效,还有很多研究要做——比如,该研究中使用的乳腺癌蛋白质就仅仅只在不到一半的乳腺癌里出现——但是该团队说,他们的方法应用前景光明。该研究发表在《自然医学》杂志上。
MIT测量计测路人情绪
MIT情绪测量计大胆地宣称,它了解你所有的希望、梦想和恐惧。其实,可能并非如此。但是,它可以测量某个既定区域内的微笑数,提供某种情绪表达指示器。
麻省理工学院媒体实验室创造的作品件件令人难忘。该实验室的一个研究小组把一些精妙的面部识别算法置入一台摄像机和屏幕(或投影仪),这些算法可以实时辨识各种面孔和微笑——MIT情绪测量计由此而来。并且,向校园保安部门做了不会录像的保证之后,他们将该装置放在麻省理工学院校园内的4个不同地点。
他们用一个大大的卡通笑脸将屏幕上显示的真实笑脸做了放大。而那些皱眉头的面部和无表情的面部则被无表情图像覆盖掉。软件还可以估算出每个人的微笑程度,从0到100分打分,并将该区域的群体情绪表达平均值制作成一个“快乐指数”。这个实验确实鼓励人们微笑,正如在他们录制的视频中所看到的那样。
研究人员认为,该技术可以用来帮助演讲者和喜剧演员更好地与观众联系。
人造血液首次输入人体
人造血液首次成功地输入到了人类体内,如此一来,它可能会成为我们现实生活中的普遍事物。
巴黎居里大学的Luc Douay从一名志愿者的骨髓中提取出造血干细胞,并利用一组混合生长因子诱导这些细胞生长发育成红细胞。Douay的团队通过为这些培养细胞做上标记来实现追踪,并将100亿个这类细胞,相当于两毫升血液,注射回到骨髓捐赠者体内。
5天之后发现,这些血细胞中有94%到100%仍在体内循环。26天后,还有41%到63%在体内循环,而这是自然产生的红细胞通常的存活率。人造细胞有如正常血细胞一样的功能,在全身有效地携带氧气。纽约西奈山医学中心的Anna Rita Migliaccio说:“Douay证明,这些人造细胞没有出现双尾或三角异常形态,可以在体内正常存活。”
这对国际医疗保健界来说是一个大好消息。Douay说:“这项研究可让我们获得取之不尽的血液储备。”据悉,即使发达国家捐血人数也一直在上升,也就是说全球对血液储备的需求仍十分急切。特别是在部分艾滋病感染率较高的地区,因为健康血液储备更少,所以这种需求也就更大。
其他人造血液的努力都集中于研发某种人造的血液替代品,而不是用人为方法制造天然血液。比如,英国科尔切斯特艾塞克斯大学的Chris Cooper正在致力于研发一种基于血红蛋白的血液替代品,此替代品在未结合状态时比血红蛋白毒性低。与新鲜血液和由干细胞培养而来的血液不同,人造血液替代品不需要冷藏。所以人造血液替代品适用于自然灾害救灾输血或偏远地区输血。
然而,干细胞造血方法也有其支持者。Cooper说:“干细胞造血技术的优势是,输送这类血产品与输送天然红细胞更为类似,减少了对一些安全问题的担忧,在使用目前所生产的人造血液替代品的过程中,这些问题一直存在。”
Douay的研究发表在医学杂志《血液》(Blood)上。虽然他的研究结果是一个重大进步,但是要大量生产人造血液仍任重道远。Douay及其同事在实验中使用了100亿细胞,而一个需要输血的患者所要求的血量200倍于此。Robert Lanza是首批大规模在实验室中人造血细胞的科学家之一。Lanza建议利用胚胎干细胞进行实验,因为这类细胞产生的血细胞数量会是Douay所得到的10倍。
手指触控与笔控操作“进行时”
虽然现在的智能手机仅靠触控就可以操作,但手写笔还未退出舞台。事实上,要进行高精度操作时,一支精密的手写笔还是必需之物。位于加利福尼亚州的Atmel公司为安卓4.0和Windows 8公布了新款触控界面解决方案——maXStylus智能手写笔。它具有1mm纤细笔尖,同时支持手指触控和笔控操作。
利用maXStylus,用户可以方便地用一只手进行触控手势操作(比如双指缩放),同时可以用另一只手中的手写笔书写或画图。这是通过一个单独的铟锡氧化物(Indium tin oxide,ITO)传感器的多重感测(multiSense)功能来实现的。基本上,只要一个这种传感器就可以同时感测手指触控和笔控操作,而不像如今的传统方案一样需要两个传感器。
图形和网页设计者肯定会受益于精准的手写笔,特别是近来Adobe公司为平板电脑推出了Touch Apps系列软件。maXStylus还可以用来输入方程(通常很难输入),做手写记录,或者输入亚洲文字。
maXStylus技术的其他特点包括:
一是防误触。用户在使用手写笔操作时,可以放心地把手掌放在屏幕上,不会出现错误触控操作。
二是直径1mm的纤细笔尖和+/- 0.25mm的精度,模拟真实笔尖的精确度。
三是140Hz帧率。书写识别精确,手势捕捉速度快(比如单击、双击)。
四是分辨率高,让用户可以识别小字体,书写亚洲文字,捕捉手写笔的细微动作。
五是256个不同压力等级的压力感应能力,增强手写和作图能力。
六是单个铟锡氧化物传感器,简化了系统设计并降低了总成本。
七是手写笔跨平台兼容手机和平板电脑。
据Atmel公司称,maXStylus以及配套的各项技术兼容安卓4.0(冰淇淋三明治,Ice Cream Sandwich)和即将推出的Windows 8。maXStylus样品目前正提供给Atmel的合作伙伴试用,该手控/笔控输入系统的首次现实应用预计会到2012年初面世。
上一篇: 物联网行业试水语音识别“云”平台