Home > IT Observation > 畅想未来:关于计算的思考

畅想未来:关于计算的思考

by 微软亚洲研究院

编者按:崭新的、令人信服的想法正在改变着未来的计算,其中伴随着太多的变化,将给我们的职业和社会带来重大的影响,并引发一些深刻的技术问题。

本文译自《IEEE Computer Society》2012年1月刊

作者:微软公司Daniel A. Reed, Dennis B. Gannon, and James R. Larus

随着研究的想法变成现实,计算领域的基础性假设正在迅速瓦解。

处理能力不断迁移到一系列专门设备上,包括无处不在的智能手机以及日常物品中嵌入的传感器。多点触控、3D和语音处理等长久以来人们所设想的自然用户界面元素正在成为主流。数据存储密度正以指数速率增加,因此个人也能将有关日常生活的数字化记录保存在本地设备和云设备中。物联网——相互连接的智能对象所组成的不可见的网络——有望改变我们与日常事物交互的方式。毫无疑问,数字技术的进步以及我们不断变化的期望将对传统的隐私和安全观念提出严峻的挑战。

新老技术的不断变化不仅带来了令人振奋的研发挑战,也创造了有望改变我们未来的创意思路和实现方式。例如,智能手机和无线设备的爆炸性增长造成了无线频率波段的短缺。认知性无线电技术能否改变通信领域的技术和商务动态特征,并实现更加灵活和自适应的频段使用呢?

如图1所示,对当前趋势的预测表明,与互联网连接的设备将在短短的几年内达到50多亿部。我们如何才能用最佳的方式管理和保护它们呢?我们能否让历史上根深蒂固的隐私和安全观念适应于充满了云服务和跨境数据流动的新世界呢?今天,每一个云数据中心所蕴含的计算和存储能力都超过了几年前的整个互联网。我们如何才能最好地设计这些系统,从而实现灵活而高能效的运转呢?

图1 随着许多技术的进步,其中包括单芯片多功能系统、遍布式云服务以及通过认知性无线电技术实现的数字通信,物联网将成为可能

新的计算技术也带来了新的契机,帮助我们解决重要的社会难题。世界上大部分地区的人口都在老龄化。这些新技术能否提高老年人的生活质量?生物学的革命如何才能充分利用信息技术的进步,提供真正个性化的医药?教育系统能否应对未来人们在职培训的需要?数字化教育手段能否适应“适时”培训和技能更新的需要?我们能否使用这些新技术来更有效地管理日益增长的清洁能源需求?

预测未来总是充满了危险,这一点在对以往任何技术预测的回溯验证中都可以看到。然而,这些科技和社会的变化是如此重大,以至于我们必须考虑它们对于未来研究、计算科学教育以及更大范围社会反应的影响。

计算技术发展的主要趋势

在计算领域,我们已经习惯了令人目不暇接的变化——短短几年内计算设备的容量、性能和成本都产生了若干数量级的变化。这些变化源自技术进步以及适当技术组件的机智整合。正如已故大师Jim Gray所指出的那样(注1),技术组件的成本和性能决定了任何设计的技术和经济可行性,及其相应的实用性和应用范围。从主要组件技术的发展趋势方向加以思考,必定会有所启发。

硅微缩与摩尔法则

几十年来的,CMOS制程微缩技术通过缩小晶体管特征尺寸,制成了更快的处理器芯片,功耗更小,成本更低。这种平衡、按比例的变化被称为丹纳德微缩(注2),它曾是摩尔法则(注3)的技术推手,不过它目前面临终结,其原因就在于简单的物理学规律:一个晶体管的栅极绝缘体现在只有几个原子那么厚了。

目前,我们已经不能继续降低晶体管的供电电压了,伴随每次特征尺寸的缩小,电压都要下降30%。如果不显著降低电压,随着晶体管的缩小,其芯片的功率密度将以平方指数速度增加。简而言之,未来的工艺技术将允许半导体制造商在同一块芯片上放置更多的晶体管,但它们的速度并不会快很多;而且如果拿不出标准CMOS的替代品,它们的能效也不会进一步提高。这种趋势的负面影响之一,就是我们可能无法同时为芯片上的晶体管供电。

单处理器性能提升速度的放缓已经在改变着计算行业的格局。多核处理器的盛行让并行编程成为了一种规范,而非特例。对于Web服务和云计算等并行应用,多核芯片带来了立竿见影的性能优势。此外,多核并行处理实现了计算的异质性——用专门化的协处理器执行特定任务,并大大低功耗,这对于低功耗移动设备而言,不失为一大福音。

毫无疑问,半导体技术的进步将继续推动多核芯片在功耗、成本和并行处理能力等方面的改善,让人机交互方式变得更丰富、更自然,并得到大规模云服务和数据分析的支持。其中重大的挑战之一,将是创建相应的编程模型和工具,帮助运用新的并行和分布式理念进行软件设计,教导新一代学生和开发人员去使用它们。

多设备世界、物联网和云

计算的历史就是一个日益民主化的过程。大型计算机的稀有和昂贵迅速催生了第一台微型计算机,然后是工作站,最近又出现了个人电脑。今天的智能手机和平板电脑成为最新一代的服务获取工具。摩尔法则、集成度提升以及海量终端带来了又一次转型——物联网的兴起,将智能嵌入到日常物体之中。

虽然很久以来计算机就一直被嵌入在各种物理设备之中作为控制单元,但最显著的变化在于,它能够让哪怕最便宜的设备与互联网连接。我们每个人都已经拥有数十乃至上百件带有嵌入式计算系统的物品,而且连接到互联网的“物品”数量大大超过了使用它们的使用者数量。

在这里,我们把云计算定义为托管在庞大数据中心内,并且覆盖整个互联网的服务,它促成了无处不在的网络搜索、托管软件和社交网络。它还提供了分析功能,让移动设备对各自的行为进行适配和个性化——例如,用户使用自己的位置信息来查找附近的理想餐馆。

云是物联网的粘合剂。设想一下,电动车需要经常充电,而如果每辆电动车的车主都在下班后才开始充电,那么电力需求可能会超过当前电网的承载能力。但是,车辆所需要的充电量以及充电时间往往取决于驾驶者第二天必须要去的地方,这些信息是可以在保障隐私和安全的前提下,从日历中推断出来的。驾驶者的软件代理可以访问他或她存放在云中的日历,再与车辆取得联系以确定电池剩余电量,然后与电力公司的代理商讨论充电时间的安排。这种经由无处不在的网络、共享数据和基于云的代理而实现的合作将带来显而易见的好处,有助于调整电网负荷、简化车主的管理负担,从而增加私人购买电动汽车的吸引力。

云还提供了一个平台,用于建设完善的服务,让互联网连接设备的功用远远不止于替换上一代“傻子”设备那么简单。云可以用来存储那些需要随时可以被大量独立设备访问的数据,并提供了足以应对复杂代理需求的计算资源。嵌入在设备中的计算机将受到成本、功耗和尺寸的限制,这反过来又制约了能够直接运行其上的软件的通用性和完备程度。基于云的代理消除了许多诸如此类的限制。

当然,这种转变在安全、隐私和自主性等方面提出了许多挑战,特别是由于这些带有网络连接的设备可能会受到恶意攻击以及更难以察觉的隐私权侵犯。虽然硬件和软件的改进可以更好地防范恶意攻击,但隐私权保护需要对社会规范达成更广泛的协议,以及强制执行这些协议的机制。

云数据中心与缩放

2011年底,新创建和复制的信息数量超过了1.8 zetta字节(注4),信息的生产速度还在继续增加。这种增长的影响是令人吃惊的:当今世界上90%的数据是在过去短短两年中产生的。这些数据的来源数不胜数,其中包括通过廉价却高分辨率的传感器所收集到的爆炸式增长的科学和工程信息;数字通信和以计算机为媒介的人类交往;位于建筑物和交通系统内部的智能基础设施;以及能够通过物联网感知、创建和沟通数据的工业机器。

这些数字化信息洪流通常驻留在全球各地分布式网络中的云数据中心内,其中规模最大的数据中心要消耗几十兆瓦的电力来支持成千上万台服务器和数十peta字节的存储容量。微软、谷歌、亚马逊、脸谱和其他云服务运营商正在建设由此类数据中心构成的全球网络,以托管应用程序,并提供消费服务。移动设备和物联网已经推动了包装和电源管理领域的创新,它们同样也将助长云数据中心建设的创新。

云可以用来存储那些需要随时可以被大量独立设备访问的数据,并提供足以应对复杂代理需求的计算资源。

传统数据中心往往以高架地板、荧光灯照明和空气循环为特征,而它们现在已经让位给强调能源效率、迅速部署和弹性运作的新模式。现在的数据中心建筑模块已经有些类似于集装箱,每个箱子里都预先配置了数千台服务器,只需要进行电源、网络和冷却等基本连接即可投入运转。它们可以迅速地运送和部署,实现了设施建造与设备配置的分离。同样,传统的冷却模式也退出了舞台,取而代之的是高温运作方式——以略有增加的组件故障风险为代价,换取较低的冷却成本,或者实行空气方面节约——利用环境空气进行冷却。

尽管在物理基础设施上进行了改善,数据中心仍在不断提出有关低功耗节点设计、包装、集成和运行的严峻研究课题。除了硬件之外,数量巨大的机器及其堆积如山的工作负载也对网络管理、容错和应变能力、工作负载优化和配置以及系统架构提出了挑战。

软件和云服务

自从现代数字计算技术诞生以来,软件一直是用户自主开发或与计算机一并购买的,堪称完成计算或数据分析任务的神器。但是,越来越多的消费者和企业希望购买软件所提供的服务,而不是软件本身。现在,大家可以使用微软Office 365或“谷歌文档”来写论文或书稿,并用微软的Windows Azure或亚马逊Web服务存储成为文档,而无需再购买和安装单机版的软件了。

这种趋势拥有巨大潜力,能够简化众多人机交互,用可以随时随地、通过任何设备访问的数码相册等概念来替代机器和文档等低层级的抽象概念。经济模型也在不断延展,包括了借助所支持软件服务投放广告的做法,其中最抢眼的要数网络搜索了。这一新的范式以经由云共享存储和计算连接在一起的各种设备为基础,因而要求采用新的软件开发实务和技术。

在并行分布式系统上开发和演进服务,而且还要能够支持在地理上处于分布状态的数百万用户,这将是一项艰巨的挑战,因为服务必须要高度可用和可靠:一旦出现故障,就会影响到数百万人的生活。因此,研究人员必须能够在维持系统正常运转的同时,针对其中的错误或可能的安全攻击而开发及部署软件更新和应对措施。

基于云的数字助理可以像真人助理一样,承担多种任务,同时还能够提供存储在云中的丰富数据。

云服务平台已经在改善软件开发流程,这也是势在必行的。现在,对错误的实时反馈(注5)允许开发团队迅速找出潜在的缺陷;而设备和云之间的紧密连接也允许对已部署软件快速而持续的改进。但软件中仍继续存在着大量缺陷,而且往往成为了恶意攻击的命门。软件架构的改进(注6)和软件缺陷检测工具的广泛采用可以大大提高对攻击的应变能力,但这个重要领域需要更多的努力。

WIMPNUI

传统上,我们与计算设备——无论是个人电脑、平板电脑还是智能手机——的交互要借助图形用户界面,它依靠清晰无误的系统响应。过去30年来“视窗-图标-菜单-指向(WIMP)”范式一直在人机互动中占据着主导地位,目前已经无处不在,而这一范式的历史则可以追溯到施乐PARC的开创性工作中。(注7)基于自然用户界面(NUI)的全新人机交互模型已经为时不远。有了NUI,人类就能用自己的手势和语音与计算机进行交互。这个想法在科幻小说中已经存在很长一段时间了——例如,在“Stanley Kubrick’s 2001: A Space Odyssey”中,偏执狂计算机HAL就有一个发达的NUI。语音识别技术也具有悠久的历史(注8),但它在过去10年间取得了长足进展,目前许多智能手机都能够通过语音输入进行网络搜索。

一项更大的挑战在于人类手势的识别。围绕计算机视觉的工作已经进行了许多年(注9),而在过去15年间,手势识别的研究更是日益深入(注10)。微软的Kinect则是以硬件形式实现NUI思路的最新商业典范。Kinect和Xbox都在使用了深度摄像头和麦克风阵列来读取手和身体运动,但Kinect还可以响应语音指令,如“Kinect,请搜索《星球大战》视频”,或者“Kinect,请播放视频。”让Kinect成为可能的突破性技术(注11),是深度图像的利用,以及训练有素的分类器,它能将身体各部位映射到3D模型上,这样,系统就能把用户自然而然的移动、指向和姿态理解成为计算机指令。

推断性和辅助性计算

为了实现真正的自然用户界面,我们必须超越对“明确命令做出反应”的思路,而要打造能够理解隐含询问,并推断问题和行动的系统。基于云的数字助理可以像真人助理一样,承担多种任务,同时还能够提供存储在云中的丰富数据。苹果公司的Siri是这种能力的第一张杰出面孔(参见www.apple.com/iphone/features)。这个助手能够通过对个人数字设备数据流量的监测,推断用户所处的情境,这种情境信息还可以帮助数字助理来处理界定模糊查询和问题。

建造可以推断用户行动或兴趣的计算机系统,这是个非常棘手的问题,但研究人员正在取得进展。例如,搜索引擎识别用户意图的能力已经大有长进——通过挖掘搜索查询数据,它们可以显示搜索字符串中头几个词之后最有可能的补足语。同样,新型徒手绘图程序ShadowDraw(注12)能够搜索与用户所画草图类似的图像集,以便找到能够帮助指导绘图的模板。系统可以根据用户的笔触,动态检索匹配的图像,把它们与不断推进的绘图动作相契合,并根据匹配度得分进行取舍,而且整个过程都是实时的。

从海量数据中出现并兴起的“大数据分析”目前正帮助我们推断其他用户的行为模式,并(通常)能够了解用户的意图。正如大家在《Jeopardy!》中所见,IBM的沃森是数据挖掘技术的突破性应用,其中系统以并行方式将几十种专业化、个性化的机器学习算法应用于分布在多个处理器上的peta字节级别的非结构化文本数据之上。沃森可以从看似无关的单词和短语之间发现隐性关联。

多模式通信

WiFi设备和智能手机的快速增长给无线数据访问带来了前所未有的用户期望,也让电信监管部门和移动运营商面临更大的压力——如何分别通过频谱分配和基础设施来满足用户需求。我们中间不少人都曾经有过通话掉线或无法在拥挤区域连接到WiFi的经历,不断增长的需求和能力之间的紧张关系是深刻而具有实质性的。如今,由于智能手机和WiFi通信主要使用800兆赫和2.5千兆赫之间部分频段,这种紧张只影响到了电磁频谱的一小部分。

这两种趋势可能将迫使我们摒弃固定频段分配的传统方法,转而采用更加灵活和动态的适应性管理。首先是NUI的兴起,这将必然体现在来自多个传感器及设备的数据融合与呈现,而后者则运行在各不相同的通信频段和物理距离上。从基于蓝牙等技术的近距离通信,60 GHz高清晰度视频传输,WiFi,超级WiFi (whitespace),跨越数十米到几公里的蜂窝通信,直到智能电网和智能交通系统所用的低带宽、长距离通信,多模式通信都将成为常态,而非例外,这样才能创建和提供整合体验。

随时随地信息访问的预期持续增长,再加上通过语音、视觉和手势进行的多模态互动,将促进认知性无线电通信协议和标准的采纳和部署。基于多个标准(功率水平、使用服务类别的优先次序、付款或访问方法以及传播特性等)的实时频段接入协商可能会变得更为常见(注13)。反过来,这也将需要制定新的频段管理政策和规则、无线电和协议标准,以及持牌及无牌频段接入服务提供商的分类。

隐私规范的变迁

数字化信息快速增长,而我们个人的数字存在也越来越广(其定义为个人进行社会网络互动、网页浏览、电子商务和特定位置服务等行为的总和),这两大因素引起了人们有关数字隐私和信息管理等新问题的关切。我们对于隐私和安全的概念大多是植根于物理位置和个人,但数字信息能够快速且轻松地跨越组织和行政边界,从一台设备移动到另一台设备,又在云服务数据中心之间流动。同样,我们对于数据获取的观念大多数也是一分为二的:数据要么是经过加密而不可访问的,要么就是明晰而可用的。

然而,现实中的信息获取更加琐碎和微妙,这一点是任何曾在社会网络上进行过信息共享规范配置的人都了解的。“朋友”是一个复杂而不断变化的概念,它取决于有关各方的主观认知、最近的行为以及情绪等。同样重要的是,不同地区、文化和年代对“可接受行为”的理解也是千差万别的。

所有这些都表明,我们必须重新思考我们有关隐私和安全的观念,以及与数据、流程和个人保护相关的技术机制。正如公共密钥加密技术让个人和组织得以安全地存储、处理和传输数据,我们也需要新的协议和标准来反映了当今在线交互的复杂现实。这些协议和标准有可能至少以下列三项信息共享原则为基础:

·生命周期约束:限制数据可以访问的时间窗口;

·传送行为的边界:界定信息在最初收件人以外的共享程度;

·基于声明的访问:指明数据可用于哪些目的。

通过这样的模式,移动用户可以仅允许自己目前所访问商店的经营者在接下来的5秒钟内使用自己的位置信息,而且仅用于指引自己前往提供所需产品的货架。上述信息不得用于其他目的、保留或共享。其中的挑战在于,如何在允许用户实施此类掌控的同时,保持限定条件的直观、简单和非侵犯性;同时创造条件,让新用途和经济模式发展壮大。

展望未来:研究及其社会影响

深度纳米领域的丹纳德微缩在技术方面为研究界提出了挑战和机遇;物联网和云服务增长,并通过NUI在整个计算科学及工程学领域内实现了融合。我们该如何设计云服务,用于管理和集成纷繁复杂的互联网连接设备(它们已经成为连续的信息结构)?认知性无线电技术能否提供这些数据流所需的频段容量?什么样的软件和加密安全技术能够最好地保护我们的数字存在?此外,优化数据中心的能源和水源利用效率,同时又能在资源受约束的地区全球部署它们,这将是一个重要的活动领域;应变能力和服务可靠性的管理也是如此。

尽管表现形式多样,但这些技术挑战大都具有一个共同主题:它们都是系统性问题,需要具有计算和通信领域多个分支学科的见解和专门知识才能找到解决办法。因此,这些问题的解决方案最终将要求我们重新思考计算研究和教育的元素,强调并行和分布式计算是常态而非特例,研究更广泛领域的组件和子系统间相互作用以实现系统可靠性和复原能力;同时考虑人类行为动力学与互动。

这些技术发展趋势也带来了破坏性的社会影响,因为技术变革速度对社会结构的适应和反应方式提出了越来越严峻的挑战。过去要经过一代人才可以完成的转变,现在短短几年内就会发生,与随之而来的是对经济、社会和政府的干扰。为了有效地解决这些问题,我们需要吸引、教育并雇用能够广泛代表人群利益的计算技术劳动者。21世纪的计算必须涵盖最广泛意义上具有深刻重要性的应用技术,而不是仅着眼于硬件和软件。

这意味着我们要研究人们与个性化机器人和自主驾驶车辆相关的法律、社会和文化期望,以及它们将如何促进老龄化人口的独立性、流动性和安全性。这意味着我们要思考物联网和云的推测和分析能力将如何通过与可再生能源、智能电网和智能交通系统的整合来维持经济发展,同时减少人均能源消费。

我们需要确定真正意义上的个性化医药以及从个人传感器网络上收集到的数据将如何降低医疗成本、提高生活质量,而不至于影响个人隐私。这也意味着要探索宽带接入和教育材料的多媒体呈现将如何为劳动者提供适时培训——现在他们正面临技术和商务转变而造成的经济混乱。

这是一个令人兴奋而又充满挑战的时代。随着计算技术民主化进程的加快,各种规模的计算都将创造新的机会。计算将越来越成为教育、研究、商务、政府和社会交往的遍在性基础,与合作伙伴们携手引导整个产业前行,这是我们的机会和责任。

参考文献

1、T. Hey, S. Tansley, and K. Tolle, eds., The Fourth Paradigm: Data-Intensive Scientific Discovery, Microsoft Research, 2009.

2. R.H. Dennard et al., “Design of Ion-Implanted MOSFET’s with Very Small Physical Dimensions,” IEEE J. Solid-State Circuits, Oct. 1974, pp. 256-268.

3. G.E. Moore, “Cramming More Components onto Integrated Circuits,” Electronics, Apr. 1965, pp. 56-59.

4. J.F. Gantz and D. Reinsel, The 2011 Digital Universe Study: Extracting Value from Chaos, Int’l Data Corp., June 2011; http://www.emc.com/collateral/demos/microsites/emc-digitaluniverse-2011/index.htm.

5. K. Kinshumann et al., “Debugging in the (Very) Large: Ten Years of Implementation and Experience,” Comm. ACM, July 2011, pp. 111-116.

6. J. Larus and G. Hunt, “The Singularity System,” Comm. ACM, Aug. 2010, pp. 72-79.

7. C.P. Thacker et al., “Alto: A Personal Computer,” Computer Structures: Principles and Examples, D.P. Siewiorek, C.G. Bell, and A. Newell, eds., McGraw-Hill, 1982, pp. 549-572.

8. K.H. Davies, R. Biddulph, and S. Balashek, “Automatic Speech Recognition of Spoken Digits,” J. Acoustical Soc. Am., Nov. 1952, pp. 637-642.

9. R. Szeliski, Computer Vision: Algorithms and Applications, Springer, 2010.

10. V. Pavlovic, R. Sharma, and T. Huang, “Visual Interpretation of Hand Gestures for Human-Computer Interaction: A Review,” IEEE Trans. Pattern Analysis and Machine Intelligence, July 1997, pp. 677-695.

11. J. Shotton, et al., “Real-Time Human Pose Recognition in Parts from Single Depth Images,” Microsoft Research, 2011; http://research.microsoft.com/pubs/145347/BodyPartRecognition.pdf.

12. Y.J. Lee, C. Zitnick, and M. Cohen, “ShadowDraw: Real-Time User Guidance for Freehand Drawing,” Proc. SIGGRAPH, ACM, 2011; https://webspace.utexas.edu/yl3663/~ylee/shadowdraw/ShadowDrawSiggraph11.pdf.

13. P. Bahl et al., “White Space Networking with Wi-Fi-Like Connectivity,” SIGCOMM Computer Comm. Rev., Oct. 2009; http://ccr.sigcomm.org/online/files/p27.pdf.

作者简介:

Daniel A. Reed是微软公司全球技术政策副总裁。加入微软之前,他曾任北卡罗莱纳大学教堂山分校的杰出教授,并是北卡大学文艺复兴计算研究所的创始人。在此之前,他曾经是伊利诺伊大学香槟分校的Gutgsell教授、计算机科学系主任以及国家超级计算应用中心主任。Reed持有普渡大学计算机科学博士学位。他是IEEE和ACM的院士。

Dennis B. Gannon是在微软公司技术政策小组云计算研究项目总监。在加入微软之前,Gannon是印第安纳大学信息与计算学院计算机科学教授,并担任普及科技实验室主任。他拥有加利福尼亚大学戴维斯分校数学博士学位以及伊利诺伊大学香槟分校计算机科学博士学位。

James R. Larus是微软研究院eXtreme计算组的总监,他目前研究的方向是云计算编程模型和大规模计算定制硬件。他拥有加州大学伯克利分校计算机科学博士学位。Larus是ACM院士和IEEE会员。

Advertisements
Categories: IT Observation Tags: ,
  1. No comments yet.
  1. No trackbacks yet.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: