数字化的能耗陷阱
【环球科技】
作者:安妮-塞西尔·奥格里,系法国雷恩计算机科学和随机第三研究所的科学家,劳伦特·莱弗尔,系法国里昂高等师范学院并行计算实验室的研究员 翻译:郭众
电子设备越来越多,网络速度越来越快,云端应用越来越方便,但它们带来的能耗也越来越不可忽略。
由于新冠肺炎疫情的影响,居家办公对许多公司来说越来越重要。居家办公使通勤明显减少,也省下了办公室的暖气和电力费用。但是,居家办公,以及随之而来的对互联网的大量使用真的对环境有益吗?要回答这个问题,我们必须了解数字技术对生态有哪些影响,以及如何降低这些影响。但遗憾的是,当想要对复杂网络化的系统进行深入研究时,评估就会变得极为复杂。
1 为何要计算互联网的能耗
互联网介入大众生活已有大约30年。到目前为止,它已经成为约46亿用户不可或缺的工具。这项成就推动了万维网的快速发展。日常生活中越来越多的领域正在向线上发展,包括电子邮件、即时通信工具、搜索引擎、社交网络、云存储、流媒体服务等。
互联网的结构也随着时间的推移发生了变化,为了满足用户日益增进的需求,它需要变得越来越复杂。然而,一个许多用户忽视的事实是:与此相关的技术也消耗了大量的能源和资源。
在我们如今生活的时代,气候变化的影响首次变得如此明显。在工业国家,政府目前已经开始联合科学家共同制定保护环境的措施。但到目前为止,几乎没有任何关于数字化发展后果的研究可供参考。只有少数研究表明,无论是在能源、原材料的消耗还是在碳足迹方面,相关的现状都令人担忧。然而,研究很难给出一个具体的数字,因为不同研究得出的结果也存在较大的差异。
在2014年发表的一篇论文中,葡萄牙里斯本技术大学的弗拉德·科罗阿默和瑞士苏黎世大学的洛伦茨·希尔蒂开展了一项综合研究,分析了过去10年间所有关于互联网能耗的文章。他们在研究中发现,不同结果间的差异可以达到4个数量级。有几个原因造成了这种结果:测量中的准确性、模型中使用的近似值以及研究的范围。例如,在面对终端设备带来的影响时,考虑与不考虑这个因素就会造成巨大的差异。这就是为什么我们很难确定居家办公是否对整体环境有益,换个方式来理解:我们很难确定使用一次搜索引擎的能耗,它到底相当于电热水壶工作10分钟还是3小时的能耗?
近年来,科学家开始频繁地讨论这个复杂的话题。为此,我们分别分析了构成互联网的联网系统和相关技术设备。我们的目标是详细分析出每个独立模块的能耗,并找到尽可能降低能耗的方法。在我们能成功做到这一点之前,还有大量的工作需要推进。但目前我们已经在这方面取得了一些进展。
2015年,国际研究组织GreenTouch发表了一篇文章,设想可以建立一个全球性的互联网设施。在这套设施的基础上,即使数据流按现有的程度持续增长,2020年的能源消耗也会比2010年减少98%。如果这个建议在北美、欧洲和日本实施,节省的碳排放量将相当于580万辆汽车的排放量。然而,实施这项举措需要更改大量的基础设施结构,变革大量的技术。
2 互联网是由什么组成的
对于这样的评估,我们首先要了解网络涉及哪些硬件和软件系统、它们的使用方式以及使用它们需要多少电力和其他原材料。例如,如果我们在搜索引擎上搜索一个术语,这一动作会同时调动物理(硬件)结构和虚拟(软件)结构。前者包括进行查询的设备(例如 PC、智能手机或平板电脑)、用于传输数据的多个网络以及处理搜索请求的位于数据中心的服务器。
服务器上可以安装虚拟机。它可以模拟生成一个独立于服务器操作系统的环境,在这个环境中用户可以执行程序和应用。同时,在线服务大多基于云计算,这意味着数据处理所需的基础设施位于云端。供应商根据使用性能指标和负载平衡来选择合适的设备处理请求。这种操作占用的资源量取决于服务器所在的位置。因此,使用不同的处理方式来处理请求时,能耗结果会有很大差异。
相比于搜索,如果我们研究在线视频背后的运行机制,事情就会变得更加复杂。根据“The Shift Project”(一家致力于发展无碳经济途径的法国协会)的数据,视频流在2019年占全球数据流量的80%。
通过电视观看视频时,单个信号发射器是同时向多个接收器传输数据的。在线视频则不同:每个观看者都拥有自己的数据流,这意味着观看在线视频时,数据流量与用户数量成比例增加。在通过电视观看视频时,数据流量仅取决于信号中包含了多少个频道。
这就是为什么像网飞这样的平台不能像普通网站那样使用客户端—服务器系统的原因。在普通网站中,中央服务器将数据分发给多个用户。而网飞等平台不同,它们需要通过内容分发网络将数据复制到各地的服务器中,让服务器尽可能在地理上接近消费者。
这种强大的冗余结构可实现可靠的视频传输并避免长距离数据传输。为确保数据完美地传递给客户,视频必须随时能以不同格式出现在全球各地,并且重复使用。因此,流媒体供应商会调用分布在多个数据中心的大量服务器。2018年,来自英国伦敦玛丽皇后大学的蒂姆·博特格和他的同事研究推测,为了投递视频内容,网飞至少在600多个数据中心使用了8500台服务器。但是,这些数据中心并不属于网飞,而是属于相应的网络运营商。
已有研究清楚地表明,网络数据的传输会途经许多设备。互联网的物理组成分为三个部分:有线或无线网络、装有服务器的数据中心以及用户的终端设备。这些设备和网络都会对环境产生影响,而这正是我们的研究目标。
为了估算通信网络的能源消耗,我们需要以技术标准来分类评估。例如,有基于铜线、光纤或无线的传输方式分类。此外,网络依赖于路由器、交换机和天线等设备,这些设备的使用寿命有限并且也会对环境产生压力。
网络运营商现在提供多种蜂窝标准服务:2G、3G、4G和5G。但是,当出现新技术时,为了确保所有终端设备的正常使用,运营商并不会停止旧技术的服务。对于消费者来说,为了能够使用最新技术,通常必须购买新的设备,这就让希望使用最新技术的用户不得不替换掉原本还可以使用的手机。
每代网络技术都会增加每个用户的可用带宽,这实际上是增加了数据流量。法国电子通信监管机构(Arcep)在2020年4月报告称,2019年法国SIM卡的平均月消费量为7GB。但仅看4G SIM卡的平均月消费量时,流量却达到了9.5GB。
数据收发过程中还有不同的协议,它们规定了网络中的数据是如何接收和发送的,并保障了通信过程的稳定性和通信性能。但在发展过程中,人们并没有留心去减少它们对环境的影响。例如,与电信相关的设备(例如WLAN路由器)通常是永久开启的,因此会白白浪费大量能源。
3 数据中心的影响
除了电信网络,数据中心也会给环境带来压力。数据中心有大量的服务器,同时需要配套冷却系统和其他的冗余系统,以此保证运行的可靠性。与此同时,一些运营商正在测试各种热回收机制,希望减少电力的消耗。
许多专家使用PUE(电源使用效率)来衡量数据中心的效率,这个指标量化了除服务器之外的能源成本(主要是由于冷却)。运营商试图将PUE的值推向最理想的情况。在这种情况下,与信息技术设施的能耗相比,制冷能耗可以忽略不计。但是仅仅关注这个数字是没有意义的,因为它并不能评估信息技术设备的使用效率。
一些大型数据中心使用它们自己生产或购买的可再生能源。可是,这往往达不到自给自足的程度。按照苹果公司的官方声明,他们产生的再生能源与公司所消耗的一样多。然而,发电装置在白天和天气好的时候才可以运行发电,而耗电装置却是连续运行的。所以苹果公司会卖掉(白天好天气时)生成的多余电力,并在夜间回购设备运行所需的部分电力。
数字基础设施的主要问题在于它们的使用状态一直处于变化中。2015年,正常运行时间协会(Uptime Institute)估计:在美国,有30%的服务器在没有任何工作负载的情况下保持开机状态。虽然设备几乎没有工作任务,但功耗并不会趋向于零,而是趋向于最大功率的一半。虽然服务器的工作强度很低,它仍然会消耗很多能量,路由器等其他设备效率甚至更低。
因此,我们研究了如何尽可能经济地运营数据中心。2018年,我与同事伊萨姆·拉伊斯共同研究的结果表明,如果服务器已经有3分钟未使用,就应将其关闭。为了达到这个目的,还需要可靠的模型来预测服务器的使用高峰,以便提前重启设备。目前已经有算法可以计算这样的开启和关闭周期了。此外,我们还可以在不影响用户使用体验的情况下,将服务集中在一些服务器中。其他建议则包括控制处理器的频率和电压,这样可以在设备负荷不满的情况下降低功耗。所有这些方法都可以减少信息技术基础设施对环境的影响。
除了数据中心和通信网络,用户的终端设备也会对环境产生影响。2018年,全球约有90亿台终端设备,其中包括20亿部智能手机和10亿部电脑,其余的则由近年来越来越流行的智能设备构成。
这些智能终端的生态足迹促使我们不得不审视自己的消费习惯:产品所宣传的功能只是噱头还是真的能让我们的生活更轻松?从智能压力锅到糖尿病患者的血糖传感器——很难找到一个客观标准来评估。尽管如此,它们对环境的影响是可以确定的。
苹果公司在2019年进行了一项研究,评估配备16英寸屏幕、512GB存储空间和2.6GHz处理器的MacBook Pro在4年的使用寿命内的平均温室气体排放量。结果显示,这种笔记本电脑的碳足迹约为394千克二氧化碳。其中仅生产制造阶段就占了75%,运输阶段占比5%,使用阶段占比19%,处理阶段不到1%。按照这组数据,设备的使用年限必须要达到原来的4倍(大约16年)才能让使用阶段的碳足迹接近制造阶段的碳足迹。总的来说,加强产品的可持续性一定是可取的。
其他产品也有类似问题。据制造商称,自动调节房屋供暖的Google Nest恒温器的碳足迹为30千克二氧化碳(使用寿命按照10年来计算)。其中生产阶段碳足迹占82%,使用阶段占15%。这些设备必须运行大约55年才能平衡两个阶段的排放比例,但电池寿命往往达不到50年之长。
4 云与终端设备:哪个消耗更多能源
2019年,我们与博士生洛伊克·盖根开发了一个模型,计算网络系统的能耗。我们研究了谷歌的一款产品。从我们的研究结果看,如果云端只管理几个恒温器,那么云端的能耗大于设备节省的能耗,但恒温器数量一超过20,恒温器节省的能耗就会超过云端能耗。人们必须衡量两者的收益。
云端技术是其余联网技术中能耗最高的一项。网络摄像头将拍摄到的内容通过WiFi传输到云端进行图像识别,网络摄像头本身的功率是云端的一半。如果是通过靠近用户的几个小型数据中心处理信息,那么摄像头所消耗的能量甚至只有云端的三分之一。这种情况越来越频繁,尤其是在与5G网络相关的情况下。
通过我们的模型,我们还分析了智能电网等技术。它可以根据用户的行为来调节供电,合理控制能源供应,从而减少消耗。但是计算调整方式的成本是多少?我们可以继续优化吗?
到目前为止,关于智能电网碳足迹的研究很少。我们可以对已有交通流量进行建模并计算它对电网的影响,在电动汽车发展的背景下,我们通过模拟开发了一种优化基础设施软硬件的方法,通过对用电高峰加以缓冲措施限制电网的超负载运行。
许多科学家和公司目前正在研究使数字化发展更加环保的方案。一些方案避免不必要的能源消耗,开发更加环保的软硬件,提高能源的使用效率。也有方案旨在延长设备的使用寿命和制定能够反映实际环境影响的有效指标。
2015年制定的《巴黎协定》呼吁世人减少自己的碳足迹,人们通常将数字化视为解决方案的一部分,而忽略了数字化本身带来的问题。分析评估数字化的影响、控制和减少它带来的碳足迹非常重要。合理使用当前的信息技术,比如关闭不必要的浏览器标签页、使用下载音乐而不是在线流媒体听歌等,我们每个人都可以为减少信息化带来的碳足迹作出贡献。
链 接
一次网络搜索
使用一次搜索引擎需要消耗大量能源。涉及的硬件包括智能手机、路由器和数据中心的设备,它们都会消耗电力。当搜索结果返回时,所有设备会被再次调用。此外,一次搜索还会调用所涉及的每个网络中的应用程序和软件协议。在数据中心中,多台服务器会同时处理查找搜索结果以加快处理速度。对于某些搜索引擎,例如当您使用数据中心键盘输入时,它们会提供关键字,这时许多设备就已经处于活动状态。此外,许多网站还会使用个性化广告、用户身份验证或实时信息显示等服务。(见图一、图二)
图一
图二
互联网
互联网是一个由许多子网络组成的巨大网络,它连接了数百万个独立单元传输数据,每个用户基本上都可以平等地搜索信息。这一网络中立原则是保证在不区分发送者接收者或内容的情况下平等地对待互联网上的所有数据流。信息在各种网络之间来回流动,直到到达目的地。
互联网的底层网络包含一个核心区域,即人们所说的骨干网,它由高速光缆组成。在德国,骨干网共有74个节点,其中10个节点具有极快的传输速率(见图三)。
图三
节点连接到骨干网络的不同部分,然后通过电视电话线将数据传递给用户。德国最大的交换点位于莱茵河畔的法兰克福。
(本版图文由《环球科学》杂志社供稿)
《光明日报》( 2021年12月08日 14版)
玉融规划微信公众号
在手机上查看当前页面