0 引言
经济社会加速进入数智化时代,数字经济成为经济增长的新引擎。世界正经历百年未有之大变局,经济社会环境发生了深刻复杂的变化,新一代信息通信技术正广泛和深度赋能经济社会各领域,加速了全社会数字化、网络化、智能化的进程,数智化时代大幕全面开启。5G以高带宽、低时延、高可靠性的连接优势,与人工智能、物联网、云计算、大数据、边缘计算等技术相融合,加速构建云、管、边、端协同的一体化新型基础设施体系,为数字经济发展提供技术保障和实现手段,营造数字产业的生态环境。当前,数字经济已经成为推动经济快速增长、包容性增长、可持续增长的关键引擎,新一代信息通信技术融合赋能效应愈发显著、创新引领功能更加强劲,在催生新兴产业的同时,也在不断激发传统产业的活力,使得数字经济呈现出快速发展的趋势,对经济增长的作用愈发明显。
数据资源成为关键生产要素,新基建驱动大数据产业发展进入快车道。随着数字经济在全球加速推进以及5G、人工智能、物联网等相关技术的快速发展,数据已成为影响全球竞争的关键战略性资源。只有获取和掌握更多的数据资源,才能在新一轮全球话语权竞争中占据主导地位。伴随着互联网特别是产业互联网的普及和应用,数据资源正在加速产生、传播和应用,数据作为生产要素的重要作用日益凸显,数据的开放、共享和应用将进一步优化资源配置和使用效率。新型基础设施有利于促进跨地区、跨行业、跨部门数据的流动整合共享应用,最大化释放数据价值,不断催生新技术、新产业、新业态、新模式,加快新旧动能转换,同时也为大数据创造出更为丰富的场景,驱动大数据产业发展。
京津冀一体化等多重战略叠加,张家口产业转型升级跨越式发展。党中央站在国家发展全局的高度,做出了实施京津冀协同发展战略这一重大决策,提出要有序推进北京非首都功能疏解;加快推进重点地区发展,引领带动周边地区协同发展等。河北省召开省委专题会议,研究推进张家口产业结构调整、构建新发展格局等工作,提出要积极有效承接北京非首都功能疏解,加快形成高水平、高质量的大数据产业基地。张家口市紧邻京津,是京津冀协同发展的重要节点城市,是国务院批复的全国唯一的可再生能源示范区,是国家发展和改革委员会、工业和信息化部、国家互联网信息办公室三部委批复的京津冀大数据新能源示范区。
随着数字经济的发展,信息通信开始对区域集聚产生影响,信息和数据的“通道作用”使城市中心和地方节点联系在一起形成信息通道,产生新的协同,创造出一种网络经济中的利益走廊[1]。张家口紧抓多重战略机遇期,发布了一系列政策,全力推动大数据产业发展,积极与北京开展产业对接、数据开放共享,吸引以北京互联网企业为代表的企事业单位将数据存储到张家口,形成“前店后厂”模式的京张大数据走廊。配套建设京张大数据专网,为数据中心的数据交互、应用及产业各方提供流量快速交换通道,实现数网协同发展。
1 数据中心发展趋势分析
1.1 数据中心规模持续增长
数据和计算设施体系空间向规模化、绿色化、智能化演进,多层次、立体化的数据和计算新型基础设施体系加速形成。数据中心逐步向智能化、定制化、绿色化、规模化演进,呈现“大型+边缘”的局面。数据中心能效水平进一步提升,液冷逐渐成为数据中心制冷的新模式。发达国家政府积极推进数据中心整合和能效提升。受市场需求驱动,全球领先的传统 IDC企业数据中心资源重点围绕经济发达、用户聚集、信息化应用水平较高的中心城市布局。我国数据中心在国家和地方政府政策的指引下,逐渐形成了京津冀、长三角、粤港澳等聚集区协同发展的布局。
1.2 云边协同架构逐步落地
世界各国均把云计算作为国家信息化发展的战略制高点,美国、德国、英国、日本等国家都制定了云计算相关政策和战略方针,大力推进云计算基础设施建设。云网融合服务能力体系加速构建,云原生技术正在重构IT运维和开发模式。CDN、云计算、边缘计算等技术加速融合,推动边缘计算节点与数据中心云互联协同,构建“边云协同”的新模式,实现资源统一协同调度及共享,满足各类业务在互操作、安全和隐私保护等方面的需求。当前,全球范围内边缘计算处于发展初期阶段,相关基础设施部署尚未形成规模。为抢占产业变革先机和制高点,美国、德国等发达国家、跨国科技巨头、运营商和国际标准组织及联盟组织都将边缘计算基础设施作为行业数字化转型的关键环节,进行统筹部署和协同推进。
1.3 绿色节能引导区域规模化部署
在工业和信息化部多项促进数据中心绿色节能发展政策的引领下,大型IDC企业采用各种绿色节能技术降低能源消耗和电力成本,比如采用自然风、冷水等方式进行制冷设计,采用地热、水电、太阳能等绿色能源供电。各地方纷纷引导区域内数据中心合理布局,要求低时延数据在核心城市进行处理,中时延数据在核心城市周边进行处理,高时延数据在低成本地区进行处理,我国数据中心产业呈现出规模化、集中化、绿色化趋势,北京周边的张家口、怀来、张北、廊坊、天津武清,上海周边的苏州、太仓、昆山,以广州为核心的惠州、东莞、佛山等区域性数据中心集群均服务于核心城市。
1.4 数网协同保障数据中心高质量发展
作为5G、云计算、大数据、人工智能、物联网、区块链等新一代信息通信技术的重要载体,数据中心单体规模不断扩大、计算和存储等技术加速演进、上层业务应用快速发展,计算、存储、上层业务应用对网络的需求多变,亟需优化网络支撑数据中心产业高质量发展。数据中心规模大型化、业务应用云化的趋势,不仅要求数据中心到用户之间的网络高效、可靠,还需要保障数据中心之间的网络互联质量,如本地数据中心与互联网数据中心、同一服务商的多个数据中心以及不同服务商之间的数据中心等[2]。数据中心之间互联互通,将促进数据中心与网络高度协同、相互融合,以满足数据中心之间高速访问、协同运转、海量信息及时交互等业务需求。
2 京张大数据走廊需求分析
各行业随着信息化不断深入,数据量持续增加,数据中心成为必不可少的基础设施,互联网、软件开发、通信行业等ICT行业对数据中心的需求最为直接,金融行业和传媒行业积累沉淀大量的数据,企业总部、科研单位集聚体系内大量数字资源,对数据中心均有一定的需求,受限于北京市对数据中心供应及环保方面的制约,北京市企事业单位的存储需求不得不转移到以张家口为代表的环京地区。张家口积极承接北京外溢需求,加快建设数据中心,为用户提供数据存储、处理和备份等。京张大数据专网提供京张互联网干线网络光缆及传输电路资源,满足北京及雄安等地互联网、金融、传媒、科研等企事业单位与位于张家口的数据中心间互联互通的需求,以实现数据的快速调取、存储及备份。
2.1 行业用户需求分析
2.1.1 信息服务业
北京作为国内创新高地,具有全球影响力的科技创新中心,特别是以中关村科技园为代表的各类创新载体,孵化、培育出许多科技企业。根据《2020北京软件和信息服务业发展报告》,2019年北京市亿元以上企业数量达到1323 家,近十年亿元企业数量保持快速增长;31 家互联网企业入选中国互联网百强企业,其中百度、京东、美团、字节跳动、新浪5家企业位列前十,32 家企业入选中国软件业务收入百强企业,45 家企业入选软件和信息技术服务综合竞争力百强企业[3]。信息服务企业特别是互联网企业每天产生大量数据,短视频、直播、社交等以用户原创内容(User Generated Content,UGC)为主的平台实时积累视频音频数据,视频、电商、游戏等为用户提供内容服务,数据中心存储需求较大;云计算技术和服务的发展,推动更多中小企业上云服务,成为数据中心发展的重要驱动力。
2.1.2 金融行业
北京作为中国人民银行、中国证券监督管理委员会等国家金融监管机构,中国证券投资基金业协会等15 家全国性金融行业协会,人民银行清算总中心、中央国债登记结算、中国证券登记结算等国家金融基础设施和中国银行等重要金融机构总部所在地,仅西城区就有各类金融机构近1900 家,总部企业175 家[4]。美国银行 2015年的调查研究指出,银行每创收100 万美元,平均产生820 GB的数据[5]。随着北京市国家服务业扩大开放综合示范区和中国(北京)自由贸易试验区的建设,北京市金融行业规模有望持续增加,对数据中心的需求也随之增加。
2.1.3 传媒行业
北京作为政治中心和文化中心,拥有中央电视台、人民日报、新华社、光明日报等诸多中央级新闻单位,几乎所有的国内媒体都在北京设有办事处,北京市新闻出版广播电视业在数量和规模上领跑全国。根据《北京传媒白皮书》,2017年北京全市共有图书出版单位238 家,报纸期刊3473 种(报纸247 种),音像出版单位 154 家,电子出版单位141 家,网络出版服务持证单位342 家;省级以上广播电台3 座、电视台2 座;广播电视节目制作持证机构6066 家,信息网络传播视听节目持证机构123 家。随着高清视频、VR/AR等新一代信息技术的发展,传媒企业向平台化、智能化、数据化发展,由报纸、杂志、网站的图文单向发布到以图文、视频为传播形式发展。以人民日报“中央厨房”为代表的融媒体平台[6],聚合内外部多种媒体、多家单位的内容生产资源,为报、微、端、VR等不同媒体形式提供内容和服务,实现传统媒体与新媒体一体化发展。媒体形式的变化极大地加快数据量的产生,视频、音频等媒体形式相较于文字和图片需要更大的存储空间。
2.1.4 央企总部
中央企业主要包括:由国务院国有资产监督管理委员会代表国务院履行出资人职责的共97 家中央企业,由财政部(或委托汇金公司)代表国务院履行出资人职责的共23 家金融类中央企业,以及中国烟草总公司、中国邮政集团、国家铁路集团、北大荒集团等,共计超过100 家企业的总部位于北京,集中分布在西城区的金融街、长安街沿线。其他部委下属企业总部也大多设置在北京。总部企业子公司、分公司众多,企业内部各类信息化平台和生产系统积累大量数据,随着大数据技术的发展和数据要素价值的提升,公司开始自建或租用数据中心集中存储公司数据。
2.1.5 科研单位
科研单位在科研、教育、试验等方面积累了大量数据,数据中心作为主要存储方式,能够有效提升数据的安全性、可靠性及共享利用率。北京市作为科技创新中心,拥有国家实验室79 个,市级重点实验室457 个(占全国31.2%),普通高校93 所(985高校8 所,211高校26 所),具备研究生招生资格单位151 个(占全国17.7%),各项数据均处于国内领先[7]。依托中关村科学城、怀柔科学城、未来科学城和北京经济技术开发区“三城一区”为主平台,发挥中央地方协同优势,发力建设全国科技创新中心。
2.1.6 政府部门
自2013年起,国家出台有关电子政务建设、管理、安全等方面的政策及法规,推动政府信息化、政务信息化发展,形成了统一的政府网站、统一的政务专网和统一的云资源。随着政务大数据和行业大数据持续建设,以及智慧城市各类应用的发展,政府信息化对数据中心的需求逐渐增加。政府大力推动数字政府建设、数字城市、政务云、政务大数据、政务区块链、数字政务、数字城市、城市大脑等诸多信息化服务。政务数据采取一般属地化存储,未来将会有部分行业数据采取异地存储。
2.1.7 冬奥会场馆
北京2022年冬季奥运会(简称“冬奥会”)比赛场馆分布在北京赛区、延庆赛区和张家口赛区。其中,北京赛区共有12 个场馆,延庆赛区共有5个场馆,张家口赛区共有8 个场馆[8]。冬奥会5G+4K、8K等超高清直播、裸眼3D、AR/VR、各类物联网设备、人工智能应用等,将产生海量数据。场馆将有数万现场观众集聚,同时使用的流媒体、社交媒体将产生大量数据,新闻媒体、场馆的直播、转播服务等也需要数据存储、处理和高速的数据传输通道。
2.2 京张大数据产业发展协同需求
京津冀协同发展是重要的国家战略之一,以疏解北京非首都功能推动京津冀协同发展,调整区域经济结构和空间结构,推进产业升级转移。数据中心作为大数据产业的重要基础设施,京津冀各地有不同的发展定位。根据《京津冀协同发展报告(2020)》数据[9],2014—2018年,河北省共承接北京市转入的产业活动单位3860 个,北京市软件和信息服务业在津冀设立分支机构2046 家,其中在河北设立分公司1175 家、子公司 225 家。
北京落实“四个中心”定位,将非首都功能逐步疏解,在《北京新增产业的禁止和限制目录(2018年版)》对本地IDC建设提出了明确限制,规定全市禁止新建和扩建互联网数据服务、信息处理和存储支持服务汇总的数据中心,中心城区全面禁止新建和扩建数据中心。《北京市数据中心统筹发展方案(2021—2023年)》(征求意见稿)提出了推动京津冀数据中心一体化协同发展,积极引导满足中时延类业务和高时延类业务新增需求的数据中心在张家口、怀来等环京区域布局;推动完善省际专线、光缆等网络设施,提升环京网络质量;降低跨区传输数据时延,构建区域高速网络通道。
张家口市张北云计算产业基地、怀来数据中心基地获评工业和信息化部对外发布的以数据中心为特色的国家新型工业化产业示范基地,是数字经济产业转型升级的典范。河北省在《河北省大数据产业创新发展提升行动计划(2020—2022年)》中提出发挥张北、怀来区位优势和产业基础优势,加强新型基础设施建设,加快发展绿色数据中心,建设大数据公共服务平台、重点行业、企业数据中心和灾备中心,数据中心规模居京津冀地区首位。张家口抢抓冬奥会承办地、国家级可再生能源示范区、河北新“两翼”等一系列重大机遇,以绿色数据存储为龙头,培育发展大数据“核心、关联、衍生”业态,大力推进全产业链发展。
3 布局研究
3.1 数据中心布局主要考虑因素
京津冀地区区域发展不平衡,能源、气候、经济等方面有较大的差异,数据中心布局需要综合考虑市场需求、能源消耗、网络质量等多方面因素,以期建成投产的数据中心能够提供低成本、高质量的服务。
(1)市场需求。数据中心作为电信运营企业的经营业务,需要考虑其盈利性,市场需求是重要因素之一。基于用户需求分析,区域内数据中心主要需求来自于位于北京的互联网、金融、媒体、中央企业、科研院所等各类企事业单位。
(2)能源消耗。数据中心开始运营后,能耗成本成为数据中心运营的主要成本,约达到60%,在中央要求做好碳达峰、碳中和工作,以及国家对数据中心电源使用效率(Power Usage Effectiveness,PUE)提出明确规定的背景下,可再生能源成为数据中心布局的重要因素。
(3)网络质量。数据中心承载的网络时延敏感类业务的服务范围与网络质量直接相关,周边200 km范围内可达到10 ms以内的网络时延,周边400 km范围内可达到50 ms的网络时延。我国通信运营商网络是分层分级管理的架构,按照“省级干线—省内干线—城域网—接入网”结构建设。张家口网络出口处于河北省内干线网络的城市级节点,与北京城域网互通需要绕转河北省内骨干网络核心节点,将不可避免地产生较大时延,影响金融、科研、物流等用户的使用体验。
3.2 数据中心布局建议
京津冀地区特别是北京对数据中心需求大,但是北京市对新建大型数据中心实施限制性约束。张家口位于京津冀都市圈内,是京津冀协同发展的重要节点城市,具有气温低、湿度低、空气质量好的天然优势,且当地土地充足,接纳大型数据中心项目的能力强、空间大,是京津冀乃至全国优质数据资源承载地。张家口是国务院批复的全国唯一的可再生能源示范区,拥有丰富的可再生能源,风能资源可开发量达4000 万kW以上,太阳能发电可开发量达3000 万kW以上,2019年可再生能源装机达到1501 万kW,新能源发电并网规模位居全国前列。
怀来县处于京张高铁、大秦铁路、京包铁路、G6/G7高速公路通道内,距离北京市区约100 km,网络时延小于10 ms,能够承载区域内对时延敏感、实时性要求高的应用和数据,重点承载金融、媒体、政务等业务数据,作为京张大数据走廊核心节点。
张北县等坝上地区,年平均气温低、风能充足,数据中心节能效果更好,建设部署超大规模数据中心,承载数据备份、冷数据等对时延要求不高的业务,承载北京、天津、雄安等城市的互联网沉淀数据、企业总部大数据存储等业务,作为京张大数据走廊的重要节点。
张家口市距离怀来、张北等数据中心聚集区距离短,生活配套设施齐全、人力成本低,可开展数据清洗、数据标准等技术门槛低、劳动密集型的数据服务型产业,作为京张大数据走廊配套节点。大同、乌兰察布等张家口周边区域,能源丰富、气候条件适宜,数据中心建设运营成本更低,可协同建设数据中心集群,作为京张大数据走廊的延伸和备份节点。
3.3 网络布局主要考虑因素
(1)网络安全。数据中心存储数量大、用户多,一旦出现网络问题,影响范围广、造成损失大,需要建设多条网络路由保证网络安全。在接入网层面需要多网络接入,数据中心间需要环网接入,骨干网需两条及以上不同物理路由。
(2)网络容量。数据中心承载的视频、图像等非结构化数据传输颗粒大、流量需求高,文字、数据等结构化数据传输颗粒度小,时延要求高,从网络容量分配、优化、扩容等管理角度,建设多个网络平面分别承担大颗粒、小颗粒、低时延等不同网络质量要求的业务。
(3)互联互通。我国的基础电信企业采用分层分级管理,国家骨干直连点主要分布在北京、上海、广州、成都等13个大中城市,网间结算费用高,京张大数据走廊数据中心和用户网络提供商需要借助京张大数据专网等基础设施提高网络互联互通质量,降低成本。
(4)数网协同。云计算、大数据、人工智能等新一代技术发展,推动云网、数网进一步融合,企业的数字化应用开始逐步上云,数据中心逐渐成为网络的核心,网络部署也将随着云和算力的需求调整,形成以数据中心互联为主的网络架构。
3.4 京张大数据专网布局建议
建设北京至张家口数据中心集聚区的多路由、超高速、低时延、同城化体验的京张大数据专网,作为张家口数据资源到达北京用户的大数据承载平台,形成“内通外联”的数据中心直连体系,实现区域内算力和存储资源灵活、高速、安全调配。建议从干线网络、城域网络、波分传输3个层面布局。
(1)京张高速干线网。建设连接北京中关村、望京等主要用户分布区与张家口怀来、张北等主要数据中心集聚地间的高速数据传输网络,建议沿京藏高速、京新高速、京礼高速、京张高铁等交通线路通道建设两条以上光缆。同时,在大同、乌兰察布方向预留传输通道,便于与内蒙古、山西数据中心协同联动。
(2)城域大数据专网。在张家口市域范围内以怀来(东花园、存瑞、桑园)、张家口南山基地、张北、崇礼等大数据产业聚集区为汇聚节点,建设本地高速互联的城域光缆网,实现数据中心基地间高速互通。同时,也为2022年冬奥会提供数据传输通道,为新闻媒体、场馆等提供直播、转播等服务。
(3)大容量波分传输网。建设A、B两个100 Gbit/s OTN波分传输系统平面,赋予两个平面不同定位,根据京张大数据走廊用户业务类型、带宽需求的不同,将业务分别承载在两个系统平面上。A平面主要承载大型(百亿、十亿级营业额)互联网企业、传媒类企业的大颗粒带宽业务,B平面主要承载金融企业、中央企业、科研单位等对安全可靠性要求高、时延低、带宽颗粒度小的业务。
4 结束语
随着5G、大数据、人工智能等新一代信息技术的发展,各行业数字化转型升级进程不断加快,数据量将呈指数级增长,企业对数据存储、处理的需求不断增加,北京市对新建大型数据中心实施限制性约束,建设京张大数据走廊,打造以北京为中心的10 ms、50 ms时延圈,可满足北京大部分企事业单位对数据传输、存储、处理和备份等方面需求,助力京津冀一体化发展。
参考文献
[1] 王建冬, 于施洋, 窦悦. 东数西算:我国数据跨域流通的总体框架和实施路径研究[J]. 电子政务, 2020(3):13-21.
[2] 中国信息通信研究院. 数据中心白皮书(2020年)[R], 2020.
[3] 北京市经济和信息化局. 2020北京软件和信息服务业发展报告[R], 2020.
[4] 新京报. 北京西城区程昌宏:西城汇聚金融机构1900 家[EB/OL]. (2020-10-22)[2021-03-01]. https://www. bjnews.com.cn/detail/160335112215437.html.
[5] 中国信息通信研究院, 华为技术有限公司. 数据基础设施白皮书(2019)[R], 2019.
[6] 汤思琪. 融媒体平台发展现状和困境的认识和思考——以人民日报“中央厨房”为例[J]. 新闻前哨, 2020(1):43-44.
[7] 科塔学术. 国家重点实验室[EB/OL]. (2019-05-02)[2021-03-01]. https://www.sciping.com/28638.html.
[8] 北京2022年冬奥会组织委员会. 场馆巡礼[EB/OL]. [2021-03-01]. https://www.beijing2022.cn/.
[9] 陈璐. 河北蓝皮书:京津冀协同发展报告(2020版)[M]. 社会科学出版社, 2020.