• English
  • 收藏
  • 设为首页
  • 工作邮箱
微信公众号
分享
我国数据空间建设:核心要件、发展路径与推进策略
时间:2024-12-30

一、数据空间建设的核心要件

数据空间具备新型的本体、结构、运算和要素价值体系,数据空间内数据对象广谱关联、数据要素有序流通、数据价值聚变释放。数据空间的形成,离不开通信网络、算力设施、数据生态、可信服务、安全技术的融合发展,让分布无序的数据有序流动并创造价值,实现类似电磁空间的电磁场效应的“数据场”效应。从功能视角看,数据空间建设应具备网络传输、算力调度、数据应用和安全保障等核心要件,组合形成一个有机整体。网络传输体系提供高速泛在的连接能力,实现数据空间中数据要素的互联互通,算力调度体系为数据处理提供高效算力支撑,数据应用体系促进数据空间内数据共享开放、流通交易、开发利用及价值实现,安全保障体系为算网一体、数算融合提供全流程安全防护。

(一)网络传输体系

为打造数据空间高速泛在的连接能力,需要建设具备空天地一体化组网、人机物万物互联,大带宽、低时延、弹性敏捷、高可靠、低成本等特征的网络传输体系。2022年初,我国正式启动实施“东数西算”工程,在全国布局建设8大枢纽、10大数据中心集群,为满足可信数据空间超远距离、超大规模数据传输需求,亟需推进全光底座的算网融合体系建设,打造高通量、低时延、低抖动的高品质网络。

1、加快全光底座的算网融合技术应用

“东数西算”工程建设背景下,枢纽节点之间的骨干网络直联点建设加速推进,枢纽节点与业务需求旺盛的非枢纽节点之间建设跨区域数据中心高速直连网络成为发展趋势。三大运营商对网络设备进行容量升级、架构优化,加快建设具有算网融合属性的数字基础设施,积极开展云网一体化建设,建立云资源接入和一体化算力协同机制,以云服务方式提供算力资源,提升算力供给水平。

2、打造高通量、低时延、低抖动的确定性网络

互联网已从最初的科研型网络过渡到消费型网络,正向生产型网络转变,“准时、准确”的生产型网络成为互联网发展的主流方向,路由路径、丢包和传输时延抖动等不可控问题亟待解决。确定性网络是一种利用网络操作系统与确定性转发设备,通过对关键网络资源的统一调度与分配,从而实现对网络数据转发行为的控制,实现转发路径、时延、抖动以及丢包相关指标控制在确定范围内的网络技术。

(二)算力调度体系

为构建数据空间高效敏捷的数据处理和计算能力,需要在网络设施的基础上建立全局算力资源感知、度量、调度、分配等于一体的算力设施。随着全国一体化算力网建设不断推进,数据空间算力设施体系逐步完善。当前,算力设施、数据流通利用设施等尚未在数据空间内形成有机整体,存在算力资源闲置、分布不均、配置不完善等问题。从技术层面看,亟需构建统一的算力调度体系,打通算力供给与需求之间的通道壁垒,实现异构异属异域算力跨区域协同调度,满足数据空间多样化算力需求。结合全国算力体系布局现状,从数据空间的应用需求出发,算力调度体系建设可分为区域内算力调度、跨区域算力调度和行业算力调度。

1、加快建设区域内算力调度

围绕城市数据空间建设,需要面向枢纽节点及周边地区,打造城市算力网,推动实现区域内联网调度。建设城市算力网应选择网络和产业基础良好、应用场景丰富、算力需求旺盛或算力资源富集的城市,以满足城市数据空间对于低时延、高性能计算的要求。同时,探索通过市场或政策手段鼓励算力提供商自愿并网,盘活闲置算力资源、提高投资收益。对于城市新增算力资源,通过制定专项政策加以引导,吸引新建数据中心全面接入城市算力网。此外,可发挥各主体参与积极性,积极引导大型央企国企、民营企业及社会力量参与城市算力网建设,创新算力运营支撑方式,实现算力资源按需灵活调度。在此基础上,将单个的城市算力网与周边城市进行联网调度,建设区域算力调度网。

2、积极布局跨区域算力调度

随着全国一体化算力网加速建设,算力枢纽节点之间、算力枢纽节点与有条件的非枢纽节点之间正在构建多元异构算力资源统筹调度体系,进一步打造高速高通量的算力网络通道,支撑各类数据空间互联互通,并通过在算力并网、算力调度、异构算力互操作以及算力度量、算力标识等领域积极探索,打造算力调度运营平台,实现高通量、高并发、高性能等多种类型算力调度场景一体化覆盖。枢纽节点内以及有条件的非枢纽节点通算中心、智算中心、超算中心等不同类型算力,可以率先开展算力并网调度。

3、系统推进行业内算力调度

积极利用算力枢纽节点算力资源、城市算力网资源,建立跨行业算力调度机制,促进算力便捷输送及高效利用,有效降低行业数据空间算力使用成本。结合重点行业数据空间发展现状和算力需求,面向科教、政务等领域,充分调动市场主体参与积极性,推动行业算力资源并网调度,最终促进形成分布范围最广、服务用户最多、影响力最大的行业算力网体系,通过终端灵活安全接入、业务按需灵活入云、数据中心高效转发等,实现算力无感拆借和用户算力任务自动分派。在有条件的行业数据空间开展实验验证、新技术研究,满足不同时延、多样化的算力需求,打造融合通用算力、超级算力、智能算力、云计算的算力网实验空间,建立异构异属算力间的用户侧计量机制。如阿里云携手小鹏汽车开展“东数西算”落地应用实践,利用内蒙古和林格尔数据中心集群提供大规模易用的智能算力,搭建高效混合云网络实现统一管控,通过建设车联网数据中台构建全生命周期的数据空间,助力智能驾驶行业降本增效。

(三)数据应用体系

数据要素高效流通利用是推动数据空间内部数据要素价值释放的核心。数据要素高效共享流通过程中,呈现出跨管辖域、跨空间域、跨信任域等“跨域”特征,叠加数据流通需求的多样性,导致数据流通管理的复杂度大幅提升。面临“跨语义”“跨场景”“跨主体”等诸多标准机制、平台技术、创新应用等挑战,数据空间应从健全互联互通数据流通体系、构建分布式数据流通平台、推动行业数据应用创新等方面系统性解决难题。

1、健全互联互通数据流通体系

数据空间互联互通数据流通体系支持各类数据高效地互联互通互操作,通过解决数据语义不一致、数据组织不一致、数据标识不一致等问题,构建数据空间基础设施互联、数据资源互通、主体行为互认互信的数据流通体系。数据空间基础设施互联通过建立各类数据空间在网络设施、算力设施、流通设施等方面的互联互通机制,保障各数据空间的稳定连接、高效传输和有序使用。数据空间数据资源互通包括数据标识、数据封装组织和数据语义的标准化。数据标识互认方面,构建可兼容“已建立、未建立”标识等多种情况下的数据标识互认体系,确保各数据空间的数据标识唯一性。数据封装组织方面,构建支撑各类数据空间之间数据共享、流通、交易的数据封装标准体系,统一数据流通与使用的基本单位,实现跨域的数据组织统一。数据语义互通方面,建立健全融合数据语义、标识、语用等多维度的数据建模标准、数据交换模型,确保数据要素在各类数据空间可寻址、可交换等。数据空间通过建立健全合规、监管等机制实现主体行为互认互信,合规管理方面,明确各数据空间主体的备案准入、内部管理等方面合规管理底线,监管机制方面,通过容错机制或免责机制设计鼓励数据空间之间数据流通行为的可信、可控、可证,给予数据空间主体容错试错空间。

2、构建分布式数据流通平台

面向算力、数据、算法等各类主体和多样化应用需求,数据空间数据流通设施应构建以跨域数据标准化语义统一为核心的分布式数据流通平台,支撑一体化数据的汇聚、处理等,以互联互通数据流通体系为基础,提供数据标准化建模、合规、登记、数据高效分发等能力,有效解决数据跨域语义统一难、可信可控流通难等问题,全面支撑数据要素价值释放。在构成方面,主要包括“中心管理平台+分布式节点”:中心管理平台是数据跨域管理的总枢纽、数据流通的总通道、数据服务的总门户,涵盖数据服务、数据跨域管理等核心系统;分布式节点是面向数据供给方、使用方、加工方等用户的连接节点,根据需要实现逻辑连接或者物理连接,并可通过端系统完成对数据的合规处理、价值评估、标准化封装等要素化工作。在此基础上,积极推动分布式数据流通平台与各级各类数据流通交易平台互联互通互认。

3、推动行业数据应用创新

依托网络传输体系和算力调度体系资源和能力优势,面向科研、交通、教育、医疗等行业推动基于数据流通设施的新场景、新业务、新模式创新,促进千行百业在数据空间构建应用生态。比如,支持企业、高校、研究所等开发基于人工智能、大数据分析的生产线生产流程优化算法、设备故障预测模型、机器自我维护方案。推动智慧交通应用场景创新,支持出行服务企业运用数据中心集群的智能算力。推进智慧校园建设与应用,建设基于云计算、云应用的优质教育资源共享平台。推进智慧医疗与健康融合场景创新,以算力为基础支撑,提升医院智能化水平和医疗资源优化配置能力。

(四)安全保障体系

传统的网络安全与功能安全难以满足数据空间建设需求,亟需革新网络安全与功能安全技术手段,改变传统的“封门补漏、亡羊补牢”被动式防御模式,从外挂到内生,从被动到主动,重塑数据空间安全新秩序,打造内生安全的数据空间基础设施底座。为确保数据空间整体安全,重点面向区域内和跨区域两级体系,逐步构建网络连接、算力运行、数据流通等一体化安全防护体系,提升数据空间总体安全运营能力。

1、强化区域内数据空间自主防护能力

面向城市数据空间、区域数据空间建设,通过打造安全能力中心、安全数据中心和安全运营中心,建立网络数据安全风险管控机制,提升区域内数据空间安全保障能力。完善区域数据空间安全标准规范体系,鼓励按照关键信息基础设施安全保护要求,统一内部数据交换接口、统一应急处置、统一安全监测、统一运行监控,强化自主可控的安全公共服务能力,统筹已有及新建网络和数据安全能力,通过安全基础资源云化、安全组件通用化等方式,构筑贯穿全生命周期的数据空间管控措施。

2、加强跨区域数据空间自主防护能力

面向互联互通的跨区域数据空间建设,加强区域与区域间的安全数据汇聚和态势感知能力、安全情报跨领域共享交换能力、安全事件指挥调度能力,建立信息共享、统一指挥、快速调度、智能响应的区域一体化数据安全防护体系。积极打造网络安全数据攻防演习试验场,定期开展数据空间网络数据攻防演习,面向公共卫生、交通运输、生态环保等领域风险隐患,探索不同应急状态下的网络数据安全合规利用机制。

二、我国数据空间的发展路径

推动数据空间建设,应按照急用先行、由易而难、先试点再推广、先国内再国际的推进策略,分近期、中期、远期三步,逐步构建数据空间的整体架构,推动一批典型行业示范应用,加强国际交流合作,打造具有中国特色的国家数据空间体系。

(一)近期:起步验证、重点突破

借鉴国外数据空间建设经验,结合我国数字经济发展特征,形成体系化的数据空间顶层设计方案,明确数据空间建设的主要任务、预期目标和推进举措。加强数据空间关键技术路径研究,汇聚产学研优势资源开展新型技术研发和协作攻关,探索建立数据空间国家实验室机制,充分发挥“揭榜挂帅”机制,围绕异属异构异域算力调度、数据合规登记、数据流通交易等数据空间相关核心技术进行创新突破,加快构建数据空间行业标准规范体系。选择政务、金融等重点领域率先开展实验探索及技术验证,形成一批技术先进、场景明确、成效显著的实验型数据空间、行业数据空间。

(二)中期:打造样板、示范应用

依托全国一体化算力枢纽节点及人工智能创新应用建设布局,聚焦高品质网络传输、高效能算力调度、高质量数据开发利用、数据要素场构建等方面,面向若干重点领域和重点区域,打造一批典型行业示范应用。加快高效传输网络和算力调度体系建设,形成数据空间基本运行框架,推动数据空间典型应用,发挥示范引领作用,逐渐向其他行业和地区进行推广应用。按照统一标准联通行业数据空间、区域数据空间,构建技术互联互通、数据协同共享、安全保障有力的一体化国家数据空间体系。

(三)远期:创新驱动、战略引领

坚持市场应用为导向,加强技术创新、机制创新、业态创新、模式创新,培育重大数据产业生态,引领数字经济发展和数实融合创新。面向数字中国建设全局,推动数据空间上升为国家战略,进一步发挥数据要素价值、保障数据安全,以数字化、智能化助推新质生产力发展,让数字红利惠及千行百业。围绕技术交流、数据共享、产业发展等方面,加强数据空间领域的国际交流合作,为其他国家建设数据空间提供中国经验和中国方案,构建数字经济时代的国际数字命运共同体。

三、我国数据空间建设的推进举措

(一)加强数据空间统筹推进机制

坚持适度超前部署数字基础设施建设原则,面向“十五五”乃至2035年发展战略目标,加强国家数据空间战略议题研究,积极推动数据空间上升为国家战略,助力网络强国、数字中国建设。由国家数据主管部门牵头,加快制定数据空间建设专项政策文件,逐步建立健全顶层设计机制,从国家数据事业发展全局制定数据空间建设的发展方向和建设目标、重点任务,制定重点任务清单。鼓励相关地方和行业根据自身产业特点出台支持政策,探索多主体利益协调机制等,一体化推动我国数据空间建设。

(二)实施一批数据空间示范工程

坚持系统观念和工程牵引原则,通过启动实施一批重大工程项目,加快推动数据空间建设。面向新型网络技术、数联网、数据流通利用等重点领域,研究策划一批试点工程,积极打造行业数据空间、城市数据空间、区域数据空间等样板,形成一批数据空间建设的典型解决方案和最佳实践案例。发挥引领示范作用,加快推进算网一体、数算融合,促进数据要素合规高效流通利用,充分激活数据要素价值。通过中央预算内投资、超长期特别国债等方式加大支持力度,引导撬动社会各方资金积极参与数据空间建设,形成良好发展生态环境。

(三)强化数据空间关键技术创新

围绕算网融合、算力并网调度、数据场、可信数据流通、隐私计算等关键领域加强技术创新突破,探索形成一批可复制可推广的技术解决方案。加强各类数据空间总体技术体系的总体设计,促进不同技术、不同平台、不同系统之间的高效数据交互和集成,打破行业间、区域间“数据孤岛”和“信息壁垒”。探索建设国家级数据空间原型技术实验场,组建国家级数据空间共性技术研发平台,汇聚产学研各方优势资源开展数据空间共性技术研发及推广应用,构建数据空间技术创新生态体系。

(四)构建健全数据空间标准规范体系

发挥标准引领创新的作用,加强数据空间领域技术标准规划的起草编制及推广应用,鼓励企业、行业协会等社会各界共同开展模式创新。算力网领域标准化工作方面,研究高性能计算系统架构标准、多元异构算力资源管理标准、跨域管控调度标准等。数据领域标准化工作方面,围绕数据接入、数据传输、数据流通等环节,研究数据封装标准、多源异构数据统一标识编码标准、可信数据流通标准、数据确权标准、数据价值评估标准以及数据空间互联互通标准等,从术语定义、技术架构、安全测评等方面研究制定一批数据空间领域的技术标准规范体系。

(五)推动算力与数据基础设施化

构建“以数据为中心”的新型基础设施,将网络空间中资源的表征和组织从计算架构转变为数据架构,支撑数据空间实体化表达,促进数据安全有序高效流通利用。依托全国一体化算力网建设,以自主技术创新为牵引,推动我国数字基础设施与重大工程的体系化布局与建设,通过工程化设计将网络传输体系、算力调度体系、数据应用体系和安全保障体系形成有机整体,推进网络、算力和数据基础设施化,以“算力之用”赋能数据空间建设,为数据要素市场培育提供绿色、安全、普惠的算力保障。以区域数据空间、行业数据空间建设带动国家数据空间建设,加快促进数据基础设施建设,以“数算融合”助力实现“数据之治”。

(六)开展数据空间领域国际合作

加强数据空间领域关键技术、标准规范、人才交流等方面的国际交流合作,充分发挥大型跨国企业、数据跨境类企业、对外合作交流机构等作用,加强与欧美等国家相关组织的经验交流,增进互信,强化合作。积极推动数据交互、业务互通等方面国际交流合作,依托全球性平台、区域发展组织、多边合作机制等组织形式,参与数据跨境流动规则讨论和制定。坚持统筹国内国际两个大局,以构建网络空间命运共同体为价值统领,坚持内外联动促进我国数据空间建设。利用“一带一路”合作平台、金砖国家合作机制,以数字经济发展为纽带,探索构建数据空间领域创新合作新机制,探索建设世界数据组织,积极贡献数据空间建设的中国智慧和中国方案。

(原文刊发于《社会治理》2024年第5期,转发时有删减,参考文献略;作者:郭明军 国家信息中心大数据发展部算力经济处处长、高级经济师;郭巧敏 国家信息中心大数据发展部算力经济处助理研究员;马骁 国家信息中心大数据发展部算力经济处实习研究员;庾朝富 合肥综合性国家科学中心数据空间研究院副研究员)