數據領域名詞解釋
近日,國家數據局為進一步凝聚社會共識,推動各界對數據領域術語的統(tǒng)一認識,正式就《數據領域名詞解釋》公開征求意見。此次意見征求活動將持續(xù)至2024年11月20日,歡迎社會各界人士通過電子郵件方式提出寶貴意見。
附件
2024
數據領域名詞解釋
1.數據。是指任何以電子或其他方式對信息的記錄。數據在不同視角下表現為原始數據、衍生數據、數據資源、數據產品、數據資產、數據要素等形式。
2.原始數據。是指初次或源頭收集的、未經加工處理的數據。
3.數據資源。是指具有使用價值的數據,是可供人類利用的新型資源。
4.數據要素。是指能直接投入到生產和服務過程中的數據,是用于創(chuàng)造經濟或社會價值的新型生產要素。
5.數據產品。是指基于數據加工形成的,可滿足特定需求的數據加工品和數據服務。
6.數據資產。是指特定主體合法擁有或者控制的,能進行貨幣計量的,且能帶來直接或者間接經濟利益的數據資源。
7.數據要素市場化配置。是指通過市場機制來配置數據這一新型生產要素,旨在建立一個更加開放、安全和高效的數據流通環(huán)境,不斷釋放數據要素價值。
8.數據處理。包括數據的收集、存儲、使用、加工、傳輸、提供、公開、刪除等活動。
9.數據處理者。是指在數據處理活動中自主決定處理目的和處理方式的個人或者組織。
10.受托數據處理者。是指接受他人委托處理數據的個人或者組織。
11.數據流通。是指數據在不同主體之間流動的過程,包括數據開放、共享、交易、交換等。
12.數據交易。是指數據供方和需方之間進行的,以數據或者數據各類形態(tài)為標的的交易行為。
13.數據交互。是指主體之間以數據的形式進行交流和協(xié)作的過程。
14.數據治理。是指提升數據的質量、安全、合規(guī)性,推動數據有效利用的過程,包含組織數據治理、行業(yè)數據治理、社會數據治理等。
15.數據安全。是指通過采取必要措施,確保數據處于有效保護和合理利用的狀態(tài),以及具備保障持續(xù)安全狀態(tài)的能力。
16.公共數據。是指各級黨政機關、企事業(yè)單位依法履職或提供公共服務過程中產生的數據。
17.數字產業(yè)化。是指新一代移動通信、人工智能等數字技術向數字產品、數字服務轉化,數據向資源、要素轉化,形成數字新產業(yè)、新業(yè)態(tài)、新模式的過程。
18.產業(yè)數字化。是指傳統(tǒng)的農業(yè)、工業(yè)、服務業(yè)等產業(yè)通過應用數字技術、采集融合數據、挖掘數據資源價值,提升業(yè)務運行效率,降低生產經營成本,進而重構思維認知,整體性重塑組織管理模式,系統(tǒng)性變革生產運營流程,不斷提升全要素生產率的過程。
19.數字經濟高質量發(fā)展。圍繞加快培育新質生產力,以數據要素市場化配置改革為主線,協(xié)同完善數據基礎制度和數字基礎設施,全面推進數字技術和實體經濟深度融合,持續(xù)提升數字經濟治理能力和國際合作水平,實現數字技術革命性突破、數據要素創(chuàng)新性配置、傳統(tǒng)產業(yè)數字化轉型和適數化改革,通過數字經濟創(chuàng)新發(fā)展賦能經濟社會高質量發(fā)展。
20.數字消費。是指數字新技術、新應用支撐形成的消費活動和消費方式,既包括對數智化技術、產品和服務的消費,也包括消費內容、消費渠道、消費環(huán)境的數字化與智能化,還包括線上線下深度融合的消費新模式。
21.產業(yè)互聯網。是指利用數字技術、數據要素推動全產業(yè)鏈數據融通,賦能產業(yè)數字化、網絡化、智能化發(fā)展,推動業(yè)務流程、組織架構、生產方式等重組變革,實現產業(yè)鏈上下游協(xié)同轉型、線上線下融合發(fā)展、全產業(yè)降本增效與高質量發(fā)展,進而形成新的產業(yè)協(xié)作、資源配置和價值創(chuàng)造體系。
22.城市全域數字化轉型。是指城市以全面深化數據融通和開發(fā)利用為主線,綜合利用數字技術應用和制度創(chuàng)新工具,實現技術架構重塑、城市管理流程變革和產城深度融合,促進數字化轉型全領域增效、支撐能力全方位增強、轉型生態(tài)全過程優(yōu)化的城市高質量發(fā)展新模式。
23.“東數西算”工程。是把東部地區(qū)經濟活動產生的數據和需求放到西部地區(qū)來計算和處理,對數據中心在布局、網絡、電力、能耗、算力、數據等方面進行統(tǒng)籌規(guī)劃的重大工程,比如人工智能模型訓練推理、機器學習等高時延業(yè)務場景,可以通過“東數西算”的方式讓東部業(yè)務向西部風光水電豐富的區(qū)域遷移,實現東西部協(xié)同發(fā)展。加快推動“東數西算”工程建設,將有效激發(fā)數據要素創(chuàng)新活力,加速數字產業(yè)化和產業(yè)數字化進程,催生新技術、新產業(yè)、新業(yè)態(tài)、新模式,支撐經濟高質量發(fā)展。
24.高速數據網。是指面向數據流通利用場景,依托網絡虛擬化、軟件定義網絡(SDN)等技術,提供彈性帶寬、安全可靠、傳輸高效的數據傳輸服務,具有高帶寬、低延遲、高可靠性、高安全性、可擴展性、靈活性等特點。
25.全國一體化算力網。是指以信息網絡技術為載體,促進全國范圍內各類算力資源高比例、大規(guī)模一體化調度運營的數字基礎設施。作為“東數西算”工程的2.0版本,具有集約化、一體化、協(xié)同化、價值化四個典型特征。
26.元數據。關于數據或數據元素的數據(可能包括其數據描述),以及關于數據擁有權、存取路徑、訪問權和數據易變性的數據。
27.結構化數據。一種數據表示形式,按此種形式,由數據元素匯集而成的每個記錄的結構都是一致的并且可以使用關系模型予以有效描述。
28.半結構化數據。不符合關系型數據庫或其他數據表的形式關聯起來的數據模型結構,但包含相關標記,用來分隔語義元素以及對記錄和字段進行分層的一種數據化結構形式。
29.非結構化數據。是指不具有預定義模型或未以預定義方式組織的數據。
30.數據分析。是指利用技術手段,對數據進行分析,發(fā)揮數據作用、釋放數據價值的過程。
31.數據挖掘。是數據分析的一種手段,是從大量數據中通過算法搜索隱藏于其中信息的過程。
32.數據可視化。是指將數據以圖表、圖形、地圖等可視化形式展示,以便更好地理解和分析數據。
33.數據倉庫。是指一個面向主題的、集成的、相對穩(wěn)定的、反映歷史變化的數據集合,通常用于支持企業(yè)或組織的決策分析處理。
34.數據湖。是指一種高度可擴展的數據存儲架構,它專門用于存儲大量原始數據,這些數據可以來自各種來源并以不同的格式存在,包括結構化、半結構化和非結構化數據。
35.湖倉一體。是指一種新型的開放式的存儲架構,打通了數據倉庫和數據湖,將數據倉庫的高性能及管理能力與數據湖的靈活性融合起來,底層支持多種數據類型并存,能實現數據間的相互共享,上層可以通過統(tǒng)一封裝的接口進行訪問,可同時支持實時查詢和分析,為企業(yè)進行數據治理帶來了更多的便利性。
36.隱私計算。是指在保證數據提供方不泄露原始數據的前提下,對數據進行分析計算的一類信息技術,保障數據在產生、存儲、計算、應用、銷毀等數據流轉全過程的各個環(huán)節(jié)中“可用不可見”。隱私計算的常用技術方案有多方安全計算、聯邦學習、可信執(zhí)行環(huán)境、密態(tài)計算等;常用的底層技術有混淆電路、不經意傳輸、秘密分享、同態(tài)加密等。
37.多方安全計算。是指在無可信第三方的條件下,通過特殊設計的密碼學算法和協(xié)議,允許多個參與方在不泄露各自隱私數據的前提下,協(xié)同完成計算任務。
38.聯邦學習。是指多個參與方在不共享原始數據的情況下協(xié)作完成機器學習任務的方法。
39.可信執(zhí)行環(huán)境。是指提供基于硬件級的系統(tǒng)隔離和可信根,支持基于技術信任的數據安全保障能力,保證在安全區(qū)域內部加載的代碼和數據在保密性和完整性方面得到保護。
40.密態(tài)計算。是指通過綜合利用密碼學、可信硬件和系統(tǒng)安全的可信隱私計算技術,其計算過程實現數據可用不可見,計算結果能夠保持密態(tài)化,以支持構建復雜組合計算,實現計算全鏈路保障,防止數據泄漏和濫用。
41.區(qū)塊鏈。是指使用密碼鏈接將共識確認的區(qū)塊按順序追加形成的分布式賬本。