
資訊中心
什么是銀行數據治理體系?
銀行數據治理體系包括數據質量管理、元數據管理、主數據管理、數據資產管理、數據安全及數據標準等內容。
從技術實施角度看,銀行數據治理包含“理”“采”“存”“管”“用”這五個步驟,即業務和數據資源梳理、數據采集清洗、數據庫設計和存儲、數據管理、數據使用。
數據資源梳理:數據治理的第一個步驟是從業務的視角厘清組織的數據資源環境和數據資源清單,包含組織機構、業務事項、信息系統,以及以數據庫、網頁、文件和API接口形式存在的數據項資源,本步驟的輸出物為分門別類的數據資源清單。
數據采集清洗:通過可視化的ETL工具將數據從來源端經過抽取(extract)、轉換(transform)、加載(load)至目的端的過程,目的是將散落和零亂的數據集中存儲起來。
基礎庫主題庫建設:一般情況下,可以將數據分為基礎數據、業務主題數據和分析數據。基礎數據一般指的是核心實體數據,或稱主數據,例如智慧城市中的人口、法人、地理信息、信用、電子證照等數據。主題數據一般指的是某個業務主題數據,例如市場監督管理局的食品監管、質量監督檢查、企業綜合監管等數據。
元數據管理:元數據管理是對基礎庫和主題庫中的數據項屬性的管理,同時,將數據項的業務含義與數據項進行了關聯,便于業務人員也能夠理解數據庫中的數據字段含義,并且,元數據是后面提到的自動化數據共享、數據交換和商業智能(BI)的基礎.
血緣追蹤:數據被業務場景使用時,發現數據錯誤,數據治理團隊需要快速定位數據來源,修復數據錯誤。那么數據治理團隊需要知道業務團隊的數據來自于哪個核心庫,核心庫的數據又來自于哪個數據源頭。我們的實踐是在元數據和數據資源清單之間建立關聯關系,且業務團隊使用的數據項由元數據組合配置而來,這樣,就建立了數據使用場景與數據源頭之間的血緣關系。
數據資源目錄:數據資源目錄一般應用于數據共享的場景,例如政府部門之間的數據共享,數據資源目錄是基于業務場景和行業規范而創建,同時依托于元數據和基礎庫主題而實現自動化的數據申請和使用。
質量管理:數據價值的成功發掘必須依托于高質量的數據,唯有準確、完整、一致的數據才有使用價值。因此,需要從多維度來分析數據的質量,例如:偏移量、非空檢查、值域檢查、規范性檢查、重復性檢查、關聯關系檢查、離群值檢查、波動檢查等等。
數據共享交換:數據共享包括組織內部和組織之間的數據共享,共享方式也分為庫表、文件和API接口三種共享方式,庫表共享比較直接粗暴,文件共享方式通過ETL工具做一個反向的數據交換也就可以實現。
- 上一篇: 手機銀行開發的功能及優勢分析
- 下一篇: 使用數據管理平臺可以做什么?