存儲域
數據庫加密 諾亞防勒索訪問域
數據庫防水壩 數據庫防火牆 數據庫安(ān)全審計 動态脫敏流動域
靜态脫敏 數據水印 API安(ān)全 醫(yī)療防統方運維服務(wù)
數據庫運維服務(wù) 中(zhōng)間件運維服務(wù) 國(guó)産(chǎn)信創改造服務(wù) 駐場運維服務(wù) 供數服務(wù)安(ān)全咨詢服務(wù)
數據出境安(ān)全治理(lǐ)服務(wù) 數據安(ān)全能(néng)力評估認證服務(wù) 數據安(ān)全風險評估服務(wù) 數據安(ān)全治理(lǐ)咨詢服務(wù) 數據分(fēn)類分(fēn)級咨詢服務(wù) 個人信息風險評估服務(wù) 數據安(ān)全檢查服務(wù)中(zhōng)國(guó)石油天然氣股份有(yǒu)限公(gōng)司吉林油田分(fēn)公(gōng)司(簡稱中(zhōng)國(guó)石油吉林油田公(gōng)司)是中(zhōng)國(guó)石油天然氣股份有(yǒu)限公(gōng)司下屬地區(qū)公(gōng)司,主營業務(wù)為(wèi)石油和天然氣勘探、開發及銷售,總部位于吉林省松原市。吉林石油集團有(yǒu)限責任公(gōng)司是中(zhōng)國(guó)石油天然氣集團公(gōng)司(CNPC)的全資子公(gōng)司,也是中(zhōng)國(guó)石油四大上産(chǎn)油田之一。
自2006年,吉林油田陸續開展了勘探開發主庫建設、曆史數據建設及新(xīn)數據正常化三項重點工(gōng)作(zuò):集中(zhōng)開展了科(kē)研成果文(wén)檔、分(fēn)析化驗、錄井圖、測井圖、開發地質(zhì)、物(wù)探、油氣生産(chǎn)、試井等11類17期科(kē)研生産(chǎn)急需的曆史數據資源建設工(gōng)作(zuò),目前勘探開發曆史數據入庫率近70%。
勘探開發主庫的數據來源于數據同步、專業庫集成和曆史數據建設批量加載,這一過程存在錯誤數據或數據不一緻等問題,需要按照一定的規則針對問題數據開展數據清洗工(gōng)作(zuò)。
具(jù)體(tǐ)如下:
1、需借助ETL工(gōng)具(jù)等技(jì )術手段對勘探開發主庫及鑽錄測試等專業庫進行數據綜合分(fēn)析。
2、對關鍵值缺失、異常值和重複數據及其它關鍵問題數據進行處理(lǐ),提升主庫和專業庫内數據規範性、可(kě)用(yòng)性和數據質(zhì)量。
針對吉林油田上述實際需求,美創科(kē)技(jì )通過自主研發的數據支撐平台實現數據清洗、轉換、同步和加載工(gōng)作(zuò)。該平台通過對業務(wù)系統數據進行标準化,向數據倉庫或大數據平台提供高質(zhì)量數據,支持異構數據遷移、基于數據庫日志(zhì)的數據實時複制、ETL開發、分(fēn)布式處理(lǐ)等功能(néng)。具(jù)體(tǐ)如下:
數據清洗人物(wù)配置管理(lǐ)模塊
清洗模塊是整個清洗工(gōng)具(jù)的控制中(zhōng)心,實現清洗數據源的連接信息、清洗表的設置,并且記錄清洗信息。
清洗規則管理(lǐ)模塊
包含各類清洗算法的運行參數、數據質(zhì)量指标等,如重複記錄清洗算法的阈值、異常值檢測的标準、基于業務(wù)規則的清洗算法的業務(wù)邏輯等。
清洗算法管理(lǐ)模塊
對重複數據檢測算法、不完整數據檢測算法和字段匹配算法、異常值檢測算法等進行靈活定義和配置。
擴展模塊管理(lǐ)
通過擴展模塊允許向數據清洗工(gōng)具(jù)中(zhōng)加入完全定制化的清洗方法和流程,負責将編譯好的擴展清洗方法及描述信息保存到擴展模塊配置中(zhōng),清洗任務(wù)可(kě)以靈活的選擇相應的擴展清洗方法。
清洗日志(zhì)管理(lǐ)
實現清洗動作(zuò)的可(kě)追溯性,清洗任務(wù)會自動保存到清洗日志(zhì)表中(zhōng),不能(néng)自動清洗的為(wèi)異常。通過清洗日志(zhì)管理(lǐ)模塊可(kě)以對清洗任務(wù)進行查詢,并對異常數據進行手工(gōng)處理(lǐ)。
算法和規則配置管理(lǐ)
通過選擇不同的清洗方法和規則實現數據清洗的需求。算法庫管理(lǐ):通過配置管理(lǐ)界面,将已實現算法編譯後的類加載到算法庫,并在算法庫中(zhōng)維護算法的描述信息便于以後的配置管理(lǐ);規則庫管理(lǐ):工(gōng)具(jù)中(zhōng)的清洗規則都維護在系統規則表中(zhōng),将規則代碼和規則相對應管理(lǐ)。
擴展清洗模塊
增強數據清洗工(gōng)具(jù)和數據類型的靈活性,在滿足擴展模塊接口的前提下,定制數據清洗流程進行數據清洗工(gōng)作(zuò)。
安(ān)全測評
系統上線(xiàn)前開展代碼安(ān)全測評,并出具(jù)第三方測評機構出具(jù)評測報告。
1、實現數據标準化、數據模型管理(lǐ)規範化、數據采集上傳規範化、數據采集流程、數據整理(lǐ)流程規範化、數據質(zhì)量控制、完整性控制的流程與規範化。
2、進一步整合了吉林油田不同系統業務(wù)數據,挖掘信息所能(néng)帶來的價值以及對業務(wù)提供更好的決策支持。
3、支持多(duō)種數據交換應用(yòng)場景,平台支持數據複制、數據同步、數據備份/恢複、數據遷移、應用(yòng)系統數據卸載、ETL、數據彙聚整合、數據分(fēn)發、數據服務(wù)等應用(yòng)場景,并滿足各種不同應用(yòng)場景的統一使用(yòng)和監控管理(lǐ)需求。
請聯系我們,我們将推薦适合您需求的産(chǎn)品,或為(wèi)您定制解決方案
400-811-3777轉1