存儲域
數(shù)據(jù)庫加密 諾亞防勒索訪問域
數(shù)據(jù)庫防水壩 數(shù)據(jù)庫防火墻 數(shù)據(jù)庫安全審計(jì) 動態(tài)脫敏流動域
靜態(tài)脫敏 數(shù)據(jù)水印 API安全 醫(yī)療防統(tǒng)方運(yùn)維服務(wù)
數(shù)據(jù)庫運(yùn)維服務(wù) 中間件運(yùn)維服務(wù) 國產(chǎn)信創(chuàng)改造服務(wù) 駐場運(yùn)維服務(wù) 供數(shù)服務(wù)安全咨詢服務(wù)
數(shù)據(jù)出境安全治理服務(wù) 數(shù)據(jù)安全能力評估認(rèn)證服務(wù) 數(shù)據(jù)安全風(fēng)險(xiǎn)評估服務(wù) 數(shù)據(jù)安全治理咨詢服務(wù) 數(shù)據(jù)分類分級咨詢服務(wù) 個人信息風(fēng)險(xiǎn)評估服務(wù) 數(shù)據(jù)安全檢查服務(wù)中國石油天然氣股份有限公司吉林油田分公司(簡稱中國石油吉林油田公司)是中國石油天然氣股份有限公司下屬地區(qū)公司,主營業(yè)務(wù)為石油和天然氣勘探、開發(fā)及銷售,總部位于吉林省松原市。吉林石油集團(tuán)有限責(zé)任公司是中國石油天然氣集團(tuán)公司(CNPC)的全資子公司,也是中國石油四大上產(chǎn)油田之一。
自2006年,吉林油田陸續(xù)開展了勘探開發(fā)主庫建設(shè)、歷史數(shù)據(jù)建設(shè)及新數(shù)據(jù)正?;?xiàng)重點(diǎn)工作:集中開展了科研成果文檔、分析化驗(yàn)、錄井圖、測井圖、開發(fā)地質(zhì)、物探、油氣生產(chǎn)、試井等11類17期科研生產(chǎn)急需的歷史數(shù)據(jù)資源建設(shè)工作,目前勘探開發(fā)歷史數(shù)據(jù)入庫率近70%。
勘探開發(fā)主庫的數(shù)據(jù)來源于數(shù)據(jù)同步、專業(yè)庫集成和歷史數(shù)據(jù)建設(shè)批量加載,這一過程存在錯誤數(shù)據(jù)或數(shù)據(jù)不一致等問題,需要按照一定的規(guī)則針對問題數(shù)據(jù)開展數(shù)據(jù)清洗工作。
具體如下:
1、需借助ETL工具等技術(shù)手段對勘探開發(fā)主庫及鉆錄測試等專業(yè)庫進(jìn)行數(shù)據(jù)綜合分析。
2、對關(guān)鍵值缺失、異常值和重復(fù)數(shù)據(jù)及其它關(guān)鍵問題數(shù)據(jù)進(jìn)行處理,提升主庫和專業(yè)庫內(nèi)數(shù)據(jù)規(guī)范性、可用性和數(shù)據(jù)質(zhì)量。
針對吉林油田上述實(shí)際需求,美創(chuàng)科技通過自主研發(fā)的數(shù)據(jù)支撐平臺實(shí)現(xiàn)數(shù)據(jù)清洗、轉(zhuǎn)換、同步和加載工作。該平臺通過對業(yè)務(wù)系統(tǒng)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,向數(shù)據(jù)倉庫或大數(shù)據(jù)平臺提供高質(zhì)量數(shù)據(jù),支持異構(gòu)數(shù)據(jù)遷移、基于數(shù)據(jù)庫日志的數(shù)據(jù)實(shí)時復(fù)制、ETL開發(fā)、分布式處理等功能。具體如下:
數(shù)據(jù)清洗人物配置管理模塊
清洗模塊是整個清洗工具的控制中心,實(shí)現(xiàn)清洗數(shù)據(jù)源的連接信息、清洗表的設(shè)置,并且記錄清洗信息。
清洗規(guī)則管理模塊
包含各類清洗算法的運(yùn)行參數(shù)、數(shù)據(jù)質(zhì)量指標(biāo)等,如重復(fù)記錄清洗算法的閾值、異常值檢測的標(biāo)準(zhǔn)、基于業(yè)務(wù)規(guī)則的清洗算法的業(yè)務(wù)邏輯等。
清洗算法管理模塊
對重復(fù)數(shù)據(jù)檢測算法、不完整數(shù)據(jù)檢測算法和字段匹配算法、異常值檢測算法等進(jìn)行靈活定義和配置。
擴(kuò)展模塊管理
通過擴(kuò)展模塊允許向數(shù)據(jù)清洗工具中加入完全定制化的清洗方法和流程,負(fù)責(zé)將編譯好的擴(kuò)展清洗方法及描述信息保存到擴(kuò)展模塊配置中,清洗任務(wù)可以靈活的選擇相應(yīng)的擴(kuò)展清洗方法。
清洗日志管理
實(shí)現(xiàn)清洗動作的可追溯性,清洗任務(wù)會自動保存到清洗日志表中,不能自動清洗的為異常。通過清洗日志管理模塊可以對清洗任務(wù)進(jìn)行查詢,并對異常數(shù)據(jù)進(jìn)行手工處理。
算法和規(guī)則配置管理
通過選擇不同的清洗方法和規(guī)則實(shí)現(xiàn)數(shù)據(jù)清洗的需求。算法庫管理:通過配置管理界面,將已實(shí)現(xiàn)算法編譯后的類加載到算法庫,并在算法庫中維護(hù)算法的描述信息便于以后的配置管理;規(guī)則庫管理:工具中的清洗規(guī)則都維護(hù)在系統(tǒng)規(guī)則表中,將規(guī)則代碼和規(guī)則相對應(yīng)管理。
擴(kuò)展清洗模塊
增強(qiáng)數(shù)據(jù)清洗工具和數(shù)據(jù)類型的靈活性,在滿足擴(kuò)展模塊接口的前提下,定制數(shù)據(jù)清洗流程進(jìn)行數(shù)據(jù)清洗工作。
安全測評
系統(tǒng)上線前開展代碼安全測評,并出具第三方測評機(jī)構(gòu)出具評測報(bào)告。
1、實(shí)現(xiàn)數(shù)據(jù)標(biāo)準(zhǔn)化、數(shù)據(jù)模型管理規(guī)范化、數(shù)據(jù)采集上傳規(guī)范化、數(shù)據(jù)采集流程、數(shù)據(jù)整理流程規(guī)范化、數(shù)據(jù)質(zhì)量控制、完整性控制的流程與規(guī)范化。
2、進(jìn)一步整合了吉林油田不同系統(tǒng)業(yè)務(wù)數(shù)據(jù),挖掘信息所能帶來的價(jià)值以及對業(yè)務(wù)提供更好的決策支持。
3、支持多種數(shù)據(jù)交換應(yīng)用場景,平臺支持?jǐn)?shù)據(jù)復(fù)制、數(shù)據(jù)同步、數(shù)據(jù)備份/恢復(fù)、數(shù)據(jù)遷移、應(yīng)用系統(tǒng)數(shù)據(jù)卸載、ETL、數(shù)據(jù)匯聚整合、數(shù)據(jù)分發(fā)、數(shù)據(jù)服務(wù)等應(yīng)用場景,并滿足各種不同應(yīng)用場景的統(tǒng)一使用和監(jiān)控管理需求。
請聯(lián)系我們,我們將推薦適合您需求的產(chǎn)品,或?yàn)槟ㄖ平鉀Q方案
400-811-3777轉(zhuǎn)1