隨著大數(shù)據(jù)的快速發(fā)展,很多行業(yè)的都已經(jīng)慢慢建設自己的大數(shù)據(jù)平臺,利用數(shù)據(jù)的價值,給自己帶來更多的利益。坦率地說,與同各行業(yè)相比,高校信息化發(fā)展已經(jīng)處于比較落后的水平,數(shù)據(jù)質量總體情況依舊比較差。雖然其重要性已獲得眾多高校的共識,但很少有學校真正投入人力、財力去對數(shù)據(jù)進行治理。隨著數(shù)據(jù)服務的深入,數(shù)據(jù)的質量問題將會是數(shù)據(jù)治理解決方案里的一個絆腳石。那么如何才能解決數(shù)據(jù)的質量問題呢?
為了保證數(shù)據(jù)的質量,強智科技建議在數(shù)據(jù)的整個生命過程要統(tǒng)一規(guī)劃、有效采集、合理存儲。
首先要制定統(tǒng)一的數(shù)據(jù)標準,對于采集的新數(shù)據(jù),應采用新的標準進行采集、清洗和轉換,對于現(xiàn)存的數(shù)據(jù),要進行一致性校驗、清洗、信息補充等,未來保證數(shù)據(jù)時效性,要保證數(shù)據(jù)采集、傳輸過程的時效性。
其次,目前很多大數(shù)據(jù)采用的是普通云架構的存儲方式,這種存儲方式是面向應用程序運行的。但是對于數(shù)據(jù)分析,應該采取分布式的存儲方式,以便采取分布式的算法提供分析效率。
除此之外,數(shù)據(jù)質量的完善很難一蹴而就,有一個逐步完善的過程。所以人們需要改變數(shù)據(jù)屬性的觀念,逐步從“我的數(shù)據(jù)”到“部門的數(shù)據(jù)”再到“學校的數(shù)據(jù)”,把數(shù)據(jù)從“私有”變?yōu)?ldquo;公有”,共同來維護數(shù)據(jù)質量。同時還需要完善管理機制和數(shù)據(jù)標準,科學規(guī)劃,重構數(shù)據(jù)基礎,以“面向對象”方式有機組織教學、科研、財務、人事、生活等各類數(shù)據(jù)資源。
事實上,隨著科技的進步,高校想要更方便、快捷地做好數(shù)據(jù)治理工作,可以借助一些先進的數(shù)據(jù)管理平臺。比如強智科技的數(shù)據(jù)治理平臺,以用戶為中心,以元數(shù)據(jù)為基礎,貫穿信息標準、數(shù)據(jù)采集、數(shù)據(jù)標準化、數(shù)據(jù)質量、主數(shù)據(jù)管理、數(shù)據(jù)共享等從源端到數(shù)據(jù)中心,再到應用端的全過程管理,并通過大數(shù)據(jù)治理,讓用戶能更便捷、更靈活、更準確地獲得大數(shù)據(jù)資產(chǎn)的能力。