最早的數(shù)據(jù)歸檔應(yīng)用產(chǎn)生于大型主機(jī)環(huán)境,源于當(dāng)時大型主機(jī)環(huán)境的IT應(yīng)用的規(guī)模較大且相對成熟。因此,關(guān)于歸檔與備份的區(qū)別,國內(nèi)較大的行業(yè)和企業(yè)用戶都比較了解,但對于IT應(yīng)用歷史不長、規(guī)模不大、數(shù)據(jù)量有限的企業(yè)來說,對于兩者的區(qū)別可能就不那么清楚。
基礎(chǔ)的存儲應(yīng)用主要包括數(shù)據(jù)備份與數(shù)據(jù)歸檔兩個方面。歸檔的目的是實現(xiàn)歷史數(shù)據(jù)和信息被系統(tǒng)、科學(xué)、長期地保存,以被公司決策管理、上級或第三方機(jī)構(gòu)監(jiān)管等用途。備份正好相反,其目的是數(shù)據(jù)的立即使用,以確保業(yè)務(wù)連續(xù)性,或者使業(yè)務(wù)中斷時能夠以最短的時間得到恢復(fù)。
近年來,西方國家發(fā)生了一些重大的企業(yè)舞弊案件,使得ZF和整個社會都對企業(yè)數(shù)據(jù)資料的保存提出了更為嚴(yán)苛的要求,從而使數(shù)據(jù)歸檔的地位上升到關(guān)系到企業(yè)存亡和社會安定的高度。另外,早期計算機(jī)主要是處理文本數(shù)據(jù),如今卻要處理大量的多媒體數(shù)據(jù),對存儲容量和速度的要求已經(jīng)發(fā)生了根本性的變化,企業(yè)在數(shù)據(jù)資料的保存和利用方面的投資越來越高,而歸檔是企業(yè)有效管理應(yīng)用數(shù)據(jù)資料、降低成本的重要手段。
因此,從當(dāng)今的數(shù)據(jù)歸檔應(yīng)用來看,主要是解決好企業(yè)數(shù)據(jù)保存的法規(guī)遵從性和企業(yè)數(shù)據(jù)資產(chǎn)的有效管理兩個方面的問題。
雖然數(shù)據(jù)歸檔與備份都屬于存儲應(yīng)用,但在技術(shù)實現(xiàn)上有很大區(qū)別。在IT應(yīng)用早期,磁盤陣列不像今天這么發(fā)達(dá),磁帶庫是主要的備份技術(shù)。如今,硬盤越來越便宜,不僅磁帶在備份中的應(yīng)用減少了,甚至有人提出用磁盤陣列來做歸檔,全面取代磁帶庫。但是,由于磁盤陣列的技術(shù)特性所決定,存儲在其中的資料都處在熱狀態(tài)。
這就是說,用于數(shù)據(jù)歸檔的磁盤存儲系統(tǒng)不應(yīng)該關(guān)機(jī),其重新加電的過程也很復(fù)雜。而在提倡“綠色計算”的今天,長期開機(jī)很不利于能耗的降低。而且,幾十年、上百年的資料,使用頻度不一定很高,磁盤和磁帶相比,成本效益就更加懸殊。所以說,對于數(shù)據(jù)歸檔來說,磁帶庫仍然是不可替代的最佳選擇。
光盤存儲也被認(rèn)為是數(shù)據(jù)歸檔的一種手段,其特點是價格低廉,技術(shù)含量低,而且便于大范圍分發(fā)。但是,其容量無法與磁帶和磁盤相比,能夠支持的應(yīng)用也比較受限,因此并不適用于企業(yè)數(shù)據(jù)中心級別的數(shù)據(jù)歸檔應(yīng)用。
我們都看到,在數(shù)據(jù)歸檔中應(yīng)用ILM(Information Lifecycle Management,信息生命周期管理)的理念已經(jīng)逐步被用戶接受,這不僅能幫助企業(yè)從整體上改善其數(shù)據(jù)資產(chǎn)的管理,以最低的成本來實現(xiàn)大量數(shù)據(jù)的有效管理與高效利用。并且隨著應(yīng)用的成熟與現(xiàn)實的需求,我們發(fā)現(xiàn)數(shù)據(jù)加密、身份認(rèn)證、虛擬化等技術(shù)也逐步走進(jìn)數(shù)據(jù)歸檔的應(yīng)用中,并且有效地提高了數(shù)據(jù)歸檔應(yīng)用的效率,增強了數(shù)據(jù)安全性,大大降低了操作的復(fù)雜性和成本。
ILM的應(yīng)用使得我們在考慮現(xiàn)有數(shù)據(jù)應(yīng)用需求時,能夠更好地綜合考慮操作性、安全性、成本與生產(chǎn)效率的各方面因素,更加理性地、系統(tǒng)地構(gòu)建數(shù)據(jù)歸檔保護(hù)基礎(chǔ)架構(gòu)。