一 引言
由于數(shù)字設(shè)備的產(chǎn)生及快速發(fā)展(例如個(gè)人電腦、筆記本電腦、平板電腦、及智能電話(huà)等),因此新的數(shù)據(jù)不斷產(chǎn)生,其規(guī)模越來(lái)越龐大。
根據(jù)市場(chǎng)研究公司IDC的一項(xiàng)調(diào)查顯示,全球數(shù)字?jǐn)?shù)據(jù)量每2年便翻一番。2011年的數(shù)據(jù)量將達(dá)到里程碑式的1.8澤字節(jié)(ZB),也就是1.8萬(wàn)億G字節(jié)。IDC調(diào)查了一年中世界范圍內(nèi)原創(chuàng)或復(fù)制的數(shù)據(jù)發(fā)現(xiàn):全球IT從業(yè)人數(shù)的增長(zhǎng)并沒(méi)有與服務(wù)器、數(shù)據(jù)管理及非結(jié)構(gòu)化數(shù)據(jù)的大量增加成正比。到2020年,服務(wù)器數(shù)量將是現(xiàn)在的10倍,信息量將是現(xiàn)在的50倍。根據(jù)該調(diào)查得出的結(jié)論,到2020年,全球?qū)氖鹿芾頂?shù)據(jù)工作的IT專(zhuān)業(yè)人員的需求量將是現(xiàn)在的1.5倍。
如何有效地管理和存儲(chǔ)這些海量的數(shù)據(jù),這一難題成為業(yè)界所關(guān)注的焦點(diǎn)。而分布式存儲(chǔ)系統(tǒng)被認(rèn)為是針對(duì)該問(wèn)題的最佳解決方案,也越來(lái)越受到大家的關(guān)注。
二 傳統(tǒng)的存儲(chǔ)系統(tǒng)
2.1 直連式存儲(chǔ)(DAS)
開(kāi)放系統(tǒng)的直連式存儲(chǔ)(Direct-Attached Storage,DAS),已經(jīng)有近40年的發(fā)展歷史,它的特點(diǎn)是:存儲(chǔ)設(shè)備是通過(guò)電纜(通常是SCSI接口電纜)直接連接服務(wù)器。I/O(輸入,輸出)請(qǐng)求直接發(fā)送到存儲(chǔ)設(shè)備,它基于服務(wù)器,其本身是硬件的堆疊,不帶有任何存儲(chǔ)操作系統(tǒng)。它的缺點(diǎn)是:
①管理復(fù)雜;
、谥鞣⻊(wù)器容易成為訪問(wèn)的瓶頸;
③缺乏數(shù)據(jù)共享能力;
、軘U(kuò)展能力有限;
、莶荒茉诰擴(kuò)展和維護(hù)。
2.2 網(wǎng)絡(luò)附屬存儲(chǔ)(NAS)
網(wǎng)絡(luò)附屬存儲(chǔ)(Network Attached Storage,NAS)是一種將分布、獨(dú)立的數(shù)據(jù)整合為大型、集中化管理的數(shù)據(jù)中心,以便對(duì)不同主機(jī)和應(yīng)用服務(wù)器進(jìn)行訪問(wèn)的技術(shù)。
NAS被定義為一種特殊的專(zhuān)用數(shù)據(jù)存儲(chǔ)服務(wù)器,包括存儲(chǔ)器件(例如磁盤(pán)陣列、CD/DVD驅(qū)動(dòng)器、磁帶驅(qū)動(dòng)器或可移動(dòng)的存儲(chǔ)介質(zhì))和內(nèi)嵌系統(tǒng)軟件,可提供跨平臺(tái)文件共享功能。但是文件服務(wù)器容易成為整個(gè)系統(tǒng)的瓶頸,例如在大規(guī)模數(shù)據(jù)訪問(wèn)時(shí)會(huì)出現(xiàn)性能方面的問(wèn)題。
2.3 存儲(chǔ)區(qū)域網(wǎng)絡(luò)(SAN)
存儲(chǔ)區(qū)域網(wǎng)絡(luò)(Storage Area Network)的支撐技術(shù)是光線通道(Fiber Channel)技術(shù),這是ANSI為網(wǎng)絡(luò)和通道I/O接口建立的—個(gè)標(biāo)準(zhǔn)集成。支持HIPPI、IPI、SCSI、IP、ATM等多種高級(jí)協(xié)議。它的最大特性是將網(wǎng)絡(luò)和設(shè)備的通信協(xié)議與傳輸物理介質(zhì)隔離。這樣,多種協(xié)議可在同一個(gè)物理連接上同時(shí)傳送,高性能存儲(chǔ)體和寬帶網(wǎng)絡(luò)使用單I/O接口使得系統(tǒng)的成本和復(fù)雜程度大大降低。
SAN的主要特點(diǎn)是:
①具有較高的擴(kuò)展能力和高存儲(chǔ)能力;
、跀(shù)據(jù)分享能力有限;
③安全性較差。
三 分布式存儲(chǔ)系統(tǒng)分類(lèi)
分布式存儲(chǔ)系統(tǒng)從數(shù)據(jù)存儲(chǔ)模型上來(lái)看,可以分為以下幾類(lèi)。
3.1 存儲(chǔ)虛擬化
全球網(wǎng)絡(luò)存儲(chǔ)工業(yè)協(xié)會(huì)(Storage Networking Industry Association,SNIA)對(duì)存儲(chǔ)虛擬化做了如下定義:從應(yīng)用、計(jì)算機(jī)服務(wù)器或者一般的網(wǎng)絡(luò)資源中抽象、隱藏或隔離存儲(chǔ)系統(tǒng),使應(yīng)用和網(wǎng)絡(luò)可以獨(dú)立地管理、存儲(chǔ)及獲得數(shù)據(jù)。使用存儲(chǔ)虛擬化的應(yīng)用服務(wù)或者設(shè)備可以集成不同的存儲(chǔ)設(shè)備,還能添加底層存儲(chǔ)資源來(lái)擴(kuò)展存儲(chǔ)能力。
對(duì)存儲(chǔ)虛擬化(Storage Virtualization)最通俗的理解就是對(duì)存儲(chǔ)硬件資源進(jìn)行抽象化表現(xiàn)。通過(guò)將一個(gè)或多個(gè)目標(biāo)(Target)服務(wù)或功能與其他附加的功能集成,統(tǒng)一提供有用的全面功能服務(wù)。典型的虛擬化情況有:屏蔽系統(tǒng)的復(fù)雜性,增加或集成新的功能,仿真、整合或分解現(xiàn)有的服務(wù)功能等。虛擬化是作用在一個(gè)或者多個(gè)實(shí)體上的,而這些實(shí)體則是用來(lái)提供存儲(chǔ)資源或服務(wù)的。
存儲(chǔ)虛擬化的主要特點(diǎn)是:
、偻ㄟ^(guò)虛擬化集中管理現(xiàn)有的存儲(chǔ)資源以提高資產(chǎn)利用率;
、诓粫(huì)增加管理和配置的復(fù)雜程度;
、劭梢酝ㄟ^(guò)增加新的存儲(chǔ)資源(通常是硬件設(shè)備),提高線性的擴(kuò)展存儲(chǔ)能力,但不會(huì)產(chǎn)生數(shù)據(jù)搜索方面的問(wèn)題;
、芴峁┌踩愿叩淖鈶(hù)管理機(jī)制,因此用戶(hù)和數(shù)據(jù)可以共享虛擬化的資源,而不受其他用戶(hù)的影響;
、菘梢詿o(wú)縫集成多個(gè)存儲(chǔ)廠家的存儲(chǔ)設(shè)備,避免了廠家鎖定的問(wèn)題。
存儲(chǔ)虛擬化技術(shù)在實(shí)現(xiàn)層面上劃分,有以下幾種類(lèi)別:
、倩谥鳈C(jī)的虛擬化,這是存儲(chǔ)虛擬化最早期的實(shí)現(xiàn)形式,它在主機(jī)的操作系統(tǒng)上基于存儲(chǔ)虛擬化軟件實(shí)現(xiàn)其功能;
、诨诖鎯(chǔ)網(wǎng)絡(luò)的虛擬化是指在存儲(chǔ)的網(wǎng)絡(luò)層中嵌入智能存儲(chǔ)資源管理軟件的技術(shù);
、刍诖鎯(chǔ)控制器的虛擬化,該架構(gòu)在陣列的存儲(chǔ)控制器上執(zhí)行虛擬化。一個(gè)第三方廠家的陣列可以簡(jiǎn)單地通過(guò)插到FC端口上的方式被虛擬化,解決了一般基于陣列虛擬化的廠家鎖定的問(wèn)題。
3.2 分布式對(duì)象存儲(chǔ)系統(tǒng)
SNIA的對(duì)象存儲(chǔ)設(shè)備是這樣定義的:
①一種新的SCSI存儲(chǔ)設(shè)備;
、趯(duì)象可以類(lèi)比為傳統(tǒng)的文件;
③對(duì)象是自完備的,包含元數(shù)據(jù)、數(shù)據(jù)和屬性;
、艽鎯(chǔ)設(shè)備可以自行決定對(duì)象的具體存儲(chǔ)位置和數(shù)據(jù)的分布;
、荽鎯(chǔ)設(shè)備可以對(duì)不同的對(duì)象提供不同的Qos;
、迣(duì)象存儲(chǔ)設(shè)備相對(duì)于塊設(shè)備具有更高的智能性,上層通過(guò)對(duì)象ID訪問(wèn)對(duì)象,而不需要了解對(duì)象的具體空間分布情況。
與傳統(tǒng)存儲(chǔ)模型相比,對(duì)象存儲(chǔ)模型有了如下改變:
、倩趯(duì)象的存儲(chǔ),將存儲(chǔ)模塊轉(zhuǎn)移到存儲(chǔ)設(shè)備中;
、诨趯(duì)象的存儲(chǔ),將設(shè)備的訪問(wèn)接口轉(zhuǎn)變?yōu)閷?duì)象訪問(wèn)接口。傳統(tǒng)存儲(chǔ)模型與對(duì)象存儲(chǔ)模型對(duì)比情況如圖l所示。
對(duì)象是平等的,分布在一個(gè)平面中,而非文件系統(tǒng)那樣的樹(shù)狀邏輯結(jié)構(gòu)中,這也就給了用戶(hù)很大的操作空間:可以利用對(duì)象構(gòu)建文件系統(tǒng).也可以直接使用這個(gè)平面空間。用對(duì)象替代傳統(tǒng)的模塊的好處在于:對(duì)象的內(nèi)容本身來(lái)自應(yīng)用,具有“原子性”,因此可以做到:
①在存儲(chǔ)層進(jìn)行更智能的空間管理;
、趦(nèi)容相關(guān)的數(shù)據(jù)預(yù)取和緩存;
③可靠的多用戶(hù)共享訪問(wèn);
④對(duì)象級(jí)別的安全性。
同時(shí),對(duì)象存儲(chǔ)架構(gòu)還具有更好的可伸縮性。對(duì)象存儲(chǔ)模型如圖2所示。
一個(gè)對(duì)象除了包含ID和用戶(hù)數(shù)據(jù)外,還包含了屬主、時(shí)間、尺寸、位置等源數(shù)據(jù)信息,以及權(quán)限等預(yù)定義屬性,乃至很多自定義屬性。對(duì)象存儲(chǔ)設(shè)備中的對(duì)象分成4類(lèi):
、儆脩(hù)對(duì)象,應(yīng)用創(chuàng)建的普通對(duì)象;
②集合對(duì)象,一組具有共同點(diǎn)的用戶(hù)對(duì)象的集合;
、鄯謪^(qū)對(duì)象,容納用戶(hù)對(duì)象和集合對(duì)象的容器,包含了有某些空間管理、安全等方面(比如quota)的共性的對(duì)象;
、芨鶎(duì)象,對(duì)象存儲(chǔ)設(shè)備自己。
3.3 分布式文件系統(tǒng)
分布式文件系統(tǒng)或網(wǎng)絡(luò)文件系統(tǒng)是指那些可以通過(guò)計(jì)算機(jī)網(wǎng)絡(luò)訪問(wèn)存儲(chǔ)在多個(gè)主機(jī)中的數(shù)據(jù)的文件系統(tǒng)。這使得在多用戶(hù)之間和多應(yīng)用之間共享數(shù)據(jù)和存儲(chǔ)資源成為可能。
分布式文件系統(tǒng)最初產(chǎn)生于1980年代,其代表是NFS(Network File System)和AFS(Andrew File System)。2000年以后,分布式文件系統(tǒng)得到了更多的關(guān)注和長(zhǎng)足的發(fā)展,其中以GFS(googh File system)和Lustre最為著名。
現(xiàn)在的分布式文件系統(tǒng)更加專(zhuān)注于高性能、高擴(kuò)展能力、高可靠性、系統(tǒng)的高可用性和容錯(cuò)能力。以GPS為例,它構(gòu)建在相對(duì)便宜的計(jì)算機(jī)節(jié)點(diǎn)上,通過(guò)以下手段達(dá)到了以上提出的需要付出高昂成本才能實(shí)現(xiàn)的存儲(chǔ)能力:
①通過(guò)將控制流與數(shù)據(jù)流分離的方式來(lái)提高系統(tǒng)的吞吐率,用戶(hù)可以并行在多個(gè)節(jié)點(diǎn)上提取數(shù)據(jù);
、趯(shù)據(jù)分成同等大小的數(shù)據(jù)塊,以方便數(shù)據(jù)的遷移和復(fù)制;
、勖總(gè)數(shù)據(jù)塊都有多個(gè)(通常是3個(gè))存儲(chǔ)副本,以提高數(shù)據(jù)的可靠性和讀取速度;
④一個(gè)數(shù)據(jù)塊可以被分布到不同的機(jī)器上,以提高系統(tǒng)的容錯(cuò)能力。GFS系統(tǒng)架構(gòu)如圖3所示
四 結(jié)語(yǔ)
分布式存儲(chǔ)系統(tǒng)可以存儲(chǔ)海量數(shù)據(jù),它具有性?xún)r(jià)比高及靈活的可擴(kuò)展性等特點(diǎn),在工業(yè)界和學(xué)術(shù)研究領(lǐng)域得到廣泛關(guān)注。本文從傳統(tǒng)的存儲(chǔ)系統(tǒng)出發(fā),比較了傳統(tǒng)的存儲(chǔ)系統(tǒng)和目前流行的分布式存儲(chǔ)系統(tǒng)的區(qū)別與聯(lián)系。同時(shí),對(duì)分布式存儲(chǔ)系統(tǒng)的分類(lèi)及特點(diǎn)進(jìn)行了初步分析。分布式存儲(chǔ)系統(tǒng)有多種不同的實(shí)現(xiàn)原理和方法,適用于不同的應(yīng)用領(lǐng)域,我們需要根據(jù)應(yīng)用特點(diǎn)來(lái)選擇合適的存儲(chǔ)方式。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴(lài)品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://m.hanmeixuan.com/
本文標(biāo)題:分布式存儲(chǔ)系統(tǒng)調(diào)查
本文網(wǎng)址:http://m.hanmeixuan.com/html/support/1112154416.html