分布式數據庫系統的研究開始于20世紀70年代中期,當時美國計算機公司研制了第一個分布式數據庫系統的原型SDD-1。這個系統是在1976-1978年進行設計和研發的,之后在1979年實現了在DEC-10和DEC-20計算機上的部署和使用。它幾乎包括了分布式數據庫系統的全部理論和實現技術,是分布式數據庫系統發展的典范。目前已經有一些同構分布和異構分布的分布式數據庫系統的原型。
我國對分布式數據庫的研究始于80年代,雖然起步晚,但是起點比較高。目前已經研發出的原型系統無論是性能上還是功能上都已經達到世界平均水平。經過將近幾十年的發展,分布式數據庫系統的理論和技術已經非常成熟,而且技術難點問題也已經攻克。在九十年代已經有產品開始進入市場,但是由于當時系統復雜性對于完全透明的分布式數據庫還很難達到,所以當時分布式數據庫系統基本上沒有進入實用化階段。
分布式數據庫系統極大的滿足了當今信息系統應用的需求,同時也符合當今企業組織的管理思想和方式。對那些管理上集中而地域上分散的跨國集團、大機關、大企業,例如全球性的或全國性的銀行、公司、保險業、連鎖店、各類交通運輸業,以及全國性的人、財、資源、環境管理機構和軍事國防部門等需求極其強烈。在這些組織當中,既要有各部門的局部控制和分散管理,同時也需要整個組織的全局控制以及高層次的協同管理。因此,分布式數據庫系統是未來數據庫的必然趨勢。
一、分布式存儲的定義
分布式存儲,是將數據分散存儲在多臺獨立的存儲設備上。傳統的存儲系統采用集中式地的服務器來存放所有的數據,因此,存儲服務器的性能就成為系統性能的瓶頸,同時也是安全性和可靠性的關鍵點,無法滿足大規模存儲的需要。分布式存儲采用可擴展的系統結構,同時利用多臺存儲服務器來分擔存儲負荷,利用位置服務器定位存儲數據的存儲位置信息,它不但提高了系統的可用性、可靠性和存取效率,還易于擴展存儲設備。
分布式系統主要支持分布式的處理,它是多處理機結構體系,通過計算機網絡把多個處理機連接起來,把一個任務分解為多個子任務然后分布到多個處理機上同時執行,最終將結果生成出來,返回給業務系統。分布式系統主要包括操作系統、編譯系統、文件系統、程序設計和分布式數據庫系統等。分布式系統在進行任務處理時,首先將一個計算的任務拆分成多個子任務,將多個子任務分發到多個處理機上同時進行處理,最終合并子任務處理的結果,把最終結果提交給業務系統使用。這一點與并行系統相似,但它和并行系統也存在著區別,分布式系統是將子任務單獨進行處理,獨立執行,相互之間幾乎沒有任何影響,例如其中的一個子任務在進行業務處理時,由于某方面原因,導致結果錯誤或者數據異常,無法返回正確的結果,但對其他的子任務卻沒有任何影響,其他子任務仍能正常運行,返回正確的結果。所以,分布式系統是允許最終的結果有一定的錯誤和誤差,并且對實時性要求也不高的系統。
它通常包括如下三個基本特點:
1) 分布式數據庫系統中最重要是的分層控制結構,分層控制結構是整個分布式數據庫系統管理的基礎,它通常以全局數據庫為核心,使各個局部數據庫管理系統都擁有管理本地數據庫的自主權。
2) 數據庫獨立性是整個分布式數據庫的核心,而且對數據的分布式透明性進行了定義和介紹。分布式透明性是指程序的正確性不受數據轉移的絲毫影響,仿佛數據是集中式存儲的,完全沒有被分散。只是在使用數據時,同時從分布在不同物理位置上的數據庫進行提取數據,然后將提取出來的數據進行合并,返回給業務系統使用,數據的訪問速度比集中式數據庫速度要慢,降低了數據處理的效率。
3) 數據的冗余特性是分布式數據庫系統新增的主要特性,這也是分布式數據庫和集中式數據庫的一個主要區別。增加數據的冗余度主要出于幾個方面:一方面,我們在不同的數據庫節點上保留相同的數據可以使用戶訪問數據時直接使用本地數據,使本地數據庫的應用增強。另一方面,當某個數據庫節點一旦發生故障或者損壞時,我們可以通過使用其他的數據庫節點來進行復制數據,從而保證了數據庫節點的正常運行,對分布式數據庫系統的穩定性和安全性提供了有力的保障。
二、分布式數據庫的概念
近年來,計算機技術突飛猛進,計算機的使用越來越廣。單計算機系統的服務器越來越無法滿足人們對計算機性能和功能上的需求,因此,通過計算機網絡連接多臺計算機服務器組成分布式環境是當今數據庫的發展趨勢。隨著企業發展的不斷壯大,企業趨向于分散化,傳統的集中式軟件系統已無法滿足企業的需要,開始逐步從集中式過渡到分布式。分布式數據庫必然成為數據庫技術的主要研究方向。
另一方面,在21世紀經濟發展中,信息是企業發展和擴大的核心因素。由于企業發展不斷壯大,企業結構分散化加劇,使得傳統的數據庫部署方式已無法滿足企業的需要,數據庫的分布式部署方式已經成為企業數據庫的核心,也是未來數十年之內的發展方向。
分布式數據庫由一組數據節點構成,這些數據庫節點在邏輯上是同一個數據庫,但是物理上這些數據庫節點卻是分散在不同地理位置,通過計算機網絡將其連接起來,并統一由分布式數據庫管理系統進行數據的管理,管理所有節點上的數據。
按功能進行劃分,分布式數據庫系統主要包括分布式數據庫管理系統和分布式數據庫。分布式數據庫使用計算機網絡將分散在各地的各個數據庫節點連接起來形成一個統一的邏輯集合。分布式數據庫主要包括局部應用和全局應用:分布應用(或全局應用)主要是指對兩個以上結點上的數據庫執行應用;而局部應用僅對本結點的數據庫執行應用。只有支持全局應用的才被稱為分布式數據庫系統。它主要對分布式環境下數據進行管理和維護,使數據保持一致。
三、分布式數據庫系統的體系結構
分布式數據庫系統的體系結構主要由局部概念層、局部內層、全局外層以及全局概念層等幾部分組成的,分布式數據庫是通過網絡通訊、全局數據庫管理系統以及局部數據庫管理系統同時進行管理的。三者共同構成了分布式數據庫的管理系統。通過對它們的實現,支撐了整個分布式數據庫體系。
分布式數據庫系統是傳統的集中式數據庫系統在計算機網絡方面的的延伸。因此,分布式數據庫不僅具有傳統集中式數據庫的全部特點,同時它又比集中式數據庫技術實現上要求更高,實現更加復雜。
分布式數據庫系統主要劃分為以下四層模式,如下圖所示。這四層主要包括:全局概念外層、全局視圖(或稱全局外層)、局部內層以及局部概念層等基本部分。各個層次之間擁有各自的聯系,進行不同映射。
分布式數據庫系統結構圖
分布式數據庫是整個企業私有云架構在數據存儲方面的關鍵核心,它的實現對于私有云平臺的實現至關重要,尤其是云計算ERP的實現。ERP系統最關鍵的核心就是數據,而數據的存儲一直是系統的性能瓶頸,只有從根本上解決數據存儲問題才能徹底解決ERP系統的性能瓶頸。分布式數據庫從根本上解決了數據的存儲,通過把不同的業務系統模塊的數據部署到不同的數據庫服務器上,從而減少了單個數據庫的并發操作和海量數據的處理,從根本上提升了性能。所以,分布式存儲是未來ERP數據存儲的發展方向。
本文主要介紹了分布式數據庫的定義、特點、分類、系統結構等方面,通過對分布式數據庫核心技術的研究,后期我們將設計在私有云平臺方面的數據的分布式架構,實現云計算ERP數據存儲在分布式數據庫上的應用。
轉載請注明出處:拓步ERP資訊網http://m.hanmeixuan.com/
本文標題:企業私有云在RS10中的應用之二:云計算中的分布式存儲
本文網址:http://m.hanmeixuan.com/html/consultation/10839710570.html