隨著業務的擴大,信息化的深入,能否快速處理海量數據并有效進行實時分析,將決定企業是否可以迅速應對市場行情變化、做出決策,從而占得發展先機。據研究機構預測,在未來2~5 年中,45% 的企業將投資于“大數據”,以確保在競爭日益激烈的商業環境中,即時訪問和分析所有運營數據的能力。可以預見不遠的將來,企業將面對不斷爆發的數據量、不斷增長的數據類型和數據處理速度的不斷加速;同時業務用戶要求對數據更深的洞察力和更廣泛的數據范圍,并能夠訪問最新的數據,實時回答無延遲。在這樣的背景下,從海量信息中盡快獲取有價值的信息就顯得彌足珍貴,SAP HANA(SAP High-Performance Analytic Appliance)應運而生,該實時數據平臺擁有對大數據進行分析、存儲和處理的強大功能,可以充分挖掘大數據的商業價值,幫助企業緊抓機遇,進行實時決策。
1 SPA HANA 簡介
在信息處理領域,HANA至今對很多人而言還是一個較模糊的,但是它是一個非常重要的概念,有著廣泛的應用。HANA 是一款面向實時商業智能領域的高性能分析應用軟件,它借助主存儲器、處理器技術和應用訣竅領域的最新成果,充分發揮內存數據處理的威力,使分析應用軟件獲得了前所未有的效能,并由此開啟了一個全新的應用軟件類別。
HANA 是SAP 公司的一種最新技術,進行數據的抽出、分析,提供高性能的數據查詢功能,它一個獨立的內存數據庫,基于“列式存儲”及“內存計算技術”的軟硬件結合體;HANA 是一套完整的解決方案,同時又有很多基于HANA 之上的應用,在這種方案中,用戶無需對業務數據進行建模、聚合等操作,只需專注于直接為用戶提供對大量實時業務數據進行高性能查詢及分析等操作。
HANA 技術最大的特點是運用基于內存的計算技術,通過處理在服務器主存儲器上的大量實時數據,獲得分析和交易的即時結果,為客戶即時洞察、預計未來和行動決策間的貫通提供持續的支持,從而實現更出色的經營業績。
2 HANA 與傳統數據庫的區別
傳統數據庫的典型代表是關系數據庫RDBMS(Relationaldatabase Management System),我們常用的商用數據庫如Oracle、SQL Sever、Sybase 等,都是RDBMS。RDBMS 在其技術的成熟度、可靠性、可用性等方面均獲得了極大的成功。而在這個互聯網信息爆炸的年代,使用傳統的數據管理技術去應對目前高信息量的需求,所存在的問題也在日益突現,其主要原因就是對數據存取服務的實時性難以得到保障。
隨著科技的進步,實時數據庫系統,簡稱實時數據庫(Real-time Database,即RTDB)便因此應運而生。其中HANA便是RTDB 的典型代表之一。SAP HANA 不是簡單地直接在內存里面建立整個數據庫,而且把很多屬于應用層級的東西跟數據庫結合在一起,在存儲過程里面,把很多非常通用的算法、一些優化算法,以及大家共同要做大數據處理的函數庫整合在數據庫當中,通過相應的程序來處理。HANA 與傳統數據庫的區別主要體現在以下幾個方面:
1)不同的存儲方式。傳統數據庫的數據存儲方式是按照行來存儲的,在讀取的時候也是通過讀取每一條數據,這樣的讀取方式同樣會給數據中心帶來困難。一個產品如果按行存儲的話要全部讀取進去,再把這些數據全部拿出來這是非常低效的。而HANA 通過列存儲,把一個表按列進行存儲,這樣的話相當于把所有記錄同一個字段的數據作為一條記錄來保存,在這種情況下做數據分析會變的非常快捷,只要集中查找所需的列或者這些屬性出來就可以做分析;
2)全新的內存計算技術。硬盤與內存的速度相比較,毫無疑問是內存的速度快。HANA 是建立在新架構典范上的純內存數據庫,考慮到所有的數據庫都是在內存中,所以 HANA不緩存數據。其同時具備世界級的查詢優化器,能輕易實現大規模并行查詢的操作,包括運算符內部和運算符之間的并行查詢。故HANA 與傳統數據庫系統(RDBMS)的典型區別在于,數據庫的全部或活動事務存取均在內存中執行,從而大幅提高了其運行效率;
3)高效的壓縮比例。HANA 在使用大內存提供內存數據庫的同時,其內部采用的是列式存儲,而列式存儲的優勢就是更適合數據壓縮,再利用HANA 的并行計算技術,HANA 可以將更多的數據裝入內存,在SAP 與多個硬件廠商合作生產的支持HANA 高性能服務器的配合下,從而實現高性能的數據查詢,從另外一方面講也有效降低了成本。
3 HANA 在信息處理領域的應用
3.1 不同的應用,不同的HANA
HANA 作為一個內存數據庫,除了能夠提供最基本的數據添加、刪除、修改及高性能查詢之外,作為一個平臺,同時又有很多基于HANA 之上的應用。從研發者的角度來看,SAPHANA 提供了高效的工作流,還為研發人員提供了相應的標準接口,這對產品的高效研發提供了有效地支持及保證。從企業的角度來看,企業在業務運作期間,可以對海量數據去研究、探索所有的交易記錄并對數據加以分析。同時可通過視圖快速將分析結果呈現給用戶,還可以近乎實時地將需添加的外部數據添加至分析模型并同步到內存中。簡而言之,就是SAP HANA 可以為企業提供高效的數據檢索、分析處理的基礎上,為企業獲得應得的收益提供了有效地支持與幫助。
3.2 典型應用分析
HANA 可以應用在制造、醫療、游戲、金融等等各個行業,在過去的13 個月中,HANA 已經有了有462 個客戶,有超過200 個左右的案例,39 個解決方案。這里選取部分最新發布的解決方案予以分析。
3.2.1 SAP Sales and Operations Planning
是一款由SAP HANA 支持且基于“云”的應用,旨在使企業更加以需求為導向,將需求波動快速轉換成行之有效的制造、采購和物流計劃。從而幫助企業把銷售、市場營銷、財務、供應鏈和其他方面的利益相關者,整合到一個真正集成和協作的規劃流程中。
3.2.2 SAP Cash Forecasting
是一款基于SAP HANA 平臺的內部分析應用,企業可通過早期采納計劃獲得。通過在異構系統架構中設置先進的現金預測和分析能力,該應用可幫助企業:根據SAP 和非 SAP 系統( 如 ERP) 中的財務數據進行準確的現金預測; 根據多種貨幣敞口實時可視性制定有效的外匯對沖策略; 解釋細分至現金流報表項目級別的差異,執行現金預測前過賬差異分析,從而更好地駕馭當今動蕩的金融環境。
3.2.3 SAP Collections Insight
提供銷售團隊優化收款策略所需的實時洞察力和執行層面的協同工具,企業可通過早期采納計劃獲得。由 SAP HANA支持,SAP Collections Insight 可通過易用 Web 或移動應用程序訪問,幫助企業提高收款能力、加速收益到現金進程和改善與客戶的關系。
4 HANA 的優勢和特色
據SAP 全球執行董事會成員史維學博士介紹,目前HANA 在全球的最終用戶超過6.9 萬個,體驗網站平均月訪問者達4 萬,使用體驗用戶達4000 人。在其交易處理性能上也達到了前所未有的高度――77 萬條記錄/ 秒,每小時分析2.5TB數據量。EML 基準測試可以展示65990 次每小時的查詢分析。用戶選擇HANA 是因為其具有如下優勢和特色。
4.1 優勢
海量數據集;非常復雜的SQL ;快速響應時間;結構化數據和非結構化數據的結合;即時響應新生成的查詢;無需預構建數據立方;基于實時數據的商業分析;目前平臺無法支持的一些應用;簡化系統環境,新舊應用運行在同一架構;添加處理器和刀片服務器形成無限的擴展能力。
4.2 特色
1)加速數據的訪問。把數據保存在內存中,提供現今最快速的服務;硬件方面,服務器采用多核架構,并行計算,使得價格迅速下降,性能迅速提升;軟件方面,數據存儲可以選擇行存儲或者是列存儲,同時對數據進行壓縮;
2)把數據分開處理。內存本地化,把大數據量和計算量分散到不同處理器;并行處理,不同的服務器之間也共享同一組數據;容災性,單一的服務器的DOWN 機將不影響任何計算;
3)最小化數據傳輸。壓縮數據,把內存數據進行壓縮,最大限度減少數據從內存傳輸到CPU cache 中;把應用邏輯和計算由應用層轉移到數據庫層,最大限度地減少傳輸的數據量。
5 HANA 的缺陷
作為一個新的產品,不足之處在所難免,HANA 需要改進之處主要體現在以下方面。
1)HANA 不支持JOB 定義和監控,需調用應用腳本和系統任務;
2)HANA 目前沒有給出接口調用模式,外部系統如J2EE無法進行方便的調用,也無Web 服務調用方案;
3)不支持變量定義,復雜甚至簡單的計算都無法實現(無法忍受),返回類型只有TABLETYPE ;
4)操作系統兼容性不夠,HANA 目前只能運行在SuseLinux 企業版(SLES)上。
SAP 今年宣布了五大市場領域,這五大業務領域是在SAPHANA 的基礎上,分為企業應用、商業分析、移動商務、數據庫和技術平臺以及云計算。相信SAP HANA 作為一個開放平臺,未來將開放給更多的合作伙伴和客戶,合作伙伴也可以基于這個平臺開拓創新思維,開發創新應用,為企業創造更多價值。
轉載請注明出處:拓步ERP資訊網http://m.hanmeixuan.com/
本文網址:http://m.hanmeixuan.com/html/consultation/1081949429.html