引言
隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計算等技術的快速發(fā)展,以及智能終端、網(wǎng)絡社會、數(shù)字地球等信息體的普及和建設,全球數(shù)據(jù)量出現(xiàn)爆炸式增長,僅在2011年就達到1.8萬億GB。IDC(IntemetData Center,互聯(lián)網(wǎng)絡數(shù)據(jù)中心)預計,到2020年全球數(shù)據(jù)量將增加50倍。毋庸置疑,大數(shù)據(jù)時代已經(jīng)到來。一方面,云計算為這些海量的、多樣化的數(shù)據(jù)提供存儲和運算平臺,同時數(shù)據(jù)挖掘和人工智能從大數(shù)據(jù)中發(fā)現(xiàn)知識、規(guī)律和趨勢,為決策提供信息參考。大數(shù)據(jù)的發(fā)展將進一步擴大信息的開放程度,隨之而來的隱私數(shù)據(jù)或敏感信息的泄露事件時有發(fā)生。面對大數(shù)據(jù)發(fā)展的新特點、新挑戰(zhàn),如何保障數(shù)據(jù)安全是我們需要研究的課題。
1 大數(shù)據(jù)的特征
大數(shù)據(jù)通常被認為是一種數(shù)據(jù)量很大、數(shù)據(jù)形式多樣化的非結構化數(shù)據(jù)。隨著對大數(shù)據(jù)研究的進一步深入,大數(shù)據(jù)不僅指數(shù)據(jù)本身的規(guī)模,也包括數(shù)據(jù)采集工具、數(shù)據(jù)存儲平臺、數(shù)據(jù)分析系統(tǒng)和數(shù)據(jù)衍生價值等要素。其主要特點有以下幾點:
1.1數(shù)據(jù)量大
大數(shù)據(jù)時代,各種傳感器、移動設備、智能終端和網(wǎng)絡社會等無時無刻不在產(chǎn)生數(shù)據(jù),數(shù)量級別已經(jīng)突破TB,發(fā)展至PB乃至ZB,統(tǒng)計數(shù)據(jù)量呈千倍級別上升。據(jù)估計,2012年全球產(chǎn)生的數(shù)據(jù)量將達到2.7ZB,2015年將超過8ZB。
1.2類型多樣
當前大數(shù)據(jù)不僅僅是數(shù)據(jù)量的井噴性增長,而且還包含數(shù)據(jù)類型的多樣化發(fā)展。以往數(shù)據(jù)大都以二維結構呈現(xiàn),但隨著互聯(lián)網(wǎng)、多媒體等技術的快速發(fā)展和普及,視頻、音頻、圖片、郵件、HTML,RFID,GPS和傳感器等產(chǎn)生的非結構化數(shù)據(jù),每年都以60%速度增長。預計,非結構化數(shù)據(jù)將占數(shù)據(jù)總量的80%以上。
1.3運算高效
基于云計算的Hadoop大數(shù)據(jù)框架,利用集群的威力高速運算和存儲,實現(xiàn)了一個分布式運行系統(tǒng),以流的形式提供高傳輸率來訪問數(shù)據(jù),適應了大數(shù)據(jù)的應用程序。而且,數(shù)據(jù)挖掘、語義引擎、可視化分析等技術的發(fā)展,可從海量的數(shù)據(jù)中深度解析,提取信息,掌控數(shù)據(jù)增值的“加速器”。
1.4產(chǎn)生價值
價值是大數(shù)據(jù)的終極目的。大數(shù)據(jù)本身是一個“金礦”,可以從大數(shù)據(jù)的融合中獲得意想不到的有價值的信息。特別是激烈競爭的商業(yè)領域,數(shù)據(jù)正成為企業(yè)的新型資產(chǎn),企業(yè)都在追求數(shù)據(jù)最大價值化。同時,大數(shù)據(jù)價值也存在密度低的特性,需要對海量的數(shù)據(jù)進行挖掘分析才能得到真正有用的信息,形成用戶價值。以監(jiān)控視頻為例,連續(xù)播放的畫面中,可以產(chǎn)生價值信息的數(shù)據(jù)可能僅僅是一兩秒。
2 大數(shù)據(jù)面臨的安全挑戰(zhàn)
正如Gartner所說:“大數(shù)據(jù)安全是一場必要的斗爭。在大數(shù)據(jù)時代,無處不在的智能終端、互動頻繁的社交網(wǎng)絡和超大容量的數(shù)字化存儲,不得不承認大數(shù)據(jù)已經(jīng)滲透到各個行業(yè)領域,逐漸成為一種生產(chǎn)要素發(fā)揮著重要作用,成為未來競爭的至高點。大數(shù)據(jù)所含信息量較高,雖然相對價值密度較低,但是對它里面所蘊藏的潛在信息,隨著快速處理和分析提取技術的發(fā)展,可以快速捕捉到有價值的信息以提供參考決策。然而,大數(shù)據(jù)掀起新一輪生產(chǎn)率提高和消費者盈余浪潮的同時,隨之而來的是信息安全的挑戰(zhàn)。
2.1網(wǎng)絡化社會使大數(shù)據(jù)易成為攻擊目標
網(wǎng)絡化社會的形成,為大數(shù)據(jù)在各個行業(yè)領域?qū)崿F(xiàn)資源共享和數(shù)據(jù)互通搭建平臺和通道。基于云計算的網(wǎng)絡化社會為大數(shù)據(jù)提供了一個開放的環(huán)境,分布在不同地區(qū)的資源可以快速整合,動態(tài)配置,實現(xiàn)數(shù)據(jù)集合的共建共享。而且,網(wǎng)絡訪問便捷化和數(shù)據(jù)流的形成,為實現(xiàn)資源的快速彈性推送和個性化服務提供基礎。正因為平臺的暴露,使得蘊含著海量數(shù)據(jù)和潛在價值的大數(shù)據(jù)更容易吸引黑客的攻擊。也就是說,在開放的網(wǎng)絡化社會,大數(shù)據(jù)的數(shù)據(jù)量大且相互關聯(lián),對于攻擊者而言,相對低的成本可以獲得“滾雪球”的收益。近年來在互聯(lián)網(wǎng)上發(fā)生的用戶賬號的信息失竊等連鎖反應可以看出,大數(shù)據(jù)更容易吸引黑客,而且一旦遭受攻擊,失竊的數(shù)據(jù)量也是巨大的。
2.2非結構化數(shù)據(jù)對大數(shù)據(jù)存儲提出新要求
在大數(shù)據(jù)之前,我們通常將數(shù)據(jù)存儲分為關系型數(shù)據(jù)庫和文件服務器兩種。而當前大數(shù)據(jù)洶涌而來,數(shù)據(jù)類型的千姿百態(tài)也使我們措手不及。對于將占數(shù)據(jù)總量80%以上的非結構化數(shù)據(jù),雖然NoSQL數(shù)據(jù)存儲具有可擴展性和可用性等優(yōu)點,利于趨勢分析,為大數(shù)據(jù)存儲提供了初步解決方案,但是NoSQL數(shù)據(jù)存儲仍存在以下問題:一是相對于嚴格訪問控制和隱私管理的SQL技術,目前NoSQL還無法沿用SQL的模式,而且適應NoSQL的存儲模式并不成熟;二是雖然NoSQL軟件從傳統(tǒng)數(shù)據(jù)存儲中取得經(jīng)驗,但NoSQL仍然存在各種漏洞,畢竟它使用的是新代碼;三是由于NoSQL服務器軟件沒有內(nèi)置足夠的安全,所以客戶端應用程序需要內(nèi)建安全因素,這又反過來導致產(chǎn)生了諸如身份驗證、授權過程和輸入驗證等大量的安全問題。
2.3技術發(fā)展增加了安全風險
隨著計算機網(wǎng)絡技術和人工智能的發(fā)展,服務器、防火墻、無線路由等網(wǎng)絡設備和數(shù)據(jù)挖掘應用系統(tǒng)等技術越來越廣泛,為大數(shù)據(jù)自動收集效率以及智能動態(tài)分析性提供方便。但是,技術發(fā)展也增加了大數(shù)據(jù)的安全風險。一方面,大數(shù)據(jù)本身的安全防護存在漏洞。雖然云計算對大數(shù)據(jù)提供了便利,但對大數(shù)據(jù)的安全控制力度仍然不夠,API(Application Programming Interface,應用程序編程接口)訪問權限控制以及密鑰生成、存儲和管理方面的不足都可能造成數(shù)據(jù)泄漏。而且大數(shù)據(jù)本身可以成為一個可持續(xù)攻擊的載體,被隱藏在大數(shù)據(jù)中的惡意軟件和病毒代碼很難被發(fā)現(xiàn),從而達到長久攻擊的目的。另一方面,攻擊的技術提高了。在用數(shù)據(jù)挖掘和數(shù)據(jù)分析等大數(shù)據(jù)技術獲取價值信息的同時,攻擊者也在利用這些大數(shù)據(jù)技術進行攻擊。
3 大數(shù)據(jù)安全的應對策略
當然,大數(shù)據(jù)也為數(shù)據(jù)安全的發(fā)展提供了新機遇。大數(shù)據(jù)正在為安全分析提供新的可能性,對海量數(shù)據(jù)的分析有助于更好地跟蹤網(wǎng)絡異常行為,對實時安全和應用數(shù)據(jù)結合在一起的數(shù)據(jù)進行預防性分析,可防止詐騙和黑客人侵。網(wǎng)絡攻擊行為總會留下蛛絲馬跡,這些痕跡都以數(shù)據(jù)的形式隱藏在大數(shù)據(jù)中,從大數(shù)據(jù)的存儲、應用和管理等方面層層把關,可以有針對性地應對數(shù)據(jù)安全威脅。
3.1大數(shù)據(jù)存儲安全策略
基于云計算架構的大數(shù)據(jù),數(shù)據(jù)的存儲和操作都是以服務的形式提供。目前,大數(shù)據(jù)的安全存儲采用虛擬化海量存儲技術來存儲數(shù)據(jù)資源,涉及數(shù)據(jù)傳輸、隔離、恢復等問題。解決大數(shù)據(jù)的安全存儲,一是數(shù)據(jù)加密。在大數(shù)據(jù)安全服務的設計中,大數(shù)據(jù)可以按照數(shù)據(jù)安全存儲的需求,被存儲在數(shù)據(jù)集的任何存儲空間,通過SSL(Secure Sockets Layer,安全套接層協(xié)議層)加密,實現(xiàn)數(shù)據(jù)集的節(jié)點和應用程序之間移動保護大數(shù)據(jù)。在大數(shù)據(jù)的傳輸服務過程中,加密為數(shù)據(jù)流的上傳與下載提供有效的保護。應用隱私保護和外包數(shù)據(jù)計算,屏蔽網(wǎng)絡攻擊。目前,PGP和TrueCrypt等程序都提供了強大的加密功能。二是分離密鑰和加密數(shù)據(jù)。使用加密把數(shù)據(jù)使用與數(shù)據(jù)保管分離,把密鑰與要保護的數(shù)據(jù)隔離開。同時,定義產(chǎn)生、存儲、備份、恢復等密鑰管理生命周期。三是使用過濾器。通過過濾器的監(jiān)控,一旦發(fā)現(xiàn)數(shù)據(jù)離開了用戶的網(wǎng)絡,就自動阻止數(shù)據(jù)的再次傳輸。四是數(shù)據(jù)備份。通過系統(tǒng)容災、敏感信息集中管控和數(shù)據(jù)管理等產(chǎn)品,實現(xiàn)端對端的數(shù)據(jù)保護,確保大數(shù)據(jù)損壞情況下有備無患和安全管控。
3.2大數(shù)據(jù)應用安全策略
隨著大數(shù)據(jù)應用所需的技術和工具快速發(fā)展,大數(shù)據(jù)應用安全策略主要從以下幾方面著手:一是防止APT(Advanced Persistent Threat,高級持續(xù)性威脅)攻擊。借助大數(shù)據(jù)處理技術,針對APT安全攻擊隱蔽能力強、長期潛伏、攻擊路徑和渠道不確定等特征,設計具備實時檢測能力與事后回溯能力的全流量審計方案,提醒隱藏有病毒的應用程序。二是用戶訪問控制。大數(shù)據(jù)的跨平臺傳輸應用在一定程度上會帶來內(nèi)在風險,可以根據(jù)大數(shù)據(jù)的密級程度和用戶需求的不同,將大數(shù)據(jù)和用戶設定不同的權限等級,并嚴格控制訪問權限。而且,通過單點登錄的統(tǒng)一身份認證與權限控制技術,對用戶訪問進行嚴格的控制,有效地保證大數(shù)據(jù)應用安全。三是整合工具和流程。通過整合工具和流程,確保大數(shù)據(jù)應用安全處于大數(shù)據(jù)系統(tǒng)的頂端。整合點平行于現(xiàn)有的連接的同時,減少通過連接企業(yè)或業(yè)務線的SIEM工具的輸出到大數(shù)據(jù)安全倉庫,以防止這些被預處理的數(shù)據(jù)被暴露算法和溢出加工后的數(shù)據(jù)集。同時,通過設計一個標準化的數(shù)據(jù)格式簡化整合過程,同時也可以改善分析算法的持續(xù)驗證。四是數(shù)據(jù)實時分析引擎。數(shù)據(jù)實時分析引擎融合了云計算、機器學習、語義分析、統(tǒng)計學等多個領域,通過數(shù)據(jù)實時分析引擎,從大數(shù)據(jù)中第一時間挖掘出黑客攻擊、非法操作、潛在威脅等各類安全事件,第一時間發(fā)出警告響應。
3.3大數(shù)據(jù)管理安全策略
云計算專家李志霄博士說:“數(shù)據(jù)安全三分靠技術,七分靠管理。”閻通過技術來保護大數(shù)據(jù)的安全必然重要,但管理也很關鍵。大數(shù)據(jù)的管理安全策略主要有:一是規(guī)范建設。大數(shù)據(jù)建設是一項有序的、動態(tài)的、可持續(xù)發(fā)展的系統(tǒng)工程,一套規(guī)范的運行機制、建設標準和共享平臺建設至關重要。規(guī)范化建設可以促進大數(shù)據(jù)管理過程的正規(guī)有序,實現(xiàn)各級各類信息系統(tǒng)的網(wǎng)絡互連、數(shù)據(jù)集成、資源共享,在統(tǒng)一的安全規(guī)范框架下運行。二是建立以數(shù)據(jù)為中心的安全系統(tǒng)。基于云計算的大數(shù)據(jù)存儲在云共享環(huán)境中,為了大數(shù)據(jù)的所有者可以對大數(shù)據(jù)使用進行控制,可以通過建設一個基于異構數(shù)據(jù)為中心的安全方法,從系統(tǒng)管理上保證大數(shù)據(jù)的安全。三是融合創(chuàng)新。大數(shù)據(jù)是在云計算的基礎上提出的新概念,大數(shù)據(jù)時代應以智慧創(chuàng)新理念融合大數(shù)據(jù)與云計算,以智能管道與聚合平臺為基礎,提升數(shù)據(jù)流量規(guī)模、層次及內(nèi)涵,在大數(shù)據(jù)流中提升知識價值洞察力。積極創(chuàng)造大數(shù)據(jù)公司技術融合平臺,尋找數(shù)據(jù)洪流大潮中新的立足點,特別是在數(shù)據(jù)挖掘、人工智能、機器學習等新技術的創(chuàng)新應用融合創(chuàng)新。
4 結束語
大數(shù)據(jù)是信息化時代的“石油”。大數(shù)據(jù)轉(zhuǎn)化為信息和知識的速度與能力將成為這個時代的核心競爭力之一,而大數(shù)據(jù)面臨的安全挑戰(zhàn)卻不容忽視。只有大數(shù)據(jù)技術和大數(shù)據(jù)安全“兩條腿”走路時,大數(shù)據(jù)才可以真正成為這個時代的驅(qū)動力量。
核心關注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務領域、行業(yè)應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業(yè)務領域的管理,全面涵蓋了企業(yè)關注ERP管理系統(tǒng)的核心領域,是眾多中小企業(yè)信息化建設首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://m.hanmeixuan.com/
本文標題:大數(shù)據(jù)環(huán)境下的數(shù)據(jù)安全研究
本文網(wǎng)址:http://m.hanmeixuan.com/html/support/1112189770.html