從過往的經驗來看,在部署云服務時,最好在公共云執行大數據原型,然后轉移到私有云。為什么?公共云部署,顧名思義,是在第三方環境內,并可能受到“不信任”各方的訪問。而私有云部署直接受組織或者企業的控制和管理,即使數據計算設施可能位于企業外部,但私有云部署只能由受信任的各方來訪問。
更好地利用大數據的下一個戰略是部署融合存儲。融合存儲更有效,并能夠降低錯誤的可能性,而這些錯誤可能影響數據質量或準確性。融合存儲與數據質量和準確性相關的關鍵特征是重復數據刪除,它還具有成本效益的優勢。
另一種最佳做法是正確地清洗數據,以幫助避免一些上述隱私問題。Emory University數據倉庫專家Amy Dean表示:“在盡可能早的時候,對數據進行過濾、清理、刪減、一致化、匹配、連接和診斷。”鑒于數據質量對分析的影響,Dean建議對多樣的不同的數據進行衡量或者評估。Dean還建議,為了查詢,數據來源應該有鏈接或可用,這樣有問題的任何數據元素都可以追溯到其源頭。
最終,確保個人數據準確性(進而確保更好的數據隱私)的最好辦法是鼓勵和要求消費者查看、審查和糾正收集到的有關自己的信息,而不只是企業自己動手。此外,消費者審查過程要易用,而且不需要消費者花錢的。對于早期大數據使用者,這是很艱巨的工作,因為他們通常收集大量甚至他們從未使用的數據,操作起來會很復雜。并且,企業可能也擔心消費者看到他們收集了如此詳細的個人信息。但這種透明度是讓消費者決定采用大數據,建立信心的最佳方式。信譽報告實體一直以來讓消費者訪問、審查和糾正數據,這是長期有效的做法,這也是美國監管部門對該行業的要求。同樣,隱私提示、網站聲明(其中包含回答問題的詳細聯系方式)能夠實現更好的透明度,也是處理錯誤數據的方法。
大數據之謎
最富爭議的企業隱私觀念是取得同意或者允許收集和使用個人數據。如果時光可以倒流,一切重新開始,這將是個理想的基本規則。然而,尋求個人的同意來收集個人數據已經為時已晚,因為已經有大量個人數據被收集和廣泛共享。不爭的事實是,我們不可能確定所有可能收集了個人數據的企業。
有種辦法可以幫助個人重新獲得對其個人數據的“控制”,即允許他們完全刪除和清除自己的數據。當然,大數據用戶并不樂于提供該功能,并且,這是對消費者是否能意識到和相信使用其數據能夠帶來優勢的“嚴峻考驗”。監管部門在考慮保護消費者隱私權利的時候,必然會要求提供刪除數據的能力。隨著大數據使用的不斷發展,在企業大數據部署的技術設計和架構階段,企業應該考慮提供允許個人刪除特定數據字段的功能。
同樣的,從保護個人隱私權利的角度來看,使用個人數據的更好的辦法就是對所有個人數據“匿名化”處理。然而,匿名化的概念(即刪除任何可識別的字段或屬性)并沒有被證明是可行的。早在2000年, Latanya Sweeney博士(現為哈佛大學教授)就表明只需要三個信息就可以確定87%的美國人:ZIP代碼、出生日期和性別,而這些信息都可以在公共記錄中找到。考慮到這些研究結果,即使部署了匿名化系統,我們仍然能夠重新確定任何居住在美國的個人消費者的身份。
考慮到所有這些問題和戰略,在蓬勃發展的大數據領域,保護個人隱私權利的解決辦法是,確保可靠的準確的個人數據,并對其進行適當的解譯。同時,企業應該將上述隱私原則納入其大數據開發和使用中,只有這樣,企業才能夠獲得最好的結果,或者說,最少的消費者抵觸情緒。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://m.hanmeixuan.com/
本文標題:管理大數據隱私:主動出擊戰略(二)