目前,我國大多數行業,包括證券、保險、工商、地稅、土管、和銀行業等,都有對各種信息資料實現現代化管理的迫切需要。對于來源繁多的信息資料,專業人士根據信息的格式加以劃分,將其分為結構化信息和非結構化信息兩大類:
●結構化信息——我們通常接觸的數據庫所管理的信息,包括生產、業務、交易、客戶信息等方面的記錄;
●非結構化信息——專業術語為內容,所涵蓋的信息更為廣泛,可分為:
1)營運內容(operational content):如合約、發票、書信與采購記錄;
2)部門內容(workgroup content):如文書處理、電子表格、簡報檔案與電子郵件;
3)Web內容:如HTML與XML等格式的信息;
4)多媒體內容(Rich Media Content):如聲音、影片、圖形等。
如果說結構化信息更多的忠實、詳實地記錄了企業的生產交易活動,是顯性的表示,那么非結構化信息則隱性包含了掌握著企業命脈的關鍵,隱含著許多提高企業效益的機會。對于企業來說,企業內部,以及企業與供應商、客戶、合作伙伴和員工數字化共享所有形式的數據資源,已越來越重要。
根據行業估計結果,超過85%的商業信息來源以非結構化形式表現,雖然許多企業都擁有數據庫管理系統,但其僅能處理結構性資料,如數字等;對于這些非結構化數據的信息,其中只有不到5%進行了數字化。內容管理技術應運而生。
伴隨著數據管理技術將迎來它的又一次重大革新——信息管理(Information Management),信息管理軟件不再只是一個數據庫,而是一個實現“隨需應變”的開放、智能、完整的數據管理解決方案。它以開放系統、跨平臺的數據庫系統為基礎,以內容管理(Content Management,簡稱CM)、數據倉庫管理、智能分析為核心,在信息集成軟件支持下,為人們提供整合信息。其中,內容管理作為一種專門的非結構化信息管理技術,伴隨著非結構化數據規模和應用需求的不斷增長,逐漸成為數據管理技術發展的一個重要方向。
ECM是企業發展的必需
內容管理在其發展過程中,經歷了數據庫+LOB(大對象的擴展插件)、數據庫+文件系統等數據庫平臺階段,但是隨著應用的業務規模與種類的不斷飛速發展,越來越多的問題如性能、功能、安全、二次開發能力等,不斷呈現在終端用戶和應用商面前,歸根結底,結構化數據庫不適合內容的管理。隨著上個世紀80年代中期,企業內容管理(EntERPrise Content Management,ECM)概念的推出,在90年代初期形成專門的文檔資料/多媒體管理平臺,并在90年代中后期產品成熟,標志著ECM進行著一次新的變革。
ECM是指內容管理將從辦公自動化以及某些局部應用拓展到整個企業。Gartner Group 在2001年給出的企業內容管理的定義中,將之定位為“運用技術對貫穿企業的內容進行創建、捕獲、分發、客戶化以及管理的過程”。面對日益復雜的IT環境,企業如何有效地采集、管理、應用各種非結構化和半結構化的資源,并且將與企業業務系統(如ERP、CRM等)中的各種結構化信息集成起來,已經成為ECM發展的瓶頸。
ECM所涵蓋的范圍包括內容的采集和創建、存貯和管理、工作流管理、內容復制和分發、內容檢索和導航、安全控制管理、用戶管理等功能。
豐富的內容采集功能
內容采集是指內容管理系統獲取非結構化信息的能力,由于所要處理的內容豐富多彩,內容的來源也迥然不同:影像內容大多是由紙質資料通過影像采集設備轉換而來,這些影像采集設備可能是高速批量掃描儀、平板掃描儀、數碼攝像機、模擬攝像機、傳真機等等;企業報表由報表生成程序來生成,一般直接輸出到打印機;電子文檔由文檔編輯器生成;電子郵件由相應的郵件服務器來發送等等,對于如此多種多樣的內容來源,內容管理系統必須有與之相適應的內容采集功能來獲取內容。
多樣的內容處理
獲取內容后,需要對此內容作相應地處理和整理,最終轉換成系統內部所定義的表現形式存放在內容管理庫中。內容處理的功能包括:裁剪和優化、關鍵字提取、全文提取、編目和摘要等。各種內容的處理方式也各不相同:圖像內容需要圖像優化、智能識別等;報表文件需要作打印流轉換、關鍵字提取、報表再分析等;電子文檔需要關鍵字分析、自動編目、自動摘要等;聲像流內容則需要聲音或影像智能識別、流文件壓縮、流文件摘要等。
快捷的內容檢索
內容檢索首先是提高其檢索效率。同時所提供的檢索形式能夠更貼合人類的日常活動習慣,在內容管理系統中通常包含的檢索技術有;參量檢索、關鍵字檢索、音/視頻特征檢索、全文檢索、語義檢索等多種檢索技術。檢索需要有相應的查詢語言支持,查詢語言能夠基于各種標準,以便不同系統間的互聯互通。
統一的發布平臺
內容最終將通過一定的權限限制向企業內部或外部發布。內部可能是不同業務部門的業務應用軟件,外部可能是企業的客戶服務網站。這些內容發布要求需要通過一個統一的發布平臺進行管理控制,發布平臺首先需要經過權限認證,認證通過后再把這些發布請求轉化為內部查詢語句從各個內容庫中搜索相關內容,查詢到內容后再按照一定的格式反饋。
靈活的二次開發能力
內容管理不是一個獨立的系統,需要和其他周邊的系統進行集成。每個項目在實施過程中,都有不同程度的客戶化工作。完整的內容管理必須有靈活的二次開發接口,所提供的接口形式應該包括C++、Java,一般應該同時能夠適應J2EE和.NET兩種架構。
總之,ECM有著巨大的應用需求、成熟的技術支持和完善的系統功能,作為信息管理的核心內容之一,將成為數據管理技術的一個重要發展方向。
相關鏈接:內容管理市場誘人
下面是一些市場專業統計數據:
1)Aberdeen集團對IT購買意向進行的調查顯示,內容管理軟件、安全軟件、硬件是IT買主在2002年最希望購買的三大類產品。在其早在2001年年底進行的一項調查顯示,按應用的類型分,45%的用戶表示計劃購買內容管理應用,計劃購買Web分析、客戶支持/服務應用的用戶分別為43.7%和42.6%。
2)有關資料顯示,全球現有2000家規模最大的公司2002年有80%把內容管理列入發展計劃,而2004年,內容管理市場規模將超過80億美元。
3)根據META Group的研究報告指出,至2004年,全球約有95%的前200家大企業將發展內容管理基礎建設,市場需求超過100億美元。
4)Ovum咨詢公司把內容管理分為工具和服務兩個領域,并認為,到2004年內容管理工具和服務的市場規模將發展到53億美元和80億美元。
5)根據新近IDC調查報告顯示,內容管理服務市場以復合年增長率44%發展,到2006年將達到大約244億美元。IDC定義的內容管理服務市場為規范化的服務--包括為客戶提供計劃和設計、實施、運營、培訓和支持,幫助達到有效的企業內容管理。
雖然各專業統計的具體數字有所差異,但內容管理的市場前景勿容置疑。根據Forrester Research的統計數據,非結構化“內容”量在以每年200%的速度增長。而分析師估計,一般員工大約花費35%的時間尋找工作所需的非結構化信息。一方面是低下的內容處理效率,另一方面是不斷膨脹的內容量。簡單的事實對比已經隱含了一個迫切需求:我們需要有一個工具,能同結構化信息一樣,有效地管理我們的非結構化信息。這就是內容管理技術的職責。
轉載請注明出處:拓步ERP資訊網http://m.hanmeixuan.com/
本文標題:ECM:在業務系統中提煉信息