商務(wù)智能(business intelligence,BI)是1989年由Gartner Group的Howard Dresner提出,但目前對(duì)商務(wù)智能還沒有統(tǒng)一的定義。一般地,商務(wù)智能被認(rèn)為是將存儲(chǔ)于各種商業(yè)信息系統(tǒng)中的數(shù)據(jù)通過智能手段轉(zhuǎn)換成有用信息以幫助企業(yè)提高決策能力解決商業(yè)問題的概念、方法和技術(shù)的集合。商務(wù)智能引起了國內(nèi)外企業(yè)界和軟件開發(fā)界的廣泛關(guān)注,并成為當(dāng)前一個(gè)熱點(diǎn)研究問題。作為商務(wù)智能的重要組成部分之一的數(shù)據(jù)挖掘(dataining,DM)的研究提高到了一個(gè)新的高度,在分布式商務(wù)智能環(huán)境下,采取合適的數(shù)據(jù)挖掘系統(tǒng)模型和數(shù)據(jù)挖掘算法尤為重要。
Agent技術(shù)是人工智能的新興研究課題,是有效解決復(fù)雜分布式問題的計(jì)算模式之一。基于Agent技術(shù)的應(yīng)用系統(tǒng)不僅具有一般分布式系統(tǒng)所具有易于擴(kuò)張、靈活性強(qiáng)等特點(diǎn),而且系統(tǒng)具有很強(qiáng)的智能性和組織能力。本文在分析商務(wù)智能分布式環(huán)境基礎(chǔ)上,介紹了面向商務(wù)智能的分布式數(shù)據(jù)挖掘系統(tǒng)應(yīng)具有的基本特點(diǎn),提出了一種面向商務(wù)智能應(yīng)用基于Agent技術(shù)的分布式數(shù)據(jù)挖掘系統(tǒng),并討論了系統(tǒng)各組成部分功能特點(diǎn)。
1 商務(wù)智能的分布式環(huán)境
商務(wù)智能的發(fā)展,先后經(jīng)歷了事務(wù)處理系統(tǒng)、高級(jí)管理員信息系統(tǒng)、管理信息系統(tǒng)、決策支持系統(tǒng)和專家系統(tǒng)等階段,最終演變成今天的商務(wù)智能。商務(wù)智能系統(tǒng),與這些信息系統(tǒng)相比,主要區(qū)別之一是用戶不再僅僅局限于企業(yè)的領(lǐng)導(dǎo)和決策分析人員,而是擴(kuò)展到企業(yè)組織內(nèi)外各類人員,即商務(wù)智能系統(tǒng)是面向多層次各類用戶的應(yīng)用需要。這些用戶往往分布在不同部門或地區(qū),從而使商務(wù)智能系統(tǒng)面向分布式應(yīng)用環(huán)境。
同時(shí),商務(wù)智能面向分布式數(shù)據(jù)環(huán)境。商務(wù)智能有效地集成企業(yè)內(nèi)外部各種商業(yè)數(shù)據(jù),并轉(zhuǎn)換成易于理解的商業(yè)知識(shí),幫助企業(yè)內(nèi)外部用戶進(jìn)行科學(xué)決策,更好地實(shí)現(xiàn)商業(yè)目的。企業(yè)內(nèi)部數(shù)據(jù)是指通過企業(yè)各種業(yè)務(wù)信息系統(tǒng)收集到的數(shù)據(jù)。這些數(shù)據(jù)可能分布在不同的硬件、數(shù)據(jù)庫、網(wǎng)絡(luò)環(huán)境中,為不同的業(yè)務(wù)部門服務(wù)。外部數(shù)據(jù)主要是市場(chǎng)信息和外部競(jìng)爭(zhēng)對(duì)手信息,這些數(shù)據(jù)可以通過網(wǎng)絡(luò)或市場(chǎng)調(diào)研等手段獲得。因此,商務(wù)智能將肯定面向分布式的應(yīng)用環(huán)境和數(shù)據(jù)環(huán)境。
2 面向商務(wù)智能應(yīng)用的數(shù)據(jù)挖掘系統(tǒng)特點(diǎn)
為了充分利用企業(yè)內(nèi)外流動(dòng)的大量商業(yè)數(shù)據(jù),企業(yè)商業(yè)智能系統(tǒng)必須采用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)商務(wù)知識(shí)的發(fā)現(xiàn)。數(shù)據(jù)挖掘是從大量數(shù)據(jù)中挖掘出隱含的、未知的、用戶可能感興趣的和對(duì)決策有價(jià)值的知識(shí)和規(guī)則。傳統(tǒng)的商務(wù)智能數(shù)據(jù)挖掘是采用一種集中式思想,即要求將這些分布存儲(chǔ)的數(shù)據(jù)收集到一個(gè)集中的地方,然后才進(jìn)行知識(shí)發(fā)現(xiàn)、管理和決策,這樣的商務(wù)智能要求企業(yè)有高速的數(shù)據(jù)通信網(wǎng)絡(luò)。商務(wù)智能往往需要用戶交互以獲取參數(shù)信息,這無疑增加了集中式商務(wù)智能系統(tǒng)的負(fù)荷。同時(shí),這種方式也破壞了數(shù)據(jù)的私有性和安全性。因此,數(shù)據(jù)的分布式存儲(chǔ)、數(shù)據(jù)的私有性和安全性、用戶頻繁的信息交互和商務(wù)智能的及時(shí)性要求等迫切需要深入研究分布式環(huán)境下的分布式數(shù)據(jù)挖掘技術(shù)。
分布式數(shù)據(jù)挖掘(distributed data mining,DDM)主要涉及到分布式數(shù)據(jù)挖掘系統(tǒng)模型和分布式數(shù)據(jù)挖掘算法。一個(gè)分布式數(shù)據(jù)挖掘系統(tǒng)是一個(gè)復(fù)雜的實(shí)體,整個(gè)系統(tǒng)必須提供有效的訪問分布式數(shù)據(jù)和計(jì)算資源、監(jiān)控整個(gè)挖掘過程和以一定格式將挖掘結(jié)果呈現(xiàn)給用戶的功能。而且,一個(gè)成功的DDM系統(tǒng)應(yīng)該具有靈活的結(jié)構(gòu),提供一個(gè)簡(jiǎn)單的更新其組件的方式以適應(yīng)變化的環(huán)境。由此可見,面向商務(wù)智能的分布式數(shù)據(jù)挖掘系統(tǒng)模型應(yīng)該具有以下特點(diǎn):①采用模塊化設(shè)計(jì),保證系統(tǒng)中不同模塊可以根據(jù)需要進(jìn)行靈活地增減和配置以及分布式數(shù)據(jù)挖掘系統(tǒng)的持續(xù)可用;②實(shí)現(xiàn)分布式移動(dòng)數(shù)據(jù)挖掘,滿足商務(wù)智能系統(tǒng)中多層次用戶的多種數(shù)據(jù)挖掘需要,保證商業(yè)數(shù)據(jù)安全;③采用商務(wù)本體知識(shí)模型和通用數(shù)據(jù)描述格式實(shí)現(xiàn)各個(gè)站點(diǎn)上的分布式數(shù)據(jù)挖掘以及數(shù)據(jù)挖掘系統(tǒng)與其他系統(tǒng)的信息交互;④集成多種安全保障技術(shù),滿足業(yè)務(wù)系統(tǒng)安全以及分布式數(shù)據(jù)挖掘系統(tǒng)自身安全需要。
3 基于Agent技術(shù)的分布式數(shù)據(jù)挖掘系統(tǒng)
為了滿足分布式數(shù)據(jù)挖掘的需要,三層客戶/服務(wù)器結(jié)構(gòu)被應(yīng)用到系統(tǒng)設(shè)計(jì)中,如Kensington系統(tǒng)和Intelliminer系統(tǒng)。然而,這些系統(tǒng)采用的體系結(jié)構(gòu)本質(zhì)上仍沒有改變集中式數(shù)據(jù)挖掘系統(tǒng)的模式,系統(tǒng)缺乏開放性、自主性和智能性。為了提高系統(tǒng)的智能性和開放性,融合不同的數(shù)據(jù)挖掘技術(shù),許多學(xué)者將數(shù)據(jù)挖掘過程進(jìn)行功能抽象,并分別由不同的Agent來完成。對(duì)于大量分散數(shù)據(jù)的數(shù)據(jù)挖掘,更多系統(tǒng)采用基于Agent的分布式結(jié)構(gòu)模型,其中典型的應(yīng)用系統(tǒng)如JAM系統(tǒng)和BODHI系統(tǒng)。本文充分利用移動(dòng)Agent的移動(dòng)性并以Agent為主要組件構(gòu)造滿足商務(wù)智能需要的分布式數(shù)據(jù)挖掘系統(tǒng)。同時(shí),系統(tǒng)中Agent按照FIPA標(biāo)準(zhǔn)設(shè)計(jì),這樣只要增加消息轉(zhuǎn)換和服務(wù)描述注冊(cè)轉(zhuǎn)換器等部件就可以實(shí)現(xiàn)Agent與web services的集成,從而使得系統(tǒng)支持web功能。因此,整個(gè)系統(tǒng)具有更大的靈活性、智能性和開放性。
3.1 分布式數(shù)據(jù)挖掘系統(tǒng)整體結(jié)構(gòu)
如圖1所示,整個(gè)商務(wù)智能系統(tǒng)可以整合為4個(gè)部分:用戶群、用戶接口、數(shù)據(jù)挖掘系統(tǒng)和企業(yè)數(shù)據(jù)庫系統(tǒng)。用戶通過用戶接口提交數(shù)據(jù)挖掘請(qǐng)求,數(shù)據(jù)挖掘系統(tǒng)規(guī)劃數(shù)據(jù)挖掘任務(wù)并創(chuàng)建裝配數(shù)據(jù)挖掘Agent。依據(jù)要求,數(shù)據(jù)挖掘Agent遷移到企業(yè)業(yè)務(wù)數(shù)據(jù)庫系統(tǒng)中進(jìn)行數(shù)據(jù)挖掘,并提交結(jié)果給協(xié)調(diào)Agent進(jìn)行綜合且按照用戶要求返回結(jié)果。
1)用戶接口 是用戶與數(shù)據(jù)挖掘系統(tǒng)互操作的渠道,完成用戶參數(shù)的輸入和數(shù)據(jù)挖掘結(jié)果的顯示。例如,用戶可以選擇挖掘模型(挖掘算法)、數(shù)據(jù)源、挖掘的預(yù)設(shè)流程等;用戶可以完成系統(tǒng)中Agent的知識(shí)和規(guī)則的更新,彌補(bǔ)系統(tǒng)知識(shí)的不足;用戶還可以選擇最終的挖掘結(jié)果的可視化形式等。
2)數(shù)據(jù)挖掘系統(tǒng) 是基于Agent的分布式數(shù)挖掘系統(tǒng)的工作流程大致為:①用戶Agent將用戶通過用戶接口提交的數(shù)據(jù)挖掘任務(wù)轉(zhuǎn)變成協(xié)調(diào)Agent可接受的挖掘任務(wù);②協(xié)調(diào)Agent綜合環(huán)境信息規(guī)劃數(shù)據(jù)挖掘任務(wù),創(chuàng)建多個(gè)裝載合適挖掘模型的移動(dòng)數(shù)據(jù)挖掘Agent,并將這些移動(dòng)Agent打包和序列化為數(shù)據(jù)流進(jìn)行數(shù)據(jù)的網(wǎng)絡(luò)移動(dòng)。
圖1 基于Agent技術(shù)的分布式數(shù)據(jù)挖掘系統(tǒng)結(jié)構(gòu)
3)企業(yè)數(shù)據(jù)庫系統(tǒng)主要由移動(dòng)Agent服務(wù)器、業(yè)務(wù)子系統(tǒng)和數(shù)據(jù)庫等3部分組成。這里,移動(dòng)Agent服務(wù)器作為windows服務(wù)而在系統(tǒng)啟動(dòng)時(shí)自動(dòng)啟動(dòng)。
3.2 數(shù)據(jù)挖掘系統(tǒng)
如圖1所示,數(shù)據(jù)挖掘系統(tǒng)由協(xié)調(diào)Agent、數(shù)據(jù)挖掘Agent、數(shù)據(jù)挖掘Agent管理器、用戶Agent、挖掘算法Agent和數(shù)據(jù)站點(diǎn)管理Agent組成。其中,數(shù)據(jù)挖掘Agent是移動(dòng)Agent,其他功能Agent
為靜態(tài)Agent。這些Agem協(xié)調(diào)一致地工作,共同完成數(shù)據(jù)挖掘任務(wù)。
1)用戶Agent代表用戶向數(shù)據(jù)挖掘系統(tǒng)提出數(shù)據(jù)挖掘請(qǐng)求。只需要用戶提出相應(yīng)的要求或者做一系列的選擇,用戶Agent就可以將用戶要求轉(zhuǎn)化為協(xié)調(diào)Agent能夠識(shí)別的命令并提交給協(xié)調(diào)Agent進(jìn)行任務(wù)的計(jì)劃分配;用戶Agent還負(fù)責(zé)處理通過用戶接口輸入的系統(tǒng)更新信息等,如數(shù)據(jù)挖掘特定算法參數(shù)、Agent知識(shí)和規(guī)則等。該Agent除了處理用戶輸入的信息外,還需要能夠保存數(shù)據(jù)挖掘結(jié)果等輸出信息以待用戶查詢或直接提交這些信息給用戶擁有的用戶接口。
2)協(xié)調(diào)Agent主要完成下列3項(xiàng)任務(wù):①任務(wù)規(guī)劃優(yōu)化,主要完成數(shù)據(jù)挖掘任務(wù)的規(guī)劃,并選擇最優(yōu)的規(guī)劃方案。與數(shù)據(jù)挖掘算法Agent、數(shù)據(jù)挖掘Agent管理器和數(shù)據(jù)站點(diǎn)管理Agent交互,得到數(shù)據(jù)挖掘算法效率功能特點(diǎn)、系統(tǒng)中挖掘Agent的功能狀態(tài)等信息來確定相應(yīng)的數(shù)據(jù)挖掘方案以盡可能滿足用戶需要。該Agent還具有實(shí)時(shí)規(guī)劃能力以滿足因某個(gè)移動(dòng)Agent失效而進(jìn)行任務(wù)的重新規(guī)劃。②依據(jù)規(guī)劃結(jié)果,協(xié)調(diào)Agent創(chuàng)建并命名多個(gè)并行協(xié)同工作的裝載有挖掘模型的移動(dòng)數(shù)據(jù)挖掘Agent,并將這些移動(dòng)Agent的基本信息注冊(cè)到挖掘Agent管理器中。③數(shù)據(jù)挖掘整個(gè)過程的協(xié)作協(xié)調(diào),主要協(xié)調(diào)數(shù)據(jù)挖掘過程的各個(gè)Agent以及維護(hù)系統(tǒng)當(dāng)前的運(yùn)行狀態(tài)信息等。同時(shí),協(xié)調(diào)Agent也是系統(tǒng)中Agent信息交換中心,負(fù)責(zé)維護(hù)Agent之間信息的交互傳遞等。
3)數(shù)據(jù)挖掘Agent是移動(dòng)Agent,由協(xié)調(diào)Agent創(chuàng)建,并移動(dòng)到相應(yīng)的數(shù)據(jù)庫系統(tǒng)主機(jī)上進(jìn)行數(shù)據(jù)挖掘,并將自身的,其他功能Agent
為靜態(tài)Agent。這些Agem協(xié)調(diào)一致地工作,共同完成數(shù)據(jù)挖掘任務(wù)。
1)用戶Agent代表用戶向數(shù)據(jù)挖掘系統(tǒng)提出數(shù)據(jù)挖掘請(qǐng)求。只需要用戶提出相應(yīng)的要求或者做一系列的選擇,用戶Agent就可以將用戶要求轉(zhuǎn)化為協(xié)調(diào) Agent能夠識(shí)別的命令并提交給協(xié)調(diào)Agent進(jìn)行任務(wù)的計(jì)劃分配;用戶Agent還負(fù)責(zé)處理通過用戶接口輸入的系統(tǒng)更新信息等,如數(shù)據(jù)挖掘特定算法參 數(shù)、Agent知識(shí)和規(guī)則等。該Agent除了處理用戶輸入的信息外,還需要能夠保存數(shù)據(jù)挖掘結(jié)果等輸出信息以待用戶查詢或直接提交這些信息給用戶擁有的 用戶接口。
2)協(xié)調(diào)Agent主要完成下列3項(xiàng)任務(wù):①任務(wù)規(guī)劃優(yōu)化,主要完成數(shù)據(jù)挖掘任務(wù)的規(guī)劃,并選擇最優(yōu)的規(guī)劃方案。與數(shù)據(jù)挖掘算法Agent、數(shù)據(jù)挖掘 Agent管理器和數(shù)據(jù)站點(diǎn)管理Agent交互,得到數(shù)據(jù)挖掘算法效率功能特點(diǎn)、系統(tǒng)中挖掘Agent的功能狀態(tài)等信息來確定相應(yīng)的數(shù)據(jù)挖掘方案以盡可能 滿足用戶需要。該Agent還具有實(shí)時(shí)規(guī)劃能力以滿足因某個(gè)移動(dòng)Agent失效而進(jìn)行任務(wù)的重新規(guī)劃。②依據(jù)規(guī)劃結(jié)果,協(xié)調(diào)Agent創(chuàng)建并命名多個(gè)并行 協(xié)同工作的裝載有挖掘模型的移動(dòng)數(shù)據(jù)挖掘Agent,并將這些移動(dòng)Agent的基本信息注冊(cè)到挖掘Agent管理器中。③數(shù)據(jù)挖掘整個(gè)過程的協(xié)作協(xié)調(diào),主 要協(xié)調(diào)數(shù)據(jù)挖掘過程的各個(gè)Agent以及維護(hù)系統(tǒng)當(dāng)前的運(yùn)行狀態(tài)信息等。同時(shí),協(xié)調(diào)Agent也是系統(tǒng)中Agent信息交換中心,負(fù)責(zé)維護(hù)Agent之間 信息的交互傳遞等。
3)數(shù)據(jù)挖掘Agent是移動(dòng)Agent,由協(xié)調(diào)Agent創(chuàng)建,并移動(dòng)到相應(yīng)的數(shù)據(jù)庫系統(tǒng)主機(jī)上進(jìn)行數(shù)據(jù)挖掘,并將自身的位置信息和狀態(tài)信息傳遞給挖掘 Agent管理器,將數(shù)據(jù)挖掘結(jié)果反饋給協(xié)調(diào)器以進(jìn)行數(shù)據(jù)結(jié)果的融合。數(shù)據(jù)挖掘Agent運(yùn)用自身攜帶的算法模型或請(qǐng)求協(xié)調(diào)Agent得到的算法等完成具 體的數(shù)據(jù)挖掘任務(wù)。
4)數(shù)據(jù)挖掘Agent管理器主要負(fù)責(zé)管理所有數(shù)據(jù)挖掘Agent的相關(guān)信息,這樣各種Agent通過與管理Agent交互便可以動(dòng)態(tài)獲取其他Agent 的屬性信息(位置、功能等),從而與其他Agent進(jìn)行交互,以獲取所需要的信息。是實(shí)現(xiàn)系統(tǒng)分布式透明性的關(guān)鍵,主要用于收集、管理、統(tǒng)計(jì)、查詢各種 Agent信息資源,按其功能分類或建立Agent聯(lián)盟。同時(shí),也擔(dān)當(dāng)可信任的安全認(rèn)證中心,保證各Agent之間的安全通信機(jī)制。
5)數(shù)據(jù)挖掘算法Agent主要負(fù)責(zé)維護(hù)數(shù)據(jù)挖掘算法。用戶可以注冊(cè)數(shù)據(jù)挖掘算法。當(dāng)算法注冊(cè)到系統(tǒng)中,算法Agent登記算法的元知識(shí)信息及其特點(diǎn)(比 如,名字、版本、輸入?yún)?shù)、操作環(huán)境描述和輸出格式等)。同時(shí),算法Agent將這些信息反饋給協(xié)調(diào)Agent以便協(xié)調(diào)Agent根據(jù)數(shù)據(jù)挖掘任務(wù)選擇最 佳的算法。
6)數(shù)據(jù)站點(diǎn)管理Agent 主要負(fù)責(zé)企業(yè)數(shù)據(jù)庫系統(tǒng)Agent服務(wù)器的基本信息,如Agent服務(wù)器的啟動(dòng)、停止?fàn)顟B(tài)信息、位置信息以及數(shù)據(jù)源信息等。Agent服務(wù)器及時(shí)將其啟 動(dòng)、停止信息注冊(cè)到數(shù)據(jù)站點(diǎn)管理器以便協(xié)調(diào)器合理規(guī)劃任務(wù)。為了維護(hù)Agent服務(wù)器和防止Agent服務(wù)器出現(xiàn)故障,往往在企業(yè)提供同步工作的 Agent服務(wù)器。
數(shù)據(jù)挖掘系統(tǒng)由6類功能各異協(xié)同工作的Agent組成,當(dāng)接受到用戶提交的具體數(shù)據(jù)挖掘任務(wù)后,系統(tǒng)自動(dòng)有條不紊地工作。在整個(gè)系統(tǒng)中,數(shù)據(jù)挖掘Agent及執(zhí)其執(zhí)行環(huán)境——移動(dòng)Agent服務(wù)器是數(shù)據(jù)挖掘任務(wù)執(zhí)行的關(guān)鍵部件。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://m.hanmeixuan.com/
本文標(biāo)題:面向商務(wù)智能應(yīng)用的分布式數(shù)據(jù)挖掘系統(tǒng)設(shè)計(jì)
本文網(wǎng)址:http://m.hanmeixuan.com/html/consultation/1082067382.html