引言
數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)是作為兩種獨(dú)立的信息技術(shù)出現(xiàn)的。數(shù)據(jù)倉庫是從數(shù)據(jù)庫技術(shù)發(fā)展而來的,為決策服務(wù)的數(shù)據(jù)組織、存儲(chǔ)技術(shù);數(shù)據(jù)挖掘是通過對(duì)數(shù)據(jù)庫、數(shù)據(jù)倉庫中的數(shù)據(jù)進(jìn)行分析,獲得有用知識(shí)和信息的一系列方法和技術(shù)。它們都可以完成對(duì)決策過程的支持,如將它們兩者結(jié)合起來集成到一個(gè)系統(tǒng)中,可以更加有效地提高系統(tǒng)的決策支持能力。
在國外,數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)己迅速發(fā)展起來,逐漸成為決策支持的新手段。
2決策支持系統(tǒng)
決策支持系統(tǒng)是一種幫助中高層管理人員進(jìn)行決策的計(jì)算機(jī)系統(tǒng),這種系統(tǒng)綜合運(yùn)用了信息論、人工智能、信息經(jīng)濟(jì)學(xué)、管理科學(xué)、行為科學(xué)等學(xué)科的理論、方法和技術(shù)。企業(yè)可根據(jù)自已的實(shí)際情況實(shí)施不同的DSS應(yīng)用,其主要應(yīng)用包括以下幾個(gè)方面:銷售支持、客戶分析、市場研究、財(cái)務(wù)分析、運(yùn)籌和戰(zhàn)略計(jì)劃等。
傳統(tǒng)的決策支持系統(tǒng)以模型庫為主體,通過定量分析進(jìn)行輔助決策。現(xiàn)在數(shù)據(jù)倉庫可以把網(wǎng)絡(luò)不同站點(diǎn)的商業(yè)數(shù)據(jù)集成到一起為決策提供各種類型的有效的數(shù)據(jù)分析。
3數(shù)據(jù)倉庫
3.1 數(shù)據(jù)倉庫的定義及特點(diǎn)
WH.lnmon對(duì)數(shù)據(jù)倉庫定義為:數(shù)據(jù)倉庫是一個(gè)面向主題的、集成的、穩(wěn)定的、不同時(shí)間的數(shù)據(jù)集合,用以支持經(jīng)營管理中的決策制訂過程。數(shù)據(jù)倉庫具有的4個(gè)基本特征為:數(shù)據(jù)倉庫是面向主題的,主題意指一個(gè)分析領(lǐng)域,是在一個(gè)較高層次上對(duì)數(shù)據(jù)進(jìn)行組織、歸類的標(biāo)準(zhǔn)。例如為商場營銷建立的數(shù)據(jù)倉庫,所選主題可能有商品、供應(yīng)商、顧客等;數(shù)據(jù)倉庫中的數(shù)據(jù)是集成的,數(shù)據(jù)倉庫的數(shù)據(jù)的來源可分為外部和內(nèi)部數(shù)據(jù),它需經(jīng)過清洗,變換成統(tǒng)一的數(shù)據(jù)結(jié)構(gòu)進(jìn)入數(shù)據(jù)倉庫;數(shù)據(jù)倉庫是穩(wěn)定的,數(shù)據(jù)倉庫保存的是大量經(jīng)集成、加工的綜合型數(shù)據(jù),而不是聯(lián)機(jī)數(shù)據(jù):數(shù)據(jù)倉庫是隨時(shí)間變化的,為了適應(yīng)DSS進(jìn)行趨勢分析,數(shù)據(jù)倉庫內(nèi)的數(shù)據(jù)隨著數(shù)據(jù)倉庫的刷新和數(shù)據(jù)的增加,它的內(nèi)容也是變化的。數(shù)據(jù)倉庫中的數(shù)據(jù)與事務(wù)處理系統(tǒng)的數(shù)據(jù)比較如表1所示。
體系化環(huán)境的層次反映了數(shù)據(jù)與應(yīng)用邏輯的抽象程度,可很好地與企業(yè)實(shí)際部門組織結(jié)構(gòu)對(duì)應(yīng)起來,提高企業(yè)應(yīng)用數(shù)據(jù)的效率。體系化環(huán)境的層次如圖1所示。
圖1.體系化層次環(huán)境
數(shù)據(jù)倉庫系統(tǒng)由數(shù)據(jù)倉庫、數(shù)據(jù)倉庫管理系統(tǒng)和數(shù)據(jù)倉庫工具3個(gè)部分組成。數(shù)據(jù)倉庫系統(tǒng)的體系結(jié)構(gòu)如圖2所示。
圖2.數(shù)據(jù)倉庫體系結(jié)構(gòu)
數(shù)據(jù)倉庫包含了早期細(xì)節(jié)級(jí)、當(dāng)前細(xì)節(jié)級(jí)、輕度綜合級(jí)、高度綜合級(jí)的數(shù)據(jù),是整個(gè)數(shù)據(jù)倉庫系統(tǒng)的核心。數(shù)據(jù)倉庫管理系統(tǒng)負(fù)責(zé)整個(gè)系統(tǒng)的運(yùn)行,包括從OLTP的數(shù)據(jù)庫中抽取、清洗、變換數(shù)據(jù)、維數(shù)劃分以及數(shù)據(jù)的安全、備份和恢復(fù)等工作。數(shù)據(jù)倉庫工具通過OLAP分析工具和數(shù)據(jù)挖掘工具實(shí)現(xiàn)數(shù)據(jù)分析,以提供決策支持信息來輔導(dǎo)領(lǐng)導(dǎo)決策儀。
3.2數(shù)據(jù)倉庫的設(shè)計(jì)方法
數(shù)據(jù)倉庫的開發(fā)方法不同于OLTP系統(tǒng)。其開發(fā)過程是一個(gè)數(shù)據(jù)驅(qū)動(dòng)的過程,它的開發(fā)過程要經(jīng)過以下幾個(gè)步驟:
(1)分析決策需求,確定數(shù)據(jù)來源;
(2)定義數(shù)據(jù)的綜合、轉(zhuǎn)化過程,使系統(tǒng)能自動(dòng)將數(shù)據(jù)從不同的數(shù)據(jù)源中提取出來后存放到數(shù)據(jù)倉庫中;
(3)建立數(shù)據(jù)倉庫:
(4)建立能使用戶從數(shù)據(jù)倉庫中獲取所需決策信息的工具,使之能進(jìn)行有效的數(shù)據(jù)訪間和應(yīng)用開發(fā),并同時(shí)為用戶建立適用于決策支持的數(shù)據(jù)倉庫界面和應(yīng)用軟件。
4數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘是一個(gè)決策支持過程,它通過對(duì)數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行分析做出歸納性的推理,從中挖掘出潛在的模式,以幫助決策者做出正確的判斷和決策。它涉及到統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、數(shù)據(jù)庫、模式識(shí)別、人工智能和神經(jīng)網(wǎng)絡(luò)等學(xué)科內(nèi)容。數(shù)據(jù)挖掘的方法有神經(jīng)網(wǎng)絡(luò)、統(tǒng)計(jì)方法、決策樹方法、粗集方法等。
在當(dāng)前,大多數(shù)數(shù)據(jù)倉庫的應(yīng)用都是進(jìn)行統(tǒng)計(jì)、建立多維以及OLAP的分析工作。隨著數(shù)據(jù)挖掘研究的深入,已經(jīng)有了OLAP”和數(shù)據(jù)挖掘相結(jié)合的方法。例如在MicrosoftSQLServer2000的數(shù)據(jù)倉庫解決方案中就實(shí)現(xiàn)了OLAP和數(shù)據(jù)挖掘相結(jié)合。
數(shù)據(jù)挖掘過程一般分為3個(gè)主要階段:數(shù)據(jù)準(zhǔn)備、挖掘操作、結(jié)果表達(dá)和解釋。如將數(shù)據(jù)倉庫和數(shù)據(jù)挖掘協(xié)同工作,則可以簡化數(shù)據(jù)挖掘的步驟,從而大大提高數(shù)據(jù)挖掘的效率。所以,數(shù)據(jù)倉庫和數(shù)據(jù)挖掘相結(jié)合是決策支持的有效解決方案。
5聯(lián)機(jī)分析處理(OLAP)
OLAP是決策支持系統(tǒng)的核心技術(shù)之一。OLAP是將數(shù)據(jù)倉庫中的數(shù)據(jù)轉(zhuǎn)移到多維結(jié)構(gòu)中,并且調(diào)用多維數(shù)據(jù)集來執(zhí)行有效且非常復(fù)雜的查詢。在多維結(jié)構(gòu)中,維即觀察的角度,它用超立方體或多立方體結(jié)構(gòu)來描述。在關(guān)系型的數(shù)據(jù)倉庫中,數(shù)據(jù)的多維視圖主要是通過星型模式和雪花模式等來實(shí)現(xiàn)的:星型模式:中央的對(duì)象是事實(shí)表,周圍的對(duì)象是維表。事實(shí)表的字段通常是一組主鍵,而主鍵的值依賴于周圍的維表。其結(jié)構(gòu)如圖3所示;雪花模式:對(duì)星型模式的維表進(jìn)一步層次化,對(duì)維的屬性進(jìn)行了多層次的劃分。其結(jié)構(gòu)如圖4所示。
圖3.星型模式
圖4.雪花模式
6利用SQLServer2000開發(fā)基于DW和DM的決策支持系統(tǒng)
Microsoft SQLsever2000提供了一套全新的綜合分析服務(wù)工具,它集成了OLAP和數(shù)據(jù)挖掘功能。其中,OLAP的分析服務(wù)提供了最完整、最具集成性的、可支持WEB的分析服務(wù);Analysis Service集成了數(shù)據(jù)挖掘技術(shù),它提供了兩種數(shù)據(jù)挖掘算法:Microsoft決策樹模型、Microsoft聚集挖掘模型。
數(shù)據(jù)挖掘技術(shù)可幫助用戶分析關(guān)系數(shù)據(jù)庫和多維OLAP數(shù)據(jù)集中的數(shù)據(jù),以獲取發(fā)展模式,并對(duì)企業(yè)未來的趨勢進(jìn)行預(yù)測。我們利用Microsoft SQLserver2000的強(qiáng)大功能來開發(fā)企業(yè)的信息系統(tǒng)。
6.1企業(yè)的管理系統(tǒng)平臺(tái)
(l)各種事務(wù)處理系統(tǒng)平臺(tái):服務(wù)器操作系統(tǒng)為WindowsServer2000;數(shù)據(jù)庫管理系統(tǒng)采用Mierosoft SQLServer 2000;前臺(tái)開發(fā)工具為Delphi7.0:運(yùn)行環(huán)境為win98或其它Windows環(huán)境。
(2)為實(shí)現(xiàn)決策支持系統(tǒng),系統(tǒng)還增加的平臺(tái)為:分析服務(wù)器:SQLServer 2000 Analysis Serviee。它可在SQLServer 2000安裝完成后裝入。OLAP開發(fā)工具:visual Basie6.0。
6.2基于Dw+DM的決策支持系統(tǒng)的開發(fā)
基于DW十DM的決策支持系統(tǒng),就是以數(shù)據(jù)倉庫作為底層的數(shù)據(jù)源,再加上各種數(shù)挖掘技術(shù)來構(gòu)成決策支持。我們利用SQLserver 2000可建立如圖5所示的數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)的應(yīng)用模式。在這種應(yīng)用模式中,我們討論的重點(diǎn)放在決策部分。
圖5.客戶機(jī)/服務(wù)器應(yīng)用模式
其開發(fā)過程如下:進(jìn)行數(shù)據(jù)倉庫的主題設(shè)計(jì)、確定邏輯模型和完成事實(shí)表和維表的設(shè)計(jì);在SQLserver 2000中創(chuàng)建數(shù)據(jù)倉庫物理數(shù)據(jù)庫,其中包括事實(shí)表和維表:利用DTS數(shù)據(jù)轉(zhuǎn)換服務(wù)將數(shù)據(jù)源經(jīng)過數(shù)據(jù)驗(yàn)證、數(shù)據(jù)遷移、數(shù)據(jù)清理和數(shù)據(jù)轉(zhuǎn)換4個(gè)過程進(jìn)入第2步所創(chuàng)建的數(shù)據(jù)倉庫;在分析服務(wù)器AnalysisSerVice中新建分析數(shù)據(jù)庫使其連接SQLserver2000中的數(shù)據(jù)倉庫:在分析服務(wù)器Analysis Service創(chuàng)建OLAP多維數(shù)據(jù)集;利用數(shù)據(jù)挖掘技術(shù)分析多維數(shù)據(jù)集中的數(shù)據(jù);開發(fā)客戶端分析程序。
在Microsoft SQLServer 2000 Analysis Serviee中能支持來自在關(guān)系數(shù)據(jù)源和多維數(shù)據(jù)集這兩者的數(shù)據(jù)挖掘,并且其擴(kuò)展性能與第3方工具一起使用。Microsoft決策樹算法是基于分類概念的算法構(gòu)造樹,它以樹的結(jié)構(gòu)顯示分類的形式。其聚集算法是一種期望方法,它使用完善技術(shù)將記錄分組到附近區(qū)域,以展示相似和可預(yù)測的特征。在客戶端應(yīng)用分析程序中,可通過ADOMD數(shù)據(jù)對(duì)象接口和MDX語法以及OLEDBforOLAPServer來讀取多維數(shù)據(jù)集的數(shù)據(jù)。構(gòu)建MDX語句是生成OLAP對(duì)象鏈接和嵌入式數(shù)據(jù)庫(OLEDB)的關(guān)鍵。SQLServer2000中把MDX語句作為T-sQL語句的擴(kuò)充部分。其語法格式如下:
SELECT<axis_speeifieation>[,<axis_sPeeifieation>]
FROM<eube一sPeeifiation>
WHERE<slieer--sPeeifieation>
其中:
axis-specification:取代傳統(tǒng)的數(shù)據(jù)列列表,它是指定所要顯示的維。
cube--specifiatinn:取代傳統(tǒng)的表,它是指定所要查詢的多維數(shù)據(jù)集。
slicer--specification:指定所要查詢維中的成員列出來的過濾條件。
VisualBasic是功能強(qiáng)大的面向?qū)ο蟮目梢暬某绦蜷_發(fā)工具,我們可以將MDX語句嵌入到Vosual Basic中來開發(fā)客戶端分析程序。
7結(jié)束語
數(shù)據(jù)倉庫+數(shù)據(jù)挖掘技術(shù)為DSS研制與開發(fā)提供了一種有效、可行的體系化解決方案。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)在企業(yè)決策支持系統(tǒng)中的應(yīng)用將隨著現(xiàn)代社會(huì)商業(yè)模式的變革而進(jìn)一步普及和深入。
在未來大規(guī)模定制經(jīng)濟(jì)環(huán)境下,數(shù)據(jù)倉庫將成為企業(yè)獲得競爭優(yōu)勢的關(guān)鍵武器。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.oesoe.com/
本文標(biāo)題:數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)在DSS中的應(yīng)用研究
本文網(wǎng)址:http://www.oesoe.com/html/consultation/10819416342.html