0 引言
Microsoft SQL Server數(shù)據(jù)庫(kù)是Microsoft公司開(kāi)發(fā)和推廣的關(guān)系數(shù)據(jù)管理系統(tǒng),其最新版本是2008版,在2008版中提供了數(shù)據(jù)倉(cāng)庫(kù)功能,并且完善了數(shù)據(jù)挖掘技術(shù),使得商務(wù)智能能夠走向平民化。
從實(shí)質(zhì)上來(lái)看,商務(wù)智能的核心就是對(duì)數(shù)據(jù)倉(cāng)庫(kù)中的各類數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,從中找出隱藏信息,為企業(yè)的發(fā)展戰(zhàn)略的制定或者營(yíng)銷決策提供數(shù)據(jù)支撐。本文就依據(jù)Microsoft SQL Server數(shù)據(jù)庫(kù),設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)商務(wù)智能系統(tǒng)。
1 基于Server的商務(wù)智能數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)
數(shù)據(jù)倉(cāng)庫(kù)是商務(wù)智能的核心內(nèi)容,其設(shè)計(jì)的核心為商務(wù)智能系統(tǒng)的實(shí)現(xiàn),對(duì)于商務(wù)智能系統(tǒng)的實(shí)現(xiàn)來(lái)說(shuō),核心就是對(duì)于數(shù)據(jù)倉(cāng)庫(kù)的實(shí)現(xiàn),對(duì)于數(shù)據(jù)的處理模型的構(gòu)建,通過(guò)對(duì)于數(shù)據(jù)倉(cāng)庫(kù)的實(shí)現(xiàn)能夠?yàn)槠髽I(yè)構(gòu)建一個(gè)商務(wù)智能系統(tǒng),從而為后續(xù)的商務(wù)數(shù)據(jù)分析提供基礎(chǔ)。
1.1 數(shù)據(jù)倉(cāng)庫(kù)的主題分析
以一般的商品銷售企業(yè)為例,其數(shù)據(jù)倉(cāng)庫(kù)一般需要具備如下幾個(gè)方面的主題:
(1)銷售主題。包括銷售單號(hào)、企業(yè)的分店、銷售信息、客戶以及商品的具體編號(hào)、銷售產(chǎn)品和時(shí)間的編號(hào)和數(shù)量統(tǒng)計(jì)、貨架編號(hào)和促銷的編號(hào),促銷商品和一般商品的數(shù)量統(tǒng)計(jì)等信息;
(2)商品主題。包括商品的類別、編號(hào)、名稱、規(guī)格,上述都是商品的固有屬性,除此之外,還包含了商品的各種庫(kù)存方面信息、相關(guān)的一些采購(gòu)信息和各項(xiàng)銷售方面的信息等;
(3)客戶主題。對(duì)于客戶的一般社會(huì)情況進(jìn)行分類和存儲(chǔ),比如客戶的編號(hào)、姓名、性別和年齡、居住地址、與商品銷售企業(yè)的距離等,除此之外還包括了顧客購(gòu)買商品的信息,如客戶編號(hào)、購(gòu)買商品的類別、數(shù)量以及時(shí)間等等;
(4)供應(yīng)商主題。供應(yīng)商主題主要是固有信息,包括了供應(yīng)商的具體聯(lián)系方式、供應(yīng)量以及其變化信息,庫(kù)存和供應(yīng)之間的平衡關(guān)系,還包含了供貨的具體時(shí)間,商品的具體類型和數(shù)量,物品的單價(jià)和總價(jià)等方面的信息等等。不同類別的企業(yè),在構(gòu)建自身的數(shù)據(jù)倉(cāng)庫(kù)時(shí)也會(huì)有所不同,但是一般都應(yīng)該包含客戶主題、產(chǎn)品,商品/服務(wù)內(nèi)容主題、營(yíng)銷/銷售主題等幾個(gè)主要的方面的內(nèi)容。
1.2 數(shù)據(jù)倉(cāng)庫(kù)的結(jié)構(gòu)設(shè)計(jì)
數(shù)據(jù)倉(cāng)庫(kù)的主題確定后,就可以根據(jù)它的主題來(lái)構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)的邏輯結(jié)構(gòu),那么它的銷售主題、商品主題、供應(yīng)商主題以及客戶主題就能夠設(shè)計(jì)成如圖1所示的邏輯結(jié)構(gòu),數(shù)據(jù)倉(cāng)庫(kù)的具體體系結(jié)構(gòu)則如圖2所示。
圖1 數(shù)據(jù)倉(cāng)庫(kù)的星座模型示意圖
圖2 數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu)示意圖
企業(yè)的業(yè)務(wù)數(shù)據(jù)經(jīng)過(guò)匯總之后進(jìn)行抽取、轉(zhuǎn)換、清洗、過(guò)濾以及轉(zhuǎn)載,然后形成數(shù)據(jù)倉(cāng)庫(kù)管理系統(tǒng),數(shù)據(jù)倉(cāng)庫(kù)之中的數(shù)據(jù)通過(guò)OLAP服務(wù)實(shí)現(xiàn)數(shù)據(jù)的分析以及數(shù)據(jù)統(tǒng)計(jì),供企業(yè)的戰(zhàn)略制定者以及決策層參考。
2 數(shù)據(jù)倉(cāng)庫(kù)內(nèi)容采集與處理
2.1 數(shù)據(jù)庫(kù)內(nèi)容的采集和修改
從目前來(lái)看,絕大部分企業(yè)在經(jīng)營(yíng)過(guò)程中,并沒(méi)有考慮到商務(wù)智能系統(tǒng)的運(yùn)用問(wèn)題,因而其實(shí)際經(jīng)營(yíng)過(guò)程中產(chǎn)生并且收集到的數(shù)據(jù)與上述數(shù)據(jù)倉(cāng)庫(kù)涉及的主題的具體要求具有相當(dāng)大的差距,這往往是由于企業(yè)的POS系統(tǒng)或者財(cái)務(wù)部門對(duì)于相應(yīng)數(shù)據(jù)的定義不全面造成。一般企業(yè)為了提高效率,往往不會(huì)增加額外的數(shù)據(jù)采集,這就造成了商務(wù)智能數(shù)據(jù)倉(cāng)庫(kù)內(nèi)實(shí)際上有很多主題的數(shù)據(jù)不存在,商務(wù)智能也難以起到實(shí)際作用。
由于企業(yè)在實(shí)際的經(jīng)營(yíng)過(guò)程中,往往只注重銷售業(yè)績(jī),而對(duì)客戶資料的重視程度不夠,在數(shù)據(jù)采集過(guò)程中,廣泛存在采集的信息量少,采集的數(shù)據(jù)項(xiàng)目不足等問(wèn)題。而這些信息的缺失,就導(dǎo)致數(shù)據(jù)倉(cāng)庫(kù)的建設(shè)形同虛設(shè)。除此之外,商務(wù)智能系統(tǒng)的一個(gè)非常重要的功能就是輔助進(jìn)行客戶關(guān)系管理,客戶信息的缺失也導(dǎo)致這一功能無(wú)法實(shí)現(xiàn)。因此,考慮通過(guò)OLTP系統(tǒng)在數(shù)據(jù)的存儲(chǔ)過(guò)程中實(shí)現(xiàn)對(duì)數(shù)據(jù)表的記錄追加,通過(guò)直接修改客戶信息表的結(jié)構(gòu)實(shí)現(xiàn)客戶信息項(xiàng)目的增加,從而盡量提高客戶信息數(shù)據(jù)采集的完整性。為了便于數(shù)據(jù)倉(cāng)庫(kù)的查詢,客戶數(shù)據(jù)的項(xiàng)目是按照如下順序排列的:會(huì)員卡號(hào)、姓名、折扣、金額、性別、出生日期、證件號(hào)碼、電話、地址、備注等,其Value分別為@ 1、@ 2、@ 3、@ 4、@ 5、@ 6、@ 7、@ 8、@ 9、@ 10。
上述對(duì)客戶信息表格的調(diào)整由于是完整的以參數(shù)的形式給出了數(shù)據(jù)項(xiàng),對(duì)SQL語(yǔ)句查詢、更新以及修改功能不會(huì)有任何的影響,為了增加對(duì)客戶分析的全面性,還可以在數(shù)據(jù)表之中添加有關(guān)客戶的受教育程度、收入情況、家庭人口數(shù)量等信息,當(dāng)然具體需要何種信息需要根據(jù)企業(yè)的實(shí)際情況決定。其他信息的補(bǔ)充和完善方法也類似客戶信息的補(bǔ)充方法。
2.2 數(shù)據(jù)的抽取、轉(zhuǎn)換、清洗、過(guò)濾和轉(zhuǎn)載
根據(jù)文中的設(shè)計(jì),可以選用適當(dāng)ETL工具從數(shù)據(jù)庫(kù)中獲取所需的各種數(shù)據(jù),并將其集成到數(shù)據(jù)倉(cāng)庫(kù)之中。有些數(shù)據(jù)可以直接從源數(shù)據(jù)系統(tǒng)之中直接導(dǎo)入,比如企業(yè)的促銷信息的相關(guān)數(shù)據(jù)就可以直接從促銷表Promotion之中通過(guò)選取相關(guān)的字段,如Promotion_id,Promotion_name等字段,而排除其他的無(wú)關(guān)字段。這樣就能夠大大的節(jié)省數(shù)據(jù)的收集時(shí)間。在導(dǎo)入數(shù)據(jù)之前,還需要對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換、清洗、過(guò)濾以及轉(zhuǎn)載,使得數(shù)據(jù)能夠最終符合數(shù)據(jù)倉(cāng)庫(kù)管理系統(tǒng)的需求。
2.3 OALP以及數(shù)據(jù)挖掘模型的構(gòu)建
數(shù)據(jù)倉(cāng)庫(kù)構(gòu)建完成后,還只是提供了數(shù)據(jù)分析的基礎(chǔ),在此基礎(chǔ)上,可以借用OALP系統(tǒng)對(duì)其進(jìn)行交互式分析,這樣就可以發(fā)揮數(shù)據(jù)挖掘分析員自身的主觀意識(shí),從現(xiàn)有數(shù)據(jù)中發(fā)現(xiàn)更多有效的隱|生信息,為企業(yè)的發(fā)展決策的制定提供更為有效的數(shù)據(jù)支撐。
此次設(shè)計(jì)的系統(tǒng)基于Microsoft SQL Server 2008以及Microsoft Visual Studio開(kāi)發(fā)的,通過(guò)使用SQL中的商務(wù)智能開(kāi)發(fā)功能(Business Intelligence Development),來(lái)構(gòu)建多維數(shù)據(jù)集以及數(shù)據(jù)挖掘模型,而數(shù)據(jù)的展示則是通過(guò)SQL展示功能(SQL Server Reporting Services,SSRS)實(shí)現(xiàn)的。展示功能其實(shí)是對(duì)于服務(wù)器端的一種解決方案,它的具體功能是生成多種關(guān)系數(shù)據(jù)源和多位數(shù)據(jù)源,并且憑借這些數(shù)據(jù)源來(lái)提取企業(yè)的報(bào)表內(nèi)容,這樣就能夠發(fā)布各種格式的報(bào)表,隨時(shí)進(jìn)行查看,從而可能對(duì)其安全性進(jìn)行集中管理,此外,它還能夠從多維數(shù)據(jù)集中動(dòng)態(tài)的獲得相關(guān)的數(shù)據(jù)信息,還能夠支持多種操作方式和圖形化的展示方式。
在對(duì)數(shù)據(jù)庫(kù)進(jìn)行設(shè)計(jì)的時(shí)候,首要考慮的問(wèn)題,就是目標(biāo)。一個(gè)好的數(shù)據(jù)庫(kù)首先就是沒(méi)有冗余數(shù)據(jù),從而能確保數(shù)據(jù)的定位準(zhǔn)確、高效,在維護(hù)保養(yǎng)方面也相對(duì)簡(jiǎn)單。從理論上來(lái)說(shuō),數(shù)據(jù)庫(kù)的設(shè)計(jì)是要把所有的目標(biāo)實(shí)現(xiàn)。但從實(shí)際上來(lái)看,基本上是不可能的,各個(gè)目標(biāo)可能天然就存在一定的排斥,如冗余數(shù)據(jù)的消除要求降低定位記錄的速度,準(zhǔn)確性和高效。在設(shè)計(jì)數(shù)據(jù)庫(kù)的時(shí)候,最為重要的一點(diǎn)就是對(duì)數(shù)據(jù)庫(kù)的組織,為了有效的降低數(shù)拋不一致性發(fā)生的可能性,就必須要隨數(shù)據(jù)庫(kù)進(jìn)行規(guī)范化以減少數(shù)據(jù)庫(kù)中的冗余數(shù)據(jù),具體需要從如下兀。個(gè)方面來(lái)考慮外理:
(1)要使其能適應(yīng)表結(jié)構(gòu)在未來(lái)可能發(fā)生的一些變化;
(2)要清理包含在表中的冗余信息;
(3)在處理數(shù)據(jù)的前端應(yīng)用程序的數(shù)據(jù)庫(kù)結(jié)構(gòu)時(shí),若發(fā)生變化,要使可能發(fā)生的沖突降低到最小。
實(shí)際應(yīng)用中,對(duì)于網(wǎng)絡(luò)化的HRM系統(tǒng)來(lái)說(shuō),能夠應(yīng)用的設(shè)計(jì)原則非常多,例如:命名的規(guī)范性方面;引用控制字段方面;庫(kù)表控制重復(fù)性方面;控制并發(fā)性方面。
3 結(jié)語(yǔ)
文中提出的模型就是基于Server數(shù)據(jù)庫(kù)開(kāi)發(fā)的一種供企業(yè)內(nèi)部經(jīng)營(yíng)管理人員以及決策人員使用的,它能夠幫助使用者對(duì)企業(yè)各方面的數(shù)據(jù)進(jìn)行掌控,從而了解企業(yè)的實(shí)際處境,并且從龐大的數(shù)據(jù)之中發(fā)現(xiàn)企業(yè)發(fā)展的規(guī)律所在,能夠?yàn)槠髽I(yè)制定發(fā)展戰(zhàn)略和做出經(jīng)營(yíng)決策提供有效的數(shù)據(jù)支持。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.oesoe.com/
本文標(biāo)題:基于Server數(shù)據(jù)庫(kù)的商務(wù)智能實(shí)現(xiàn)研究
本文網(wǎng)址:http://www.oesoe.com/html/consultation/1083937059.html