CRM(客戶關系管理)是一個包括知識挖掘、市場規(guī)劃、客戶互動、分析與修正而循環(huán)不已的過程,其中,知識挖掘過程包括市場確認、客戶區(qū)分以及客戶預測。與能帶來利潤的客戶建立持久的合作關系是CRM的核心,在建立這種持久的合作關系中,預測起著舉足輕重的作用。預測方法的選擇不僅與預測對象和目標的性質有關,與可能收集到的數(shù)據(jù)狀況有關,也與預測的要求和條件有關。選擇合適的挖掘技術和工具,對于未來系統(tǒng)的性能和可靠性有重大影響,不同的技術方案產(chǎn)生的結果模型有很大不同,模型結果的可理解性也存在很大差異。
1 預測模型的選擇因素
在選擇一個預測模型的時候,要考慮許多因素。這些因素包括數(shù)據(jù)模式、預測目的、預測精度、預測的最遠期限、采用此預測模型所要的費用,以及應用這個預測模型的難易程度等。
1.1 數(shù)據(jù)模式(即數(shù)據(jù)的特征)
在選擇一個預測模型的時候,數(shù)據(jù)模式是一個最主要的因素。對同一種數(shù)據(jù)模式可以應用幾個不同的預測方法,而不同的預測方法都有各自適應的數(shù)據(jù)特征。
1.2 預測目的
預測的目的,也就是預測的結果做什么用。
1.3 預測精度
預測精度要考慮3個問題:在確定的環(huán)境下,使用某一種典型的預測模型能夠達到多高的精確度;在這個環(huán)境下,采用什么樣的方法能夠提高預測精度;如果存在若干種提高預測精度的方法,如何選擇一個適當?shù)姆椒ā?/P>
1.4 預測的最遠期限
預測的最遠期限和數(shù)據(jù)模式有著密切的關系,不同計劃期限的制定,包括不同的數(shù)據(jù)模式特征。對于不同期限的預測,各種因素的重要程度也是不一樣的。任何一種預測方法的適用性依賴于預測的最遠期限,而且還和預測精度、費用以及其他因素有關。
1.5 預測費用
包括研究和開發(fā)模型的費用、數(shù)據(jù)的收集和儲存費用,及反復應用這個模型的費用。
2 預測模型的數(shù)據(jù)特點
常用于CRM的預測模型有:回歸預測、決策樹、神經(jīng)網(wǎng)絡、聚類和最近鄰技術及規(guī)則推理,其他的預測模型(方法)還有時間序列分析、遺傳算法、粗糙集理論、模糊理論等,而數(shù)據(jù)模式是選擇一個預測模型時最主要的因素,因此,下面按定量數(shù)據(jù)(指用定距或定比尺度來衡量的數(shù)據(jù))和非定量數(shù)據(jù)(用定類或定序尺度來衡量的數(shù)據(jù))來進行對模型數(shù)據(jù)的基本分類,分別對一些預測模型的數(shù)據(jù)特點進行分析:
2.1 回歸預測
回歸分析的數(shù)據(jù)是區(qū)間尺度(又稱定距尺度),它的預測值是連續(xù)的。
2.2 決策樹
決策樹很適合處理非數(shù)值型數(shù)據(jù),它可以很容易的用于種類字段,但當種類的值較多的時候,效果可能會比較差,如果限制分枝的個數(shù)。決策樹的效果還是不錯的。決策樹預測連續(xù)屬性值時性能較差;不能分析和時間有關的屬性變量。若用決策樹來進行分類,需要保證數(shù)據(jù)具有互斥性和完整性。
2.3 神經(jīng)網(wǎng)絡
可用于分類、預測、估值和聚類,一般適用于結構化數(shù)據(jù)。當輸入為數(shù)值字段時,神經(jīng)元網(wǎng)絡將所有輸入轉化到0~1之間;當輸入是種類字段時,神經(jīng)元網(wǎng)絡可以將種類字段轉化成數(shù)值字段,但這樣就給種類字段強加了一個先后次序;而當記錄中的字段很多肘。神經(jīng)元網(wǎng)絡也會受其影響;當有多個依賴變量時神經(jīng)元網(wǎng)絡是最佳的選擇;同時,神經(jīng)元網(wǎng)絡對時間順序的數(shù)據(jù)的處理能力比較好。對非線性、有噪音的復雜數(shù)據(jù)分析效果良好;能處理規(guī)模較大的數(shù)據(jù)庫;能預測連續(xù)數(shù)據(jù),分類或聚類離散數(shù)據(jù);能處理有噪音或屬性值有缺失的數(shù)據(jù)。神經(jīng)網(wǎng)絡特別適合那些模糊、不嚴密、不完整的知識(數(shù)據(jù))為特征的,或那些缺少清晰的分析數(shù)據(jù)的數(shù)學算法的問題。
2.4 聚類分析
使用聚類分析時變量可以是連續(xù)或分類變量,對每個調查對象的數(shù)據(jù)應當是完整的。在可能的情況下,盡量避免用替代值填補缺失值,即使這無法避免,也應當意識到這會影響結果,因為這樣所做的實際上是在編造數(shù)據(jù)。聚類分析中數(shù)據(jù)結構為數(shù)據(jù)矩陣和差異度矩陣,數(shù)據(jù)類型包括區(qū)間標度變量(Interval—scaled variables)、二元變量(Binary variables)、標稱型,序數(shù)型和比例型變量(Nominal ordinal,,and ratio variables)以及混合類型變量(Variables of mixed types)4種。
2.5 最近鄰技術
適用于非定量數(shù)據(jù),能處理分類型數(shù)據(jù),數(shù)字型數(shù)據(jù)和字符型數(shù)據(jù)。
2.6 規(guī)則推理
非定量數(shù)據(jù),適于處理大型數(shù)據(jù)。
2.7 時間序列分析
時間序列分析在處理和時間具有相關性的情況時有獨特的優(yōu)勢,用于處理有序隨機變量或者有序數(shù)據(jù),并且觀測值之間不獨立。
2.8 遺傳算法
可用于分類和預測,可以解決非線性、多變量、非連續(xù)、非可導空間上的優(yōu)化問題。在所求問題為非連續(xù)、多峰以及有噪音的情況下,遺傳算法的優(yōu)勢更加明顯,它能以很大的概率收斂到最優(yōu)解或滿意解,具有較好的全局收斂性。
2.9 模糊集
當精確輸入不可能或太昂貴時,模糊系統(tǒng)就可以作為一種強有力的模型方法。
2.10 粗糙集理論
粗糙集理論是一種研究不完整數(shù)據(jù)、不確定知識的表達、學習及歸納的數(shù)學方法。它為分析不精確數(shù)據(jù)、推理和挖掘數(shù)據(jù)問的關系、發(fā)現(xiàn)潛在的知識提供了行之有效的工具。它以各種更接近人們對事物的描述方式的定性、定疑或混合信息為輸入,輸入空間和輸出空間是通過簡單的決策表簡化得到的。
3 預測模型的評價
不同的模型有其各自適用的場合,因此在不同的預測問題中要根據(jù)具體的情況和模型的特點來選擇預測模型。
如果預測的結果是用于編制計劃或做綜合決策,理論上說,比較理想的辦法是采用多變量預測模型。如果要預測的對象很多,采用單變量的預測方法比較切合實際。
一般情況下。指數(shù)平滑方法和自回歸——移動平均方法的預測精度都比較高,指數(shù)平滑方法用于短期預測能夠得到良好的效果,能夠達到最大的精確度。自回歸——移動平均方法的算法比較復雜,它的優(yōu)點是可以從模型中加以選擇,而不必局限于一個特定的模型,缺點是在選擇模型時需要具有比較豐富的經(jīng)驗和精通這種方法的人。
單變量回歸和多變毯回歸模型的預測期限比指數(shù)平滑方法更遠一些,可用于中期預測。它的另一個優(yōu)點是能夠反映兩個或兩個以上變量之間的相互關系,能夠通過對一個變量的預測立即得到另一個變量的預測值。在建立多變量回歸模型時,采用逐步回歸方法具有良好的結果,它能剔除不重要的因素,從而使回歸模型盡可能地簡單。
計量經(jīng)濟模型通常用作綜合性預測,它的優(yōu)點是對任何單一方程的自變量之間的相互關系,可以包括在其他方程式中,它們的數(shù)值可以同時確定。根據(jù)以上的分析,可以利用層次分析法來進行對預測模型的選擇。層次結構模型見圖1。
圖1 層次結構模型
在實踐中,有時模型間的差別很小,選擇最好的模型,是在模擬條件下對候選模型進行驗證,模擬效果最好的就是最優(yōu)的模型;在方法上,有時需同時應用幾種方法,如因子分析往往和回歸分析或聚類分析一起使用,聚類分析和判別分析結合使用等。
核心關注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務領域、行業(yè)應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業(yè)務領域的管理,全面涵蓋了企業(yè)關注ERP管理系統(tǒng)的核心領域,是眾多中小企業(yè)信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網(wǎng)http://www.oesoe.com/
本文標題:CRM預測模型的評價與選擇
本文網(wǎng)址:http://www.oesoe.com/html/solutions/1401936257.html