| 當前位置：拓步ERP資訊網 >>服務支持 >>ERP技術支持 >>企業(yè)管理知識庫

大數據概念、技術、特點、應用與案例

發(fā)布日期：2015-04-21 7:44:53 來源：www.oesoe.com 編輯：拓步ERP資訊網瀏覽：評論

摘要：從所周知，大數據已經不簡簡單單是數據大的事實了，而最重要的現實是對大數據進行分析，只有通過分析才能獲取很多智能的，深入的，有價值的信息。 原標題：大數據概念、技術、特點、應用與案例 原作者：2015/4/21 來源：e-works 作者：佚名
關鍵字：大數據概念大數據技術大數據特點大數據應用案例

　　一、大數據概念

　　"大數據"是一個體量特別大，數據類別特別大的數據集，并且這樣的數據集無法用傳統(tǒng)數據庫工具對其內容進行抓取、管理和處理。 "大數據"首先是指數據體量(volumes)?大，指代大型數據集，一般在10TB?規(guī)模左右，但在實際應用中，很多企業(yè)用戶把多個數據集放在一起，已經形成了PB級的數據量；其次是指數據類別(variety)大，數據來自多種數據源，數據種類和格式日漸豐富，已沖破了以前所限定的結構化數據范疇，囊括了半結構化和非結構化數據。接著是數據處理速度（Velocity）快，在數據量非常龐大的情況下，也能夠做到數據的實時處理。最后一個特點是指數據真實性（Veracity）高，隨著社交數據、企業(yè)內容、交易與應用數據等新數據源的興趣，傳統(tǒng)數據源的局限被打破，企業(yè)愈發(fā)需要有效的信息之力以確保其真實性及安全性。

　　"大數據"是需要新處理模式才能具有更強的決策力、洞察發(fā)現力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產。從數據的類別上看，"大數據"指的是無法使用傳統(tǒng)流程或工具處理或分析的信息。它定義了那些超出正常處理范圍和大小、迫使用戶采用非傳統(tǒng)處理方法的數據集。亞馬遜網絡服務（AWS）、大數據科學家JohnRauser提到一個簡單的定義：大數據就是任何超過了一臺計算機處理能力的龐大數據量。研發(fā)小組對大數據的定義："大數據是最大的宣傳技術、是最時髦的技術，當這種現象出現時，定義就變得很混亂。" Kelly說："大數據是可能不包含所有的信息，但我覺得大部分是正確的。對大數據的一部分認知在于，它是如此之大，分析它需要多個工作負載，這是AWS的定義。當你的技術達到極限時，也就是數據的極限"。大數據不是關于如何定義，最重要的是如何使用。最大的挑戰(zhàn)在于哪些技術能更好的使用數據以及大數據的應用情況如何。這與傳統(tǒng)的數據庫相比，開源的大數據分析工具的如Hadoop的崛起，這些非結構化的數據服務的價值在哪里。

　　二、大數據分析

　　從所周知，大數據已經不簡簡單單是數據大的事實了，而最重要的現實是對大數據進行分析，只有通過分析才能獲取很多智能的，深入的，有價值的信息。那么越來越多的應用涉及到大數據，而這些大數據的屬性，包括數量，速度，多樣性等等都是呈現了大數據不斷增長的復雜性，所以大數據的分析方法在大數據領域就顯得尤為重要，可以說是決定最終信息是否有價值的決定性因素�；谌绱说恼J識，大數據分析普遍存在的方法理論有哪些呢？

　　1、可視化分析

　　大數據分析的使用者有大數據分析專家，同時還有普通用戶，但是他們二者對于大數據分析最基本的要求就是可視化分析，因為可視化分析能夠直觀的呈現大數據特點，同時能夠非常容易被讀者所接受，就如同看圖說話一樣簡單明了

　　2、數據挖掘算法

　　大數據分析的理論核心就是數據挖掘算法，各種數據挖掘的算法基于不同的數據類型和格式才能更加科學的呈現出數據本身具備的特點，也正是因為這些被全世界統(tǒng)計學家所公認的各種統(tǒng)計方法（可以稱之為真理）才能深入數據內部，挖掘出公認的價值。另外一個方面也是因為有這些數據挖掘的算法才能更快速的處理大數據，如果一個算法得花上好幾年才能得出結論，那大數據的價值也就無從說起了。

　　3、預測性分析能力

　　大數據分析最終要的應用領域之一就是預測性分析，從大數據中挖掘出特點，通過科學的建立模型，之后便可以通過模型帶入新的數據，從而預測未來的數據。

　　4、數據質量和數據管理

　　大數據分析離不開數據質量和數據管理，高質量的數據和有效的數據管理，無論是在學術研究還是在商業(yè)應用領域，都能夠保證分析結果的真實和有價值。大數據分析的基礎就是以上五個方面，當然更加深入大數據分析的話，還有很多很多更加有特點的、更加深入的、更加專業(yè)的大數據分析方法。

　　三、大數據技術

　　1、數據采集：ETL工具負責將分布的、異構數據源中的數據如關系數據、平面數據文件等抽取到臨時中間層后進行清洗、轉換、集成，最后加載到數據倉庫或數據集市中，成為聯(lián)機分析處理、數據挖掘的基礎。

　　2、數據存�。宏P系數據庫、NOSQL、SQL等。

　　3、基礎架構：云存儲、分布式文件存儲等。

　　4、數據處理：自然語言處理(NLP，NaturalLanguageProcessing)是研究人與計算機交互的語言問題的一門學科。處理自然語言的關鍵是要讓計算機"理解"自然語言，所以自然語言處理又叫做自然語言理解(NLU，NaturalLanguage Understanding)，也稱為計算語言學(Computational Linguistics。一方面它是語言信息處理的一個分支，另一方面它是人工智能(AI, Artificial Intelligence)的核心課題之一。

　　5、統(tǒng)計分析：假設檢驗、顯著性檢驗、差異分析、相關分析、T檢驗、方差分析、卡方分析、偏相關分析、距離分析、回歸分析、簡單回歸分析、多元回歸分析、逐步回歸、回歸預測與殘差分析、嶺回歸、logistic回歸分析、曲線估計、因子分析、聚類分析、主成分分析、因子分析、快速聚類法與聚類法、判別分析、對應分析、多元對應分析（最優(yōu)尺度分析）、bootstrap技術等等。

　　6、數據挖掘：分類（Classification）、估計（Estimation）、預測（Prediction）、相關性分組或關聯(lián)規(guī)則（Affinity grouping or association rules）、聚類（Clustering）、描述和可視化、Description and Visualization）、復雜數據類型挖掘(Text, Web ,圖形圖像，視頻，音頻等)

　　7、模型預測：預測模型、機器學習、建模仿真。

　　8、結果呈現：云計算、標簽云、關系圖等。

　　四、大數據特點

　　要理解大數據這一概念，首先要從"大"入手，"大"是指數據規(guī)模，大數據一般指在10TB(1TB=1024GB)規(guī)模以上的數據量。大數據同過去的海量數據有所區(qū)別，其基本特征可以用4個V來總結(Vol-ume、Variety、Value和Veloc-ity)，即體量大、多樣性、價值密度低、速度快。

　　1、數據體量巨大。從TB級別，躍升到PB級別。

　　2、數據類型繁多，如前文提到的網絡日志、視頻、圖片、地理位置信息，等等。

　　3、價值密度低。以視頻為例，連續(xù)不間斷監(jiān)控過程中，可能有用的數據僅僅有一兩秒。

　　4、處理速度快。1秒定律。最后這一點也是和傳統(tǒng)的數據挖掘技術有著本質的不同。物聯(lián)網、云計算、移動互聯(lián)網、車聯(lián)網、手機、平板電腦、PC以及遍布地球各個角落的各種各樣的傳感器，無一不是數據來源或者承載的方式。

　　大數據技術是指從各種各樣類型的巨量數據中，快速獲得有價值信息的技術。解決大數據問題的核心是大數據技術。目前所說的"大數據"不僅指數據本身的規(guī)模，也包括采集數據的工具、平臺和數據分析系統(tǒng)。大數據研發(fā)目的是發(fā)展大數據技術并將其應用到相關領域，通過解決巨量數據處理問題促進其突破性發(fā)展。因此，大數據時代帶來的挑戰(zhàn)不僅體現在如何處理巨量數據從中獲取有價值的信息，也體現在如何加強大數據技術研發(fā)，搶占時代發(fā)展的前沿。

　　五、大數據處理

　　大數據處理之一：采集

　　大數據的采集是指利用多個數據庫來接收發(fā)自客戶端（Web、App或者傳感器形式等）的數據，并且用戶可以通過這些數據庫來進行簡單的查詢和處理工作。比如，電商會使用傳統(tǒng)的關系型數據庫MySQL和Oracle等來存儲每一筆事務數據，除此之外，Redis和MongoDB這樣的NoSQL數據庫也常用于數據的采集。

　　在大數據的采集過程中，其主要特點和挑戰(zhàn)是并發(fā)數高，因為同時有可能會有成千上萬的用戶來進行訪問和操作，比如火車票售票網站和淘寶，它們并發(fā)的訪問量在峰值時達到上百萬，所以需要在采集端部署大量數據庫才能支撐。并且如何在這些數據庫之間進行負載均衡和分片的確是需要深入的思考和設計。

　　大數據處理之二：導入/預處理

　　雖然采集端本身會有很多數據庫，但是如果要對這些海量數據進行有效的分析，還是應該將這些來自前端的數據導入到一個集中的大型分布式數據庫，或者分布式存儲集群，并且可以在導入基礎上做一些簡單的清洗和預處理工作。也有一些用戶會在導入時使用來自Twitter的Storm來對數據進行流式計算，來滿足部分業(yè)務的實時計算需求。

　　導入與預處理過程的特點和挑戰(zhàn)主要是導入的數據量大，每秒鐘的導入量經常會達到百兆，甚至千兆級別。

　　大數據處理之三：統(tǒng)計/分析

　　統(tǒng)計與分析主要利用分布式數據庫，或者分布式計算集群來對存儲于其內的海量數據進行普通的分析和分類匯總等，以滿足大多數常見的分析需求，在這方面，一些實時性需求會用到EMC的GreenPlum、Oracle的Exadata，以及基于MySQL的列式存儲Infobright等，而一些批處理，或者基于半結構化數據的需求可以使用Hadoop。

　　統(tǒng)計與分析這部分的主要特點和挑戰(zhàn)是分析涉及的數據量大，其對系統(tǒng)資源，特別是I/O會有極大的占用。

　　大數據處理之四：挖掘

　　與前面統(tǒng)計和分析過程不同的是，數據挖掘一般沒有什么預先設定好的主題，主要是在現有數據上面進行基于各種算法的計算，從而起到預測（Predict）的效果，從而實現一些高級別數據分析的需求。比較典型算法有用于聚類的Kmeans、用于統(tǒng)計學習的SVM和用于分類的NaiveBayes，主要使用的工具有Hadoop的Mahout等。該過程的特點和挑戰(zhàn)主要是用于挖掘的算法很復雜，并且計算涉及的數據量和計算量都很大，常用數據挖掘算法都以單線程為主。

　　整個大數據處理的普遍流程至少應該滿足這四個方面的步驟，才能算得上是一個比較完整的大數據處理

　　六、大數據應用與案例分析

　　大數據應用的關鍵，也是其必要條件，就在于"IT"與"經營"的融合，當然，這里的經營的內涵可以非常廣泛，小至一個零售門店的經營，大至一個城市的經營。以下是關于各行各業(yè)，不同的組織機構在大數據方面的應用的案例，在此申明，以下案例均來源于網絡，本文僅作引用，并在此基礎上作簡單的梳理和分類。

　　大數據應用案例之：醫(yī)療行業(yè)

　　[1] Seton Healthcare是采用IBM最新沃森技術醫(yī)療保健內容分析預測的首個客戶。該技術允許企業(yè)找到大量病人相關的臨床醫(yī)療信息，通過大數據處理，更好地分析病人的信息。

　　[2] 在加拿大多倫多的一家醫(yī)院，針對早產嬰兒，每秒鐘有超過3000次的數據讀取。通過這些數據分析，醫(yī)院能夠提前知道哪些早產兒出現問題并且有針對性地采取措施，避免早產嬰兒夭折。

　　[3] 它讓更多的創(chuàng)業(yè)者更方便地開發(fā)產品，比如通過社交網絡來收集數據的健康類App。也許未來數年后，它們搜集的數據能讓醫(yī)生給你的診斷變得更為精確，比方說不是通用的成人每日三次一次一片，而是檢測到你的血液中藥劑已經代謝完成會自動提醒你再次服藥。

　　大數據應用案例之：能源行業(yè)

　　[1]　智能電網現在歐洲已經做到了終端，也就是所謂的智能電表。在德國，為了鼓勵利用太陽能，會在家庭安裝太陽能，除了賣電給你，當你的太陽能有多余電的時候還可以買回來。通過電網收集每隔五分鐘或十分鐘收集一次數據，收集來的這些數據可以用來預測客戶的用電習慣等，從而推斷出在未來2~3個月時間里，整個電網大概需要多少電。有了這個預測后，就可以向發(fā)電或者供電企業(yè)購買一定數量的電。因為電有點像期貨一樣，如果提前買就會比較便宜，買現貨就比較貴。通過這個預測后，可以降低采購成本。

　　[2]　維斯塔斯風力系統(tǒng)，依靠的是BigInsights軟件和IBM超級計算機，然后對氣象數據進行分析，找出安裝風力渦輪機和整個風電場最佳的地點。利用大數據，以往需要數周的分析工作，現在僅需要不足1小時便可完成。

　　大數據應用案例之：通信行業(yè)

　　[1] XO Communications通過使用IBM SPSS預測分析軟件，減少了將近一半的客戶流失率。XO現在可以預測客戶的行為，發(fā)現行為趨勢，并找出存在缺陷的環(huán)節(jié)，從而幫助公司及時采取措施，保留客戶。此外，IBM新的Netezza網絡分析加速器，將通過提供單個端到端網絡、服務、客戶分析視圖的可擴展平臺，幫助通信企業(yè)制定更科學、合理決策。

　　[2] 電信業(yè)者透過數以千萬計的客戶資料，能分析出多種使用者行為和趨勢，賣給需要的企業(yè)，這是全新的資料經濟。

　　[3] 中國移動通過大數據分析，對企業(yè)運營的全業(yè)務進行針對性的監(jiān)控、預警、跟蹤。系統(tǒng)在第一時間自動捕捉市場變化，再以最快捷的方式推送給指定負責人，使他在最短時間內獲知市場行情。

　　[4] NTT docomo把手機位置信息和互聯(lián)網上的信息結合起來，為顧客提供附近的餐飲店信息，接近末班車時間時，提供末班車信息服務。

　　大數據應用案例之：零售業(yè)

　　[1] "我們的某個客戶，是一家領先的專業(yè)時裝零售商，通過當地的百貨商店、網絡及其郵購目錄業(yè)務為客戶提供服務。公司希望向客戶提供差異化服務，如何定位公司的差異化，他們通過從 Twitter 和 Facebook 上收集社交信息，更深入的理解化妝品的營銷模式，隨后他們認識到必須保留兩類有價值的客戶：高消費者和高影響者。希望通過接受免費化妝服務，讓用戶進行口碑宣傳，這是交易數據與交互數據的完美結合，為業(yè)務挑戰(zhàn)提供了解決方案。"Informatica的技術幫助這家零售商用社交平臺上的數據充實了客戶主數據，使他的業(yè)務服務更具有目標性。

　　[2] 零售企業(yè)也監(jiān)控客戶的店內走動情況以及與商品的互動。它們將這些數據與交易記錄相結合來展開分析，從而在銷售哪些商品、如何擺放貨品以及何時調整售價上給出意見，此類方法已經幫助某領先零售企業(yè)減少了17%的存貨，同時在保持市場份額的前提下，增加了高利潤率自有品牌商品的比例。

核心關注：拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務領域、行業(yè)應用，蘊涵了豐富的ERP管理思想，集成了ERP軟件業(yè)務管理理念，功能涉及供應鏈、成本、制造、CRM、HR等眾多業(yè)務領域的管理，全面涵蓋了企業(yè)關注ERP管理系統(tǒng)的核心領域，是眾多中小企業(yè)信息化建設首選的ERP管理軟件信賴品牌。

轉載請注明出處：拓步ERP資訊網 http://www.oesoe.com/

本文標題：大數據概念、技術、特點、應用與案例

本文網址：http://www.oesoe.com/html/support/11121818105.html

關鍵詞標簽： 大數據概念、技術、特點、應用與案例,大數據概念大數據技術大數據特點大數據應用案例,ERP,ERP系統(tǒng),ERP軟件,ERP系統(tǒng)軟件,ERP管理系統(tǒng),ERP管理軟件,進銷存軟件,財務軟件,倉庫管理軟件,生產管理軟件,企業(yè)管理軟件,拓步,拓步ERP,拓步軟件,免費ERP,免費ERP軟件,免費ERP系統(tǒng),ERP軟件免費下載,ERP系統(tǒng)免費下載,免費ERP軟件下載,免費進銷存軟件,免費進銷存,免費財務軟件,免費倉庫管理軟件,免費下載,

本文轉自：e-works制造業(yè)信息化門戶網

本文來源于互聯(lián)網，拓步ERP資訊網本著傳播知識、有益學習和研究的目的進行的轉載，為網友免費提供，并盡力標明作者與出處，如有著作權人或出版方提出異議，本站將立即刪除。如果您對文章轉載有任何疑問請告之我們，以便我們及時糾正。聯(lián)系方式：QQ：10877846 Tel：0755-26405298。

上一篇：大數據基本概念及技術

下一篇：普通企業(yè)7步布局大數據

相關文章

服務支持

拓步ERP系統(tǒng)軟件平臺11.5專業(yè)版v10.1.2...

拓步ERP系統(tǒng)軟件平臺11.5標..

金蝶KIS財務軟件標準版V8.1..

金蝶KIS財務軟件迷你版V8.1..

金蝶KIS工業(yè)貿易專業(yè)版V12...

SQL2000 4in1 ISO..

MSDE2000 SP4 簡體中..

金蝶KIS商貿高級版V4.0|破..

金蝶KIS財務軟件行政事業(yè)版V9..

金蝶KIS零售版V4.1|破解版..

熱門培訓視頻

拓步ERP系統(tǒng)平臺庫存管理系統(tǒng)培訓視頻教材

拓步ERP系統(tǒng)平臺客戶端安裝培訓..

拓步ERP財務管理系統(tǒng)培訓視頻

拓步ERP系統(tǒng)平臺數據庫安裝培訓..

拓步ERP系統(tǒng)平臺通用操作培訓視..

拓步ERP系統(tǒng)平臺采購管理系統(tǒng)培..

拓步ERP系統(tǒng)平臺考勤管理系統(tǒng)培..

拓步ERP系統(tǒng)平臺財務報表系統(tǒng)培..

拓步ERP系統(tǒng)平臺財務總帳系統(tǒng)培..

拓步ERP系統(tǒng)平臺應收帳款系統(tǒng)培..

熱門電子圖書

拓步ERP財務管理系統(tǒng)電子圖書

拓步ERP業(yè)務系列倉存版（倉庫管..

拓步ERP平臺系列標準版

拓步ERP財務系列迷你版（財務管..

拓步ERP條碼系列業(yè)務標準版（條..

拓步ERP平臺系列企業(yè)版

拓步ERP平臺系列專業(yè)版

拓步ERP行業(yè)系列電子行業(yè)版


	ERP新聞動態(tài) 拓步新聞行業(yè)新聞關注產品觀點縱橫企業(yè)管理企業(yè)應用

	ERP解決方案按ERP應用行業(yè)分類按ERP企業(yè)規(guī)模分類按ERP管理領域分類按ERP軟件功能分類按ERP系統(tǒng)特性分類用友ERP解決方案金蝶ERP解決方案易飛ERP解決方案速達ERP解決方案其他ERP解決方案

	ERP顧問咨詢 ERP管理咨詢 ERP戰(zhàn)略診斷 ERP流程分析 ERP流程優(yōu)化 ERP風險分析 ERP可行性研究 ERP整體規(guī)劃 ERP選型招標 ERP實施監(jiān)理 ERP評審驗收 ERP績效評價 ERP基礎知識 ERP課程培訓 ERP培訓教育 ERP視頻教材

	CIO技術專欄 CIO企業(yè)應用 CIO網絡通信 CIO信息安全 CIO基礎設施 CIO云計算

	ERP技術支持技術支持知識庫常見問題資料庫在線學習資料庫日常辦公資料庫企業(yè)管理知識庫

	ERP系統(tǒng)價格拓步ERP系統(tǒng)價格體系拓步EIS軟件價格體系合作品牌ERP價格體系技術支持服務價格體系

	合作品牌用友UFIDA 金蝶KingDee 神州數碼Digital 速達SuperData 拓步ERP系統(tǒng)成功案例

	代理加盟合作聯(lián)盟策略代理合作指南代理聯(lián)盟前景聯(lián)盟技術支持快速搜索ERP軟件資訊

	關于拓步公司介紹公司愿景企業(yè)文化誠聘英才聯(lián)系我們在線留言在線訂購意向下載體驗登記

ERP技術支持

技術支持知識庫

常見問題資料庫

在線學習資料庫

日常辦公資料庫

企業(yè)管理知識庫

ERP系統(tǒng)教程

ERP免費下載

ERP在線咨詢

即時聯(lián)系

服務熱線

快捷互動