隨著智能手機(jī)的應(yīng)用,中國(guó)的移動(dòng)互聯(lián)網(wǎng)已經(jīng)步入大數(shù)據(jù)時(shí)代。社交網(wǎng)絡(luò)逐漸成熟、移動(dòng)帶寬迅速提升,更多的移動(dòng)終端、傳感設(shè)備接入網(wǎng)絡(luò),產(chǎn)生的數(shù)據(jù)及其增長(zhǎng)速度是前所未有的。新型應(yīng)用、業(yè)務(wù)的不斷涌現(xiàn)(例如移動(dòng)支付、移動(dòng)搜索、移動(dòng)社交、移動(dòng)閱讀、移動(dòng)購(gòu)物、移動(dòng)音樂(lè)視頻下載等),其產(chǎn)生的海量數(shù)據(jù)所帶來(lái)的價(jià)值難以估量,移動(dòng)互聯(lián)網(wǎng)大數(shù)據(jù)對(duì)這些新興產(chǎn)業(yè)和業(yè)務(wù)模式也產(chǎn)生了強(qiáng)有力的幾何級(jí)數(shù)疊加效應(yīng)。
移動(dòng)互聯(lián)網(wǎng)大數(shù)據(jù)分析是針對(duì)移動(dòng)互聯(lián)網(wǎng)中的海量數(shù)據(jù)進(jìn)行分析研究,以揭示其內(nèi)部隱藏的模式和數(shù)據(jù)間的相關(guān)性。通過(guò)獲得的有用信息幫助企業(yè)和機(jī)構(gòu),使其對(duì)客戶的需求和體驗(yàn)、業(yè)務(wù)的發(fā)展具有更豐富、更深刻的理解,幫助其在競(jìng)爭(zhēng)中取得優(yōu)勢(shì)。
本文將分析移動(dòng)互聯(lián)網(wǎng)大數(shù)據(jù)處理所面臨的挑戰(zhàn),討論移動(dòng)互聯(lián)網(wǎng)大數(shù)據(jù)處理的關(guān)鍵技術(shù),希望通過(guò)對(duì)移動(dòng)互聯(lián)網(wǎng)大數(shù)據(jù)高效率、低成本的處理,為用戶提供更好的體驗(yàn),為企業(yè)的發(fā)展提供指引。
1.移動(dòng)互聯(lián)網(wǎng)大數(shù)據(jù)的機(jī)遇與挑戰(zhàn)
移動(dòng)互聯(lián)網(wǎng)大數(shù)據(jù)是指用戶使用智能終端在移動(dòng)網(wǎng)絡(luò)中產(chǎn)生的數(shù)據(jù),主要包括:
(1)與網(wǎng)絡(luò)信令、協(xié)議、流量等相關(guān)的網(wǎng)絡(luò)信息數(shù)據(jù)。
(2)與用戶信息相關(guān)的用戶數(shù)據(jù)。
(3)與業(yè)務(wù)相關(guān)的數(shù)據(jù)。
移動(dòng)網(wǎng)絡(luò)中產(chǎn)生著越來(lái)越多的數(shù)據(jù),電信運(yùn)營(yíng)商在提供網(wǎng)絡(luò)服務(wù)的同時(shí),也擁有了這些寶貴的數(shù)據(jù)資源。這些數(shù)據(jù)信息對(duì)于市場(chǎng)和業(yè)務(wù)的發(fā)展是極其寶貴的,蘊(yùn)藏著巨大的、造福社會(huì)的潛力。而這些數(shù)據(jù)是運(yùn)營(yíng)商管理網(wǎng)絡(luò)的基礎(chǔ),很多信息高度個(gè)人化,如何合理、有效地發(fā)揮這些數(shù)據(jù)資源的作用,為電信運(yùn)營(yíng)商帶來(lái)了機(jī)遇與挑戰(zhàn)。
1.1 移動(dòng)互聯(lián)網(wǎng)大數(shù)據(jù)的機(jī)遇
移動(dòng)互聯(lián)網(wǎng)大數(shù)據(jù)可以為電信行業(yè)提供海量的通信網(wǎng)絡(luò)運(yùn)營(yíng)數(shù)據(jù),包括網(wǎng)絡(luò)信令、網(wǎng)絡(luò)運(yùn)營(yíng)服務(wù)質(zhì)量、億萬(wàn)用戶的基礎(chǔ)信息和位置信息、各類應(yīng)用的使用信息、
物聯(lián)網(wǎng)和視頻網(wǎng)絡(luò)的使用信息等。對(duì)這些數(shù)據(jù)的處理、分析是了解網(wǎng)絡(luò)運(yùn)營(yíng)狀態(tài)、互聯(lián)網(wǎng)應(yīng)用發(fā)展趨勢(shì)和改善客戶體驗(yàn)的重要技術(shù)。
通過(guò)大數(shù)據(jù)分析超越客戶支持范疇在整個(gè)客戶生命周期中幫助客戶,能夠提升客戶體驗(yàn)。大數(shù)據(jù)分析也是簡(jiǎn)化網(wǎng)絡(luò)和服務(wù)管理流程,提高運(yùn)營(yíng)效率的重要技術(shù)。移動(dòng)客戶體驗(yàn)方案結(jié)合大數(shù)據(jù)分析可以提供客戶在任何時(shí)間、地點(diǎn)、經(jīng)歷了何種體驗(yàn)的完整信息,可
以幫助運(yùn)營(yíng)商預(yù)期、理解網(wǎng)絡(luò)上發(fā)生的情況和客戶體驗(yàn),同時(shí)做出適當(dāng)響應(yīng)。這些信息能夠幫助服務(wù)提應(yīng)商優(yōu)先考慮重要的問(wèn)題,提供積極的技術(shù)支持、改善客戶體驗(yàn)、減少客戶流失傾向。
1.2 移動(dòng)互聯(lián)網(wǎng)大數(shù)據(jù)面臨的挑戰(zhàn)
移動(dòng)互聯(lián)網(wǎng)大數(shù)據(jù)是網(wǎng)絡(luò)運(yùn)營(yíng)發(fā)展和創(chuàng)造新的商業(yè)模式和價(jià)值的核心。這些數(shù)據(jù)產(chǎn)生于網(wǎng)上交易、電子郵件、視頻、音頻、圖像、點(diǎn)擊流、日志、帖子、搜索查詢、健康檔案、社交互動(dòng)、科學(xué)數(shù)據(jù)、傳感器和移動(dòng)電話及其應(yīng)用。由于數(shù)據(jù)量規(guī)模巨大,傳統(tǒng)的技術(shù)已經(jīng)難以擷取、存儲(chǔ)、管理、共享、分析,并將結(jié)果可視化。這些是移動(dòng)互聯(lián)網(wǎng)大數(shù)據(jù)所面臨的挑戰(zhàn)。
1.2.1 多源數(shù)據(jù)采集問(wèn)題
大數(shù)據(jù)時(shí)代的數(shù)據(jù)存在如下幾個(gè)特點(diǎn):多源異構(gòu)、分布廣泛、動(dòng)態(tài)增長(zhǎng)、先有數(shù)據(jù)后有模式。舉例來(lái)說(shuō),一個(gè)用戶的一條位置信息的價(jià)值是很小的,但是很多這樣的低價(jià)值數(shù)據(jù)可以完整刻畫出用戶的運(yùn)動(dòng)軌跡,獲得本質(zhì)上的價(jià)值提升。
然而,在已有的數(shù)據(jù)采集系統(tǒng)中,數(shù)據(jù)收集不全面是一個(gè)普遍的問(wèn)題,如何處理來(lái)自多源的數(shù)據(jù)是移動(dòng)互聯(lián)網(wǎng)大數(shù)據(jù)時(shí)代面臨的新挑戰(zhàn)。其中,迫切需要解決如下幾個(gè)問(wèn)題:
●無(wú)線移動(dòng)網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,需要在網(wǎng)絡(luò)中高效地采集數(shù)據(jù)。
●多源數(shù)據(jù)集成和多類型數(shù)據(jù)集成的技術(shù)。
●兼顧用戶的隱私和數(shù)據(jù)的所有權(quán)和使用權(quán)等。
1.2.2 移動(dòng)互聯(lián)網(wǎng)海量異構(gòu)數(shù)據(jù)管理問(wèn)題
據(jù)統(tǒng)計(jì),2003 年前人類共創(chuàng)造了5 艾字節(jié)(Exabytes)的數(shù)據(jù),而今天兩天的時(shí)間就可以創(chuàng)造如此大量的數(shù)據(jù)。這些數(shù)據(jù)大部分是異構(gòu)數(shù)據(jù),有些具有用戶標(biāo)注、有些沒(méi)有;有些是結(jié)構(gòu)化的(比如數(shù)值、符號(hào))、有些是非結(jié)構(gòu)化話的(比如圖片、聲音);有些時(shí)效性強(qiáng)、有些時(shí)效性弱;有些價(jià)值度高、有些價(jià)值度低。
移動(dòng)互聯(lián)網(wǎng)海量異構(gòu)數(shù)據(jù)管理平臺(tái)包含以下關(guān)鍵研究和技術(shù):海量異構(gòu)大數(shù)據(jù)傳輸控制、大數(shù)據(jù)存儲(chǔ)、大數(shù)據(jù)
質(zhì)量管理。
1.2.3 移動(dòng)互聯(lián)網(wǎng)大數(shù)據(jù)實(shí)時(shí)數(shù)據(jù)挖掘問(wèn)題
傳統(tǒng)意義上的數(shù)據(jù)分析(Analysis)主要針對(duì)結(jié)構(gòu)化數(shù)據(jù)展開(kāi),且已經(jīng)形成了一整套行之有效的分析體系。首先,利用數(shù)據(jù)庫(kù)來(lái)存儲(chǔ)結(jié)構(gòu)化數(shù)據(jù),在此基礎(chǔ)上構(gòu)建
數(shù)據(jù)倉(cāng)庫(kù),根據(jù)需要構(gòu)建數(shù)據(jù)立方體進(jìn)行聯(lián)機(jī)分析處理(OLAP,Online Analytical Processing),可以進(jìn)行多個(gè)維度的下鉆(Drill-down)或上卷(Roll-up)操作。對(duì)于從數(shù)據(jù)中提煉更深層次的知識(shí)的需求促使了數(shù)據(jù)挖掘技術(shù)的產(chǎn)生,并發(fā)明了聚類、關(guān)聯(lián)分析等一系列在實(shí)踐中行之有效的方法。這一整套處理流程在處理相對(duì)較少的結(jié)構(gòu)化數(shù)據(jù)時(shí)極為高效。但是,對(duì)于移動(dòng)互聯(lián)網(wǎng)來(lái)說(shuō),涉及更多的是多模態(tài)數(shù)據(jù)挖掘,這些數(shù)據(jù)包括手機(jī)上的傳感器,包括加速度計(jì)、陀螺儀、指南針、GPS、麥克風(fēng)、攝像頭、以及各種無(wú)線信號(hào)(如GSM、Wi-Fi)和藍(lán)牙等。這些原始數(shù)據(jù)在不同維度上刻畫被感知的對(duì)象,需要經(jīng)過(guò)不同層次的加工和提煉才能形成從數(shù)據(jù)到信息再到知識(shí)的飛躍。移動(dòng)互聯(lián)網(wǎng)半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)量的迅猛增長(zhǎng),給傳統(tǒng)的分析技術(shù)帶來(lái)了巨大的沖擊和挑戰(zhàn)。
1.2.4 高效資源管理與分析問(wèn)題
移動(dòng)互聯(lián)網(wǎng)通過(guò)物理空間和信息空間的感知互動(dòng),高效靈活地為用戶提供智慧服務(wù)。移動(dòng)互聯(lián)網(wǎng)系統(tǒng)存在高度的混雜性特征,諸如終端類型多樣、數(shù)量巨大,感知屬性、特征、控制與處理方法等差異巨大,使得移動(dòng)互聯(lián)網(wǎng)的運(yùn)行場(chǎng)景和待處理因素極為復(fù)雜多樣。
這就對(duì)移動(dòng)互聯(lián)網(wǎng)的資源可靠性提出了要求,使其需要相應(yīng)檢測(cè)方法的研究。支持移動(dòng)互聯(lián)網(wǎng)大數(shù)據(jù)的資源管理是移動(dòng)互聯(lián)網(wǎng)運(yùn)行的基礎(chǔ),為移動(dòng)互聯(lián)網(wǎng)大數(shù)據(jù)的感知、采集、交互、處理和決策提供了重要支撐,因而移動(dòng)互聯(lián)網(wǎng)的高效資源管理與分析機(jī)理是亟待解決的基礎(chǔ)科學(xué)問(wèn)題。
在移動(dòng)互聯(lián)網(wǎng)中,由于泛在業(yè)務(wù)的異構(gòu)性、大規(guī)模性與時(shí)空復(fù)雜性,如何在這樣的異構(gòu)非線性復(fù)雜巨型系統(tǒng)中建立基于Web 的無(wú)限泛在網(wǎng)業(yè)務(wù)環(huán)境體系架構(gòu),是目前亟待解決的問(wèn)題。
2.移動(dòng)互聯(lián)網(wǎng)大數(shù)據(jù)的關(guān)鍵技術(shù)
移動(dòng)互聯(lián)網(wǎng)大數(shù)據(jù)的關(guān)鍵技術(shù)涉及多源數(shù)據(jù)采集、海量異構(gòu)數(shù)據(jù)管理、實(shí)時(shí)數(shù)據(jù)挖掘、高效資源管理與分析等,這些技術(shù)的核心是數(shù)據(jù)的管理、分析和呈現(xiàn)。
2.1 海量異構(gòu)數(shù)據(jù)管理技術(shù)
移動(dòng)互聯(lián)網(wǎng)時(shí)刻都在產(chǎn)生海量的多源異構(gòu)數(shù)據(jù)。
這些數(shù)據(jù)具有4 大特點(diǎn),第一,數(shù)據(jù)體量巨大。從TB級(jí)別,躍升到PB 級(jí)別;第二,數(shù)據(jù)類型繁多,如網(wǎng)絡(luò)日志、視頻、圖片、地理位置信息等;第三,價(jià)值密度低,商業(yè)價(jià)值高。以視頻為例,連續(xù)不間斷監(jiān)控過(guò)程中,可能有用的數(shù)據(jù)僅僅有一兩秒;第四,處理速度快,1 秒定律,即要求在秒級(jí)時(shí)間范圍內(nèi)給出分析結(jié)果,時(shí)間太長(zhǎng)就失去了價(jià)值。最后這一點(diǎn)也是和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同。為此,業(yè)界將大數(shù)據(jù)的特點(diǎn)歸納為4 個(gè)“V”——Volume(大量)、Velocity(高速)、Variety(多樣)、Veracity(精確)。
針對(duì)這4 個(gè)特點(diǎn)給海量異構(gòu)數(shù)據(jù)的管理帶來(lái)的挑戰(zhàn),海量異構(gòu)數(shù)據(jù)管理需重點(diǎn)關(guān)注如圖1 所示架構(gòu)中的關(guān)鍵模塊,具體有:
圖1 移動(dòng)互聯(lián)網(wǎng)大數(shù)據(jù)處理架構(gòu)圖
(1)流處理與批處理模塊。
(2)異構(gòu)數(shù)據(jù)融合與海量數(shù)據(jù)集成模塊。
(3)文件系統(tǒng)模塊。
(4)數(shù)據(jù)庫(kù)系統(tǒng)模塊。
(5)數(shù)據(jù)管理易用性模塊。
(6)為數(shù)據(jù)管理、挖掘、呈現(xiàn)提供接口的數(shù)據(jù)訪問(wèn)層。
針對(duì)移動(dòng)互聯(lián)網(wǎng)大數(shù)據(jù)處理的不同要求,數(shù)據(jù)探測(cè)模塊可將數(shù)據(jù)分別送給實(shí)時(shí)流處理系統(tǒng)和批處理系統(tǒng)。很多互聯(lián)網(wǎng)公司(如職業(yè)社交網(wǎng)站Linkedin)根據(jù)處理時(shí)間的要求將業(yè)務(wù)劃分為在線(Online)、近線(Nearline)和離線(Offline)。這種劃分方式是按處理所耗時(shí)間來(lái)劃分的。其中,在線的處理時(shí)間一般在秒級(jí),甚至是毫秒級(jí),通常采用流處理技術(shù)。離線的處理時(shí)間可以以天為基本單位,基本采用批處理方式,以便最大限度地利用系統(tǒng)I/O。近線的處理時(shí)間在分鐘級(jí)或小時(shí)級(jí),對(duì)其處理模型并沒(méi)有特別的要求,可以根據(jù)需求靈活選擇,實(shí)際中多采用批處理模式。
流式處理系統(tǒng)主要采用Flume、Kafka、Storm 的系統(tǒng)架構(gòu),數(shù)據(jù)處理后存入數(shù)據(jù)庫(kù)系統(tǒng),并向數(shù)據(jù)訪問(wèn)層提供數(shù)據(jù)服務(wù)。其特點(diǎn)是具備實(shí)時(shí)處理能力。
批處理系統(tǒng),是首先將數(shù)據(jù)進(jìn)行存儲(chǔ),再進(jìn)行計(jì)算和處理,在某些場(chǎng)景下時(shí)延較大。其存儲(chǔ)系統(tǒng)可選用HDFS 或HBase,對(duì)于冷數(shù)據(jù)可采取存入GlusterFS 的策略,以降低成本。常用的批處理系統(tǒng)通過(guò)ETL(Extraction TransformationL
OAding),即數(shù)據(jù)的提取、轉(zhuǎn)換和加載,然后利用OLAP(On- LineAnalytical Processing)技術(shù)對(duì)多維異構(gòu)數(shù)據(jù)進(jìn)行建模分析,也可以進(jìn)行更復(fù)雜的數(shù)據(jù)模型的建立。
Hadoop 批處理系統(tǒng)里面具體可利用組件包括最常用的MapReduce,以及Hive、Impala、Shark 等SQLon Hadoop,這些組件的靈活使用可以給下一層的數(shù)據(jù)挖掘模塊提供豐富的統(tǒng)一的結(jié)構(gòu)化數(shù)據(jù)基礎(chǔ)。
隨著移動(dòng)互聯(lián)網(wǎng)大數(shù)據(jù)處理技術(shù)的發(fā)展,相關(guān)技術(shù)也在不斷地發(fā)展和演進(jìn)中。如高效的分布式計(jì)算系統(tǒng)Spark,將中間數(shù)據(jù)存放在內(nèi)存中,提高迭代運(yùn)算效率,支持實(shí)時(shí)批計(jì)算。Pregel 計(jì)算模型,用于解決分布式圖計(jì)算問(wèn)題,繪制大量網(wǎng)上信息間的“圖形數(shù)據(jù)庫(kù)”,如網(wǎng)頁(yè)鏈接關(guān)系和社交關(guān)系圖等。
數(shù)據(jù)訪問(wèn)層重要的功能是抽取下層處理的結(jié)果數(shù)據(jù),屏蔽下層處理的復(fù)雜性,通過(guò)某種接口(如Restful API)提供給前端應(yīng)用接口進(jìn)行展現(xiàn),開(kāi)發(fā)應(yīng)用、提供服務(wù)。
2.2 實(shí)時(shí)數(shù)據(jù)挖掘技術(shù)
移動(dòng)互聯(lián)網(wǎng)大數(shù)據(jù)紛繁復(fù)雜,對(duì)不同的使用目的,有不同的實(shí)時(shí)數(shù)據(jù)挖掘技術(shù)。圖2 關(guān)注運(yùn)營(yíng)商對(duì)網(wǎng)絡(luò)的維護(hù)和業(yè)務(wù)推廣兩個(gè)重要功能,對(duì)無(wú)線網(wǎng)絡(luò)數(shù)據(jù)挖掘技術(shù)和應(yīng)用數(shù)據(jù)挖掘技術(shù)進(jìn)行了分析。
2.2.1 無(wú)線網(wǎng)絡(luò)數(shù)據(jù)挖掘技術(shù)
隨著移動(dòng)網(wǎng)絡(luò)的發(fā)展,網(wǎng)絡(luò)結(jié)構(gòu)變得比較復(fù)雜,體現(xiàn)在網(wǎng)元多、多種無(wú)線技術(shù)同時(shí)存在、網(wǎng)絡(luò)故障診斷困難、干擾用戶體驗(yàn)的因素很多等方面。無(wú)線網(wǎng)絡(luò)數(shù)據(jù)挖掘模塊,根據(jù)對(duì)無(wú)線網(wǎng)絡(luò)的理解,以及網(wǎng)絡(luò)中能夠產(chǎn)生的各類日志文件、信令采集系統(tǒng)、計(jì)費(fèi)信息、用戶簽約信息等系統(tǒng),綜合大數(shù)據(jù)分析,通過(guò)統(tǒng)計(jì)和數(shù)據(jù)挖掘,生成報(bào)表,并對(duì)外提供數(shù)據(jù)分析能力、開(kāi)放API。具體可以提供的信息包括:
圖2 實(shí)時(shí)數(shù)據(jù)挖掘技術(shù)
(1)網(wǎng)絡(luò)分析:包括全網(wǎng)的流量分析、會(huì)話和告警分析、漫游分析、網(wǎng)絡(luò)的使用變化趨勢(shì)分析、網(wǎng)絡(luò)性能KPI分析。
(2)網(wǎng)元分析:包括網(wǎng)元對(duì)比分析、網(wǎng)元組對(duì)比分析、網(wǎng)元時(shí)間變化趨勢(shì)分析、全網(wǎng)Cell 累計(jì)分布分析和RNC性能負(fù)載分析。
(3)終端分析:終端設(shè)備使用趨勢(shì)分析、終端設(shè)備每天小時(shí)時(shí)段變化趨勢(shì)的分析、終端設(shè)備的性能指標(biāo)分析等。
(4)用戶分析:用戶比較分析、無(wú)線共享路由用戶對(duì)比分析、無(wú)線共享路由用戶的資源使用、無(wú)線共享路由用戶的設(shè)備型號(hào)/操作系統(tǒng)構(gòu)成分析、用戶組的比較分析、全網(wǎng)用戶累積分布分析、單用戶時(shí)間變化趨勢(shì)分析等。
(5)應(yīng)用分析:應(yīng)用業(yè)務(wù)使用趨勢(shì)分析、應(yīng)用業(yè)務(wù)每天小時(shí)時(shí)段趨勢(shì)變化分析、指定終端設(shè)備類型上的TopN 應(yīng)用業(yè)務(wù)分析、應(yīng)用業(yè)務(wù)性能分析、應(yīng)用業(yè)務(wù)系統(tǒng)分組的性能KPI 分析、應(yīng)用業(yè)務(wù)組使用趨勢(shì)分析、應(yīng)用業(yè)務(wù)組每天小時(shí)時(shí)段趨勢(shì)變化分析。
(6)其他組合分析:各類QoS/QoE 指標(biāo)分析;不同緯度的用戶、業(yè)務(wù)、網(wǎng)絡(luò)狀況分析;各類網(wǎng)絡(luò)安全、負(fù)等統(tǒng)計(jì)和告警信息分析。
2.2.2 多媒體數(shù)據(jù)挖掘技術(shù)(見(jiàn)圖3)
圖3 多媒體數(shù)據(jù)挖掘技術(shù)
針對(duì)移動(dòng)互聯(lián)網(wǎng)中的用戶行為數(shù)據(jù),多媒體信息數(shù)據(jù)挖掘技術(shù),以典型的視頻應(yīng)用為例,其關(guān)鍵技術(shù)包括精準(zhǔn)的用戶畫像建立、視頻推薦、廣告投放等。
用戶畫像挖掘的基礎(chǔ)數(shù)據(jù)主要依賴用戶的視頻播放記錄、用戶注冊(cè)信息、搜索行為、社交行為數(shù)據(jù)等。其關(guān)鍵是通過(guò)大數(shù)據(jù)機(jī)器學(xué)習(xí)分類算法訓(xùn)練出一系列可泛化的模型,包括行業(yè)定向模型、性別模型、年齡段模型等。使用這些分類預(yù)測(cè)模型,對(duì)注冊(cè)用戶屬性信息和行為信息的數(shù)據(jù)清洗,之后合并形成原始訓(xùn)練用戶數(shù)據(jù)。對(duì)線上的匿名用戶的屬性進(jìn)行預(yù)測(cè)判斷,完善用戶畫像。
視頻推薦技術(shù)基于用戶行為數(shù)據(jù),定期計(jì)算視頻的熱度、視頻的新鮮度、用戶的長(zhǎng)期興趣和用戶的短期反饋數(shù)據(jù)。實(shí)時(shí)計(jì)算視頻內(nèi)容相似度、解析線上請(qǐng)求、了解推薦意圖、識(shí)別用戶ID。獲取推薦的候選列表,經(jīng)過(guò)合并、重排,過(guò)濾用戶已經(jīng)看過(guò)的視頻等工作,最后生成推薦給該用戶的個(gè)性化推薦結(jié)果。
通過(guò)建立更加完整的用戶畫像,實(shí)時(shí)挖掘視頻推薦的可能,為廣告主定制有針對(duì)性的人群定向模式,合理配置和優(yōu)化多媒體平臺(tái)的廣告資源,這些關(guān)鍵技術(shù)可以有效提高多媒體平臺(tái)的運(yùn)營(yíng)能力,以及精準(zhǔn)廣告的變現(xiàn)能力。
3.結(jié)束語(yǔ)
隨著移動(dòng)互聯(lián)網(wǎng)的發(fā)展,與其相關(guān)的大數(shù)據(jù)成為各方關(guān)注的焦點(diǎn)。本文分析了移動(dòng)互聯(lián)網(wǎng)大數(shù)據(jù)的潛在價(jià)值和面臨的挑戰(zhàn),總結(jié)了使用移動(dòng)互聯(lián)網(wǎng)大數(shù)據(jù)的關(guān)鍵技術(shù),包括移動(dòng)互聯(lián)網(wǎng)大數(shù)據(jù)的采集、數(shù)據(jù)存儲(chǔ)和分析、海量數(shù)據(jù)的深度挖掘與處理,同時(shí)分析了如何對(duì)海量數(shù)據(jù)進(jìn)行整合和呈現(xiàn),提供數(shù)據(jù)中的有效價(jià)值。希望這些分析能夠?yàn)橐苿?dòng)互聯(lián)網(wǎng)大數(shù)據(jù)的分析和應(yīng)用提供有益的借鑒。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.oesoe.com/
本文標(biāo)題:移動(dòng)互聯(lián)網(wǎng)大數(shù)據(jù)關(guān)鍵技術(shù)
本文網(wǎng)址:http://www.oesoe.com/html/solutions/14019318618.html