大數(shù)據(jù)平臺是從各種各樣類型的、漫無邊際的數(shù)據(jù)中,快速獲得有價值信息的處理方法或框架。大數(shù)據(jù)中的“大”不是大數(shù)據(jù)的唯一指標,而是更強調(diào)數(shù)據(jù)的類型多樣、處理的速度和獲取價值的能力。分析人士表示,大數(shù)據(jù)對傳統(tǒng)行業(yè)的重構(gòu)有望成為中國經(jīng)濟新一輪快速發(fā)展的關(guān)鍵推動力,IT業(yè)、移動互聯(lián)網(wǎng)、交運和電力安全設(shè)備生產(chǎn)商等四類行業(yè)受益明顯。
數(shù)據(jù)來自計算機和網(wǎng)絡(luò)
現(xiàn)在各行業(yè)的企業(yè)都承受著越來越大的壓力,需要從爆炸式增長的現(xiàn)有數(shù)據(jù)中提取出新的產(chǎn)業(yè)商機。對電信行業(yè)而言,全球手機用戶數(shù)量已經(jīng)達到60億,用戶需要獨特和個性化的產(chǎn)品來體現(xiàn)他們的個人風格。金融服務(wù)行業(yè)中,華爾街各家公司每分鐘能生成5份新研究報告。此外,由于零售商沒能了解顧客需求、盲目進貨而導(dǎo)致的銷售損失,每年達到約1000億美元。
數(shù)據(jù)是平臺運營商的重要資產(chǎn),可能提供API接口允許第三方有限度地使用,但是顯然是為了增強自身的業(yè)務(wù),與此目的抵觸的行為都會受到約束,同時,也是大數(shù)據(jù)應(yīng)用的基礎(chǔ)和前提。
收集數(shù)據(jù)主要是通過計算機和網(wǎng)絡(luò)。凡是經(jīng)過計算機處理的數(shù)據(jù)都很容易收集,比如瀏覽器里的搜索、點擊、網(wǎng)上購物、其他數(shù)據(jù)(比如氣溫、海水鹽度、地震波)可以通過傳感器轉(zhuǎn)化成數(shù)字信號輸入計算機。
收集到的數(shù)據(jù)一般要先經(jīng)過整理,常用的軟件:Tableau和Impure是功能比較全面的,Refine和Wrangler是比較純粹的數(shù)據(jù)整理工具,Weka用于數(shù)據(jù)挖掘。Hadoop是一個能夠?qū)Υ罅繑?shù)據(jù)進行分布式處理的軟件框架。用于統(tǒng)計分析的R語言有個擴展R+Hadoop,可以在Hadoop集群上運行R代碼。還有很多可以用來在網(wǎng)頁上實現(xiàn)可視化輸出的框架或者控件。大致基于四種技術(shù):Flash(Flex)或者JS(HTML5)或者Java或者ASP.NET(Silverlight)。
大數(shù)據(jù)帶來四行業(yè)新機遇
進入大數(shù)據(jù)時代,都有哪些存在新機遇呢?分析人士認為,大數(shù)據(jù)時代主要有四類行業(yè)明顯受益。首先,受益最明顯的當屬IT業(yè)。數(shù)據(jù)顯示,2012年大數(shù)據(jù)對全球IT開支的直接或間接推動達960億美元,而到2016年,這一數(shù)字預(yù)計將達到2320億美元。據(jù)國內(nèi)有關(guān)機構(gòu)初步預(yù)算,未來中國大數(shù)據(jù)潛在市場規(guī)模有望近2萬億元,將給IT行業(yè)開拓了一個新的黃金時代。
其次,移動互聯(lián)網(wǎng)行業(yè)。以騰訊、阿里巴巴、百度、奇虎360等為代表的互聯(lián)網(wǎng)公司目前已經(jīng)形成了與傳統(tǒng)電信運營商價值鏈重新劃分的格局,使得運營商的角色正在不知不覺中發(fā)生著變化。傳統(tǒng)運營商所提供的服務(wù)類型已經(jīng)從單一的話音結(jié)合少量的數(shù)據(jù)通訊,向多媒體、IPTV等多業(yè)務(wù)疊加模式演變。
第三,交通運輸業(yè)。隨著城市的迅速發(fā)展,交通擁堵、交通污染日益嚴重,交通事故頻繁發(fā)生,這些都是各大城市亟待解決的問題。智能交通成為改善城市交通的關(guān)鍵所在。為此,及時、準確獲取交通數(shù)據(jù)并構(gòu)建交通數(shù)據(jù)處理模型是建設(shè)智能交通的前提,而這一難題可以通過大數(shù)據(jù)技術(shù)得到解決。無論是交通基礎(chǔ)設(shè)施、交通運行狀態(tài)還是交通服務(wù)對象和交通運載工具,每時每刻都在產(chǎn)生著大量的數(shù)據(jù),以大數(shù)據(jù)的思路和角度來看,這些都是正待挖掘的寶藏,能為交通決策和服務(wù)帶來新的解題思路。
第四、電力信息安全設(shè)備生產(chǎn)商受益。近日,電力行業(yè)信息安全類“招標競賽”正在火熱上演,全國多家電網(wǎng)公司相繼在信息安全設(shè)備采購招標項目上亮出大手筆投資,采購內(nèi)容涉及數(shù)據(jù)丟失防護、數(shù)據(jù)恢復(fù)、數(shù)據(jù)清除等眾多軟硬件產(chǎn)品,部分采購項目甚至達到上億元的規(guī)模,新一輪大規(guī)模電力系統(tǒng)信息安全建設(shè)浪潮撲面而來。