|
2012-07-06 作者:俞京平 來源:中國經(jīng)濟(jì)時(shí)報(bào)
|
|
|
【字號(hào)
大
中
小】 |
近來,無數(shù)專家和媒體頻繁提到“大數(shù)據(jù)”時(shí)代已經(jīng)來臨,那么到底什么是大數(shù)據(jù),僅從字面來理解,大數(shù)據(jù)的主要特點(diǎn)就是“大”:除了以往傳統(tǒng)方法獲取的數(shù)據(jù)外,新的數(shù)據(jù)來源層出不窮源源不斷,形成一個(gè)隨時(shí)間變化的巨大數(shù)據(jù)流。這股數(shù)據(jù)流摧毀了當(dāng)前的數(shù)據(jù)監(jiān)測和研究行業(yè),也徹底顛覆了人們的理解和想象。 大數(shù)據(jù)何以如此之“大”?其“大”到底從何而來?要回答這個(gè)問題,首先需要了解數(shù)據(jù)的來源,這里所提到的數(shù)據(jù),出于企業(yè)營銷的角度,我們暫且狹義地理解為消費(fèi)者的行為數(shù)據(jù)。以往此類數(shù)據(jù)的獲取大致有以下幾種途徑:一是根據(jù)產(chǎn)品的銷量及其分布特征來了解;二是采用問卷調(diào)查的方法去獲取消費(fèi)者的行為及態(tài)度意見等;三是通過觀察或訪談去獲取消費(fèi)者行為數(shù)據(jù)。總而言之,在以往獲取數(shù)據(jù)的方法中,研究者占據(jù)主動(dòng)位置,消費(fèi)者比較被動(dòng)。 然而在大數(shù)據(jù)時(shí)代,消費(fèi)者已經(jīng)主動(dòng)或者不自覺地把自己的行為信息以數(shù)據(jù)方式留在某處,新媒體技術(shù)無時(shí)無刻不在悄悄記錄我們的行為信息,這些信息所形成的數(shù)據(jù)只等待有心人來收集、分析和研判。所以在一定程度上,大數(shù)據(jù)時(shí)代最主要的數(shù)據(jù)獲取方法是通過新技術(shù)手段進(jìn)行的悄無聲息的觀察和記錄,而通過這種方式獲取的信息總量,要遠(yuǎn)大于傳統(tǒng)方法收集的消費(fèi)者數(shù)據(jù)。同時(shí)在此過程中,消費(fèi)者更加主動(dòng)(雖然自己可能并未察覺),而研究者則被動(dòng)接收。 大數(shù)據(jù)時(shí)代得以形成,有賴于新媒體的飛速發(fā)展,比如微博每天產(chǎn)生的數(shù)據(jù)內(nèi)容,就遠(yuǎn)遠(yuǎn)大于以往研究產(chǎn)生的數(shù)據(jù)。我們可以通過某個(gè)人的微博內(nèi)容分析,去嘗試了解這個(gè)人的基本人口特征,以及其價(jià)值觀、消費(fèi)觀等,甚至可以在其個(gè)人微博中發(fā)現(xiàn)此人關(guān)注的各類品牌信息,以及對(duì)各品牌所持有的態(tài)度,所以大數(shù)據(jù)的價(jià)值是顯而易見的。 上述內(nèi)容還僅僅是橫向數(shù)據(jù)總量的不斷豐富和擴(kuò)大,除此之外,數(shù)據(jù)的縱向拓展也成就了大數(shù)據(jù)時(shí)代。我們可以把以往的調(diào)查或觀察數(shù)據(jù)看作是一個(gè)橫截面的研究,每個(gè)消費(fèi)者對(duì)應(yīng)一系列數(shù)據(jù)點(diǎn),這樣兩個(gè)坐標(biāo)軸共同構(gòu)筑了一幅二維平面圖。但是在新媒體時(shí)代,消費(fèi)者每時(shí)每刻的行為信息均加上了一個(gè)新的時(shí)間坐標(biāo)軸,把原來的二維平面變成了一個(gè)三維空間,這個(gè)三維空間的數(shù)據(jù)總量肯定遠(yuǎn)遠(yuǎn)大于原來的二維空間,這也是新媒體導(dǎo)致大數(shù)據(jù)時(shí)代到來的證明。 中國古時(shí)以“羊大”為美,今天以數(shù)據(jù)量“大”就是“好”嗎?恐怕事實(shí)并非如此。這就好比大海撈針,如果你知道針掉下去的位置以及海水的流動(dòng)方向,那么在這個(gè)范圍內(nèi)經(jīng)過測算再去撈針顯然更靠譜,它遠(yuǎn)比從整個(gè)大海中一點(diǎn)點(diǎn)搜索要更高效。大數(shù)據(jù)時(shí)代也是如此,我們真正需要的其實(shí)并不是大數(shù)據(jù)本身,而是這個(gè)大數(shù)據(jù)背后隱藏的我們想要獲取的情報(bào)性信息,而這樣的信息可能只占總體的萬分之一,我們需要的只是這萬分之一,其他大量信息對(duì)我們而言都是垃圾。從這個(gè)角度出發(fā),數(shù)據(jù)量越大,其中垃圾信息也就越多,這些令人眼花繚亂的垃圾信息,把我們真正想要的信息給深深地埋在數(shù)據(jù)洪流之中。 這就是今天輿情監(jiān)測行業(yè)面臨的困境,筆者見過無數(shù)的輿情監(jiān)測服務(wù)商,得意洋洋地夸口自己可以監(jiān)測海量的信息來源,以及每天或每分鐘可以抓取無比龐大的信息內(nèi)容,更有一些輿情監(jiān)測機(jī)構(gòu)開始競爭誰的監(jiān)測覆蓋面更廣等。而這恰恰是輿情監(jiān)測的誤區(qū)之一,在對(duì)以往輿情信息來源毫無了解的情況下,未經(jīng)前期調(diào)研規(guī)劃的輿情監(jiān)測,獲取的信息量越大,得到的垃圾信息就越多。 所以輿情監(jiān)測并不是想當(dāng)然的那么簡單,它需要經(jīng)歷監(jiān)測源的調(diào)研規(guī)劃、監(jiān)測源的管理及權(quán)重賦值、監(jiān)測信息及其屬性的抓取、輿情數(shù)據(jù)的分析挖掘和研判、輿情應(yīng)對(duì)策略建議及應(yīng)對(duì)效果評(píng)估這樣一個(gè)系列的流程環(huán)節(jié),而不僅僅是要求抓取的信息量越大越好。在這樣的流程體系中,輿情監(jiān)測源的前期調(diào)研規(guī)劃作為第一環(huán)節(jié)顯得尤其重要,它直接決定著數(shù)據(jù)獲取的速率以及抓取信息的有效性、可用性。所以不同的輿情監(jiān)測項(xiàng)目,其監(jiān)測范圍應(yīng)該有所不同。
大數(shù)據(jù)時(shí)代的到來帶給我們的另一個(gè)啟示是,輿情監(jiān)測業(yè)務(wù)之間的合作應(yīng)該大于競爭。假設(shè)企業(yè)A在做輿情監(jiān)測,企業(yè)B也在做輿情監(jiān)測,如果兩家監(jiān)測能夠按上述所言做好前期調(diào)研規(guī)劃,那么兩者所獲取的監(jiān)測內(nèi)容重合度應(yīng)該比較低,所以兩者之間并不存在激烈的競爭關(guān)系。相反,如果企業(yè)A、企業(yè)B、企業(yè)C……多家企業(yè)把監(jiān)測獲取的信息內(nèi)容數(shù)據(jù)庫聯(lián)合起來,則形成了一個(gè)比較完整的行業(yè)數(shù)據(jù)庫。換一種思路來理解,也就是說如果多家企業(yè)可以聯(lián)合建立一個(gè)共享的輿情監(jiān)測內(nèi)容數(shù)據(jù)庫,每家企業(yè)從中篩選過濾出自己所需內(nèi)容即可,這樣既降低了成本,又提高了精確性,其多方共贏的優(yōu)勢就能顯現(xiàn)出來。 大數(shù)據(jù)時(shí)代顯然給我們帶來不少便利之處,但是在盲目的歡呼和一時(shí)的激動(dòng)之后,我們更需要認(rèn)真反思如何正確挖掘出大數(shù)據(jù)的最大效用,以便我們?cè)诖髷?shù)據(jù)的海洋里游刃有余,而不是被大數(shù)據(jù)洪流沖擊得迷失了方向。
近來,無數(shù)專家和媒體頻繁提到“大數(shù)據(jù)”時(shí)代已經(jīng)來臨,那么到底什么是大數(shù)據(jù),僅從字面來理解,大數(shù)據(jù)的主要特點(diǎn)就是“大”:除了以往傳統(tǒng)方法獲取的數(shù)據(jù)外,新的數(shù)據(jù)來源層出不窮源源不斷,形成一個(gè)隨時(shí)間變化的巨大數(shù)據(jù)流。這股數(shù)據(jù)流摧毀了當(dāng)前的數(shù)據(jù)監(jiān)測和研究行業(yè),也徹底顛覆了人們的理解和想象。
大數(shù)據(jù)何以如此之“大”?其“大”到底從何而來?要回答這個(gè)問題,首先需要了解數(shù)據(jù)的來源,這里所提到的數(shù)據(jù),出于企業(yè)營銷的角度,我們暫且狹義地理解為消費(fèi)者的行為數(shù)據(jù)。以往此類數(shù)據(jù)的獲取大致有以下幾種途徑:一是根據(jù)產(chǎn)品的銷量及其分布特征來了解;二是采用問卷調(diào)查的方法去獲取消費(fèi)者的行為及態(tài)度意見等;三是通過觀察或訪談去獲取消費(fèi)者行為數(shù)據(jù)。總而言之,在以往獲取數(shù)據(jù)的方法中,研究者占據(jù)主動(dòng)位置,消費(fèi)者比較被動(dòng)。
然而在大數(shù)據(jù)時(shí)代,消費(fèi)者已經(jīng)主動(dòng)或者不自覺地把自己的行為信息以數(shù)據(jù)方式留在某處,新媒體技術(shù)無時(shí)無刻不在悄悄記錄我們的行為信息,這些信息所形成的數(shù)據(jù)只等待有心人來收集、分析和研判。所以在一定程度上,大數(shù)據(jù)時(shí)代最主要的數(shù)據(jù)獲取方法是通過新技術(shù)手段進(jìn)行的悄無聲息的觀察和記錄,而通過這種方式獲取的信息總量,要遠(yuǎn)大于傳統(tǒng)方法收集的消費(fèi)者數(shù)據(jù)。同時(shí)在此過程中,消費(fèi)者更加主動(dòng)(雖然自己可能并未察覺),而研究者則被動(dòng)接收。
大數(shù)據(jù)時(shí)代得以形成,有賴于新媒體的飛速發(fā)展,比如微博每天產(chǎn)生的數(shù)據(jù)內(nèi)容,就遠(yuǎn)遠(yuǎn)大于以往研究產(chǎn)生的數(shù)據(jù)。我們可以通過某個(gè)人的微博內(nèi)容分析,去嘗試了解這個(gè)人的基本人口特征,以及其價(jià)值觀、消費(fèi)觀等,甚至可以在其個(gè)人微博中發(fā)現(xiàn)此人關(guān)注的各類品牌信息,以及對(duì)各品牌所持有的態(tài)度,所以大數(shù)據(jù)的價(jià)值是顯而易見的。
上述內(nèi)容還僅僅是橫向數(shù)據(jù)總量的不斷豐富和擴(kuò)大,除此之外,數(shù)據(jù)的縱向拓展也成就了大數(shù)據(jù)時(shí)代。我們可以把以往的調(diào)查或觀察數(shù)據(jù)看作是一個(gè)橫截面的研究,每個(gè)消費(fèi)者對(duì)應(yīng)一系列數(shù)據(jù)點(diǎn),這樣兩個(gè)坐標(biāo)軸共同構(gòu)筑了一幅二維平面圖。但是在新媒體時(shí)代,消費(fèi)者每時(shí)每刻的行為信息均加上了一個(gè)新的時(shí)間坐標(biāo)軸,把原來的二維平面變成了一個(gè)三維空間,這個(gè)三維空間的數(shù)據(jù)總量肯定遠(yuǎn)遠(yuǎn)大于原來的二維空間,這也是新媒體導(dǎo)致大數(shù)據(jù)時(shí)代到來的證明。
中國古時(shí)以“羊大”為美,今天以數(shù)據(jù)量“大”就是“好”嗎?恐怕事實(shí)并非如此。這就好比大海撈針,如果你知道針掉下去的位置以及海水的流動(dòng)方向,那么在這個(gè)范圍內(nèi)經(jīng)過測算再去撈針顯然更靠譜,它遠(yuǎn)比從整個(gè)大海中一點(diǎn)點(diǎn)搜索要更高效。大數(shù)據(jù)時(shí)代也是如此,我們真正需要的其實(shí)并不是大數(shù)據(jù)本身,而是這個(gè)大數(shù)據(jù)背后隱藏的我們想要獲取的情報(bào)性信息,而這樣的信息可能只占總體的萬分之一,我們需要的只是這萬分之一,其他大量信息對(duì)我們而言都是垃圾。從這個(gè)角度出發(fā),數(shù)據(jù)量越大,其中垃圾信息也就越多,這些令人眼花繚亂的垃圾信息,把我們真正想要的信息給深深地埋在數(shù)據(jù)洪流之中。
這就是今天輿情監(jiān)測行業(yè)面臨的困境,筆者見過無數(shù)的輿情監(jiān)測服務(wù)商,得意洋洋地夸口自己可以監(jiān)測海量的信息來源,以及每天或每分鐘可以抓取無比龐大的信息內(nèi)容,更有一些輿情監(jiān)測機(jī)構(gòu)開始競爭誰的監(jiān)測覆蓋面更廣等。而這恰恰是輿情監(jiān)測的誤區(qū)之一,在對(duì)以往輿情信息來源毫無了解的情況下,未經(jīng)前期調(diào)研規(guī)劃的輿情監(jiān)測,獲取的信息量越大,得到的垃圾信息就越多。
所以輿情監(jiān)測并不是想當(dāng)然的那么簡單,它需要經(jīng)歷監(jiān)測源的調(diào)研規(guī)劃、監(jiān)測源的管理及權(quán)重賦值、監(jiān)測信息及其屬性的抓取、輿情數(shù)據(jù)的分析挖掘和研判、輿情應(yīng)對(duì)策略建議及應(yīng)對(duì)效果評(píng)估這樣一個(gè)系列的流程環(huán)節(jié),而不僅僅是要求抓取的信息量越大越好。在這樣的流程體系中,輿情監(jiān)測源的前期調(diào)研規(guī)劃作為第一環(huán)節(jié)顯得尤其重要,它直接決定著數(shù)據(jù)獲取的速率以及抓取信息的有效性、可用性。所以不同的輿情監(jiān)測項(xiàng)目,其監(jiān)測范圍應(yīng)該有所不同。
大數(shù)據(jù)時(shí)代的到來帶給我們的另一個(gè)啟示是,輿情監(jiān)測業(yè)務(wù)之間的合作應(yīng)該大于競爭。假設(shè)企業(yè)A在做輿情監(jiān)測,企業(yè)B也在做輿情監(jiān)測,如果兩家監(jiān)測能夠按上述所言做好前期調(diào)研規(guī)劃,那么兩者所獲取的監(jiān)測內(nèi)容重合度應(yīng)該比較低,所以兩者之間并不存在激烈的競爭關(guān)系。相反,如果企業(yè)A、企業(yè)B、企業(yè)C……多家企業(yè)把監(jiān)測獲取的信息內(nèi)容數(shù)據(jù)庫聯(lián)合起來,則形成了一個(gè)比較完整的行業(yè)數(shù)據(jù)庫。換一種思路來理解,也就是說如果多家企業(yè)可以聯(lián)合建立一個(gè)共享的輿情監(jiān)測內(nèi)容數(shù)據(jù)庫,每家企業(yè)從中篩選過濾出自己所需內(nèi)容即可,這樣既降低了成本,又提高了精確性,其多方共贏的優(yōu)勢就能顯現(xiàn)出來。
大數(shù)據(jù)時(shí)代顯然給我們帶來不少便利之處,但是在盲目的歡呼和一時(shí)的激動(dòng)之后,我們更需要認(rèn)真反思如何正確挖掘出大數(shù)據(jù)的最大效用,以便我們?cè)诖髷?shù)據(jù)的海洋里游刃有余,而不是被大數(shù)據(jù)洪流沖擊得迷失了方向。
|
|
凡標(biāo)注來源為“經(jīng)濟(jì)參考報(bào)”或“經(jīng)濟(jì)參考網(wǎng)”的所有文字、圖片、音視頻稿件,及電子雜志等數(shù)字媒體產(chǎn)品,版權(quán)均屬經(jīng)濟(jì)參考報(bào)社,未經(jīng)經(jīng)濟(jì)參考報(bào)社書面授權(quán),不得以任何形式刊載、播放。 |
|
|
|