因為關注大數(shù)據(jù),也寫過若干關于大數(shù)據(jù)的文章,做過若干關于大數(shù)據(jù)的演講,所以對有關這一主題的論文和書籍非常有興趣。過去幾年,在這方面讀過十幾本書,上百篇論文和文章。相對而言,舍恩伯格的《大數(shù)據(jù)時代》是迄今為止我讀過的最好的一本專著,中英文都算上。
此書的一大貢獻是在大數(shù)據(jù)方興未艾,眾說紛紜的時刻,進一步闡述和厘清了大數(shù)據(jù)的基本概念和特點,這對許多以為大數(shù)據(jù)就是數(shù)據(jù)大的人來說很有幫助。
在人類歷史長河中,即使是現(xiàn)代社會日新月異的發(fā)展中,人們還主要是依賴抽樣數(shù)據(jù),局部數(shù)據(jù),片面數(shù)據(jù),甚至是在無法獲得實證數(shù)據(jù)的時候純粹依賴經(jīng)驗,理論,假設和價值觀去發(fā)現(xiàn)未知領域的規(guī)律。所以,人們對世界的認識往往是表面的,膚淺的,簡單的,扭曲的或者是無知的。舍恩伯格指出,大數(shù)據(jù)時代的來臨使人類第一次有機會和條件在非常多的領域和非常深入的層次獲得和使用全面數(shù)據(jù),完整數(shù)據(jù)和系統(tǒng)數(shù)據(jù),深入探索現(xiàn)實世界的規(guī)律,獲取過去不可能獲取的知識,得到過去無法企及的商機。
由于大數(shù)據(jù)的出現(xiàn),使得通過數(shù)據(jù)分析獲得知識,商機和社會服務能力從以往局限于少數(shù)象牙塔之中的學術精英圈子擴大到普通的機構,企業(yè)和政府部門。門檻的降低直接導致了數(shù)據(jù)的容錯率提高,成本的降低,但正如舍恩伯格所強調的,最重要的是人們可以從對于因果關系的追求中在很大程度上解脫出來,轉而將注意力放在相關關系的發(fā)現(xiàn)和使用上。只要發(fā)現(xiàn)兩個現(xiàn)象之間存在顯著相關性就可以創(chuàng)造巨大的經(jīng)濟或社會效益,而弄清二者為什么相關可以留待學者們慢慢研究。大數(shù)據(jù)之所以可能成為一個“時代”,在很大程度上是因為這是一個可以由社會各界廣泛參與,八面出擊,處處結果的社會運動,而不僅僅是少數(shù)專家學者的研究對象。
大數(shù)據(jù)將逐漸成為現(xiàn)代社會的基礎設施的一部分,和公路、鐵路、港口、水電和通訊網(wǎng)絡一樣不可或缺。但就其價值特性而言,大數(shù)據(jù)卻和這些物理化的基礎設施不同,不會因為人們的使用而折舊和貶值。例如,一組DNA可能會死亡或毀滅,但數(shù)據(jù)化的DNA卻永存。所以,舍恩伯格贊同許多物理學家的看法,世界的本質就是數(shù)據(jù)。因此,大數(shù)據(jù)時代的經(jīng)濟學,政治學,社會學和許多科學門類會發(fā)生巨大的甚至是本質上的變化和發(fā)展,進而影響人類的價值體系,知識體系和生活方式。哲學史上爭論不休的世界可知論和不可知論將會轉變?yōu)閷嵶C科學中的具體問題。可知性是絕對的,無事無物不可知;不可知性是相對的,是尚未知道的意思。
對于不是網(wǎng)絡業(yè),IT業(yè)和從事數(shù)據(jù)分析和使用的讀者,本書的一大好處是通俗易懂,通過具體實例說明問題,有助于人們的理解和聯(lián)想。在時限上,作者概括了直到2012年7月大數(shù)據(jù)方向上的最新發(fā)展,避免了許多同類作品中存在的例證過于陳舊,視野相對狹窄的毛病。
作為一位生活在歐美現(xiàn)代社會中的學者,舍恩伯格是把民主,開放和理性作為已知前提討論大數(shù)據(jù)革命的。這對生活在發(fā)展中國家,社會現(xiàn)代化程度有限的讀者來說,也許是個遺憾,因為書中描述的許多已經(jīng)發(fā)生的事例可能更像是神話。沒有市場經(jīng)濟制度和法治體系作為基礎支撐,大數(shù)據(jù)很可能成為發(fā)達國家在下一輪全球化競爭中的利器,而發(fā)展中國家依然處于被動依附的狀態(tài)之中。整個世界可能被割裂為大數(shù)據(jù)時代,小數(shù)據(jù)時代和無數(shù)據(jù)時代。
處于發(fā)展中國家前列的中國,目前正面臨著一個重大的歷史抉擇關口。應該說,在過去三十余年的時間里,中國在快速走向工業(yè)化,信息化,網(wǎng)絡化方面交出了一份不錯的成績單。適逢世界走向數(shù)據(jù)化,邁入大數(shù)據(jù)時代的時刻,無論對個人,企業(yè),還是對社會和國家,都有認真理解,嚴肅決策的必要性和緊迫性。哪怕僅從這一點考慮,讀讀這本書是很值得的。