涂子沛先生所著的這部大作,是大數(shù)據(jù)時代的應時之作。
他將數(shù)據(jù)用在管理和研究方面的發(fā)展史,以其在美國的發(fā)展過程,作為主要內容。他從美國開國時期的人口普查,作為起點,討論民主制度如何經(jīng)過數(shù)據(jù)的調查,才能發(fā)展成為“一人一票”的制度。接著,19世紀中葉,美國向西開發(fā),美國的工程兵團,進行丈量和調查,使美國的地理狀況和疆域,都有明白的依據(jù)。20世紀,“打孔”的計算方法,開創(chuàng)了后世計算器管理大量數(shù)據(jù)的技術。到今天,我們日常生活中,因為計算機和網(wǎng)絡的普及,無處沒有數(shù)據(jù)的存在。以我老病人為例,疾病的性質,或藥物的效果,都必須靠大量的數(shù)據(jù),作為診斷和治療的依據(jù)。凡此,都是數(shù)據(jù)的使用。
美國的社會愈來愈復雜,資本主義的國家,證券交易乃是一樁大事。單單用統(tǒng)計來管理證券,已經(jīng)不太夠用。大概在最近30來年,許多大證券商,為了要預測經(jīng)濟的起落和某一種產(chǎn)業(yè)的興衰,大量地使用不同產(chǎn)業(yè)之間的關系,也顧及國際貿(mào)易的情形。這些私營的企業(yè)界,幾乎都能相當精準地判斷市場的情形。于是,管理證券交易的美聯(lián)儲,實際上就是美國的中央銀行,也必須更細密地運用許多數(shù)據(jù),以掌握經(jīng)濟的全貌,然后再決定對市場供應的貨幣是從寬還是從緊。這才是“大數(shù)據(jù)”的第一次使用。
中國古代兵書《孫子兵法》就說過:“算則勝,不算則不勝;多算勝,少算則不勝。”此處的“算”字,就是如何利用數(shù)字,來估計各種因素。一個能干的將領,打一次戰(zhàn)役,要考慮到天時、地利、人和,這都是可以用數(shù)字表現(xiàn)的。但是,一個治國的領袖,在上述因素以外,還得考慮許多其他的條件。1942年,日本偷襲珍珠港,以為可以一棒打死美國。他們沒算到,美國工業(yè)的實力,有充分的再生力量,三個月之內,美國立刻就能恢復足夠的海空實力。這就是日本軍人,只知道計算戰(zhàn)役,不會計算戰(zhàn)爭。到今天,安倍野心勃勃,處處挑釁,他志在日本復興。他的計算,大概又是計算自己現(xiàn)在的兵力和科技能力;他沒有算到,自己的原料供應不夠,能源不能自主,人口結構老化:這就是“算”得不夠。
“大數(shù)據(jù)”之“大”,就在于將各種分散的數(shù)據(jù),彼此聯(lián)系,由點而線,由線而面,由面而層次,以瞻見更完整的覆蓋面,也更清楚地理解事物的本質和未來的取向。人腦的結構,足夠發(fā)揮聯(lián)想力和推論。我們每天的日常生活,時時刻刻在不知不覺中,做“大數(shù)據(jù)”的工作,將許多因素綜合在一起,作為行動和決定的依據(jù)。只是一個國家或一個社會的發(fā)展,不能全靠眼睛看得見的一些訊息,有許多事物,必須依靠全面和長期的發(fā)展情況,才能真實地反映當時一切決定的背景和條件。
今天信息科學的發(fā)展,已經(jīng)能夠產(chǎn)生、存儲并實時地分析處理大量的信息,整合多個源頭的數(shù)據(jù),形成全面的多項關系,指出線性的發(fā)展方向,引導我們有廣闊的視野。計算機今天處理數(shù)據(jù)的能力和速度,已經(jīng)超過最聰明的個人。可是,用計算機的還是“人”,如何駕馭這些數(shù)字,還是“人”在設計。只是,我們必須要有此認識:今天的世界,已經(jīng)千絲萬縷,將各地、各種行業(yè)、各種條件,糾纏成一個復雜的全球網(wǎng)絡。管理大企業(yè)和管理國家,必須要有足夠的信息,了解多種多樣的情況,以全面地理解各種問題及其彼此的關聯(lián)。即使是對個人而言,因為越來越多的行為已經(jīng)轉變?yōu)殡娮踊挠涗洠渖钜埠痛髷?shù)據(jù)息息相關。“大數(shù)據(jù)”這個課題,十分重要,我盼望有更多的學者,在這方面提出更多的作品。
涂子沛先生的大作,是討論大數(shù)據(jù)較早的中文作品;在此以前,還罕見討論數(shù)據(jù)為管理方式的書籍。這本書,主要是以美國社會中數(shù)據(jù)的使用為例。我知道他一心想用這些例子,提醒中國的讀者:在信息科學高度發(fā)展的今天,我們不能再忽略數(shù)據(jù)的使用。涂子沛先生開啟了一道大門,我相信,后面會有更多的開展,讓大家進入這一個重要的現(xiàn)代文化園地。
(著名歷史學家、美國匹茲堡大學歷史系榮譽講座教授)