- +1
小寶專欄:史家還是蠢點好
上個月《上海書評》尼克的《計算歷史學》是篇抖機靈的聰明文章,漏洞不少。抖機靈必要賣弄刻薄,就像倚門調笑的小娼婦必要賣弄風騷,一賣弄難免有漏洞,這是題中應有之意,無傷聰明。比較遺憾的是作者后來自加按語把文章貼上社交媒體,征求嚴肅討論。這好比小娼婦大街上遛了一個彎不甘寂寞又自行征婚,妄想嫁入豪門,當然會惹惱正宮娘娘、三四五六七八九姨太。大伙兒一擁而上,恨不得活撕了小浪蹄子。作者挨磚是自找的。
先說說《計算歷史學》的漏洞。作者把“大數據和計算”——數學的一部分,歸到自然科學名下,明顯是欺人之談。簡單地講,數學和語言文字一樣,只是一種工具,自然科學能用,社會科學人文學科也能用。目前自然科學數學用得比較好,但保不準哪天社會科學人文學科后來居上,陳寅恪和陳景潤聯體,把數學研究所點對點地從中國科學院滲透到中國社科院。
歷史研究自然可以,或者說應該用到大數據。不過,任何一項研究,除非大數據變成全數據或者接近全數據,數據本身不會說話,無法直接產生有意義的結論。比如某國大選,事先如能準確地收集所有選民黨派立場和選舉意愿的數據,那就不用更多的分析和推理,統計結果就是結論。而人文課題史家研究根本無法得到這樣的大數據或全數據的支持,越是復雜的課題研究越難獲得直接的數據支持。如果把傳統的研究方法棄之不用,單練數學,你就必須建立數學模型,從有限的統計中進行推論,推論出新知識新思想。《計算歷史學》許為“神器”的詞頻統計,可以算是一個數學模型。
可惜的是,這個模型太簡單,毫無神奇可言。它簡單到推不出任何新的信息,最多只是給盡人皆知的常識加把柴。不用谷歌的三千萬冊圖書,美國人都知道,五十年前叫“黑鬼”的比較多,現在正式場合有書號的出版物不說“非裔美國人”冒叫“黑鬼”,差不多等于在中國否認釣魚島主權,不講政治到要吃官司。這件事不必Ngrams提醒。
作者自己設計的魯迅、巴金、金庸曲線則大成問題。這個所謂“文壇座次”是一個只發生在中文語境里的荒唐故事。你要收集數據,應該以中文資料為根據,外文圖書參考價值極其有限。你如果取本世紀中文互聯網的詞頻統計,我敢斷言,金庸肯定力壓魯郭茅巴老曹。以此為標準,郭敬明的座次也必然遠高于莎士比亞。無論莎士比亞的譯名是莎士比亞、還是沙士比亞、啥是逼呀、莎翁……加在一起都斗不過短短的小四。這個大數據、計算歷史學有什么意義?
假定學者的研究題目是“黑人寫作的文學貢獻”,Ngrams能幫什么忙?他要在學術上大放異彩,必須另起爐灶,設計一連串復雜的數學模型。且不說這些模型有多少設計障礙、拿谷歌三千萬冊圖書取樣是不是合理——迄今尚無成功先例。就算他最后絞盡腦汁完成建模,用傳統方法的同事可能已經為谷歌圖書館提供了十本新書——大數據時代的歷史研究不是更輕松,而是更復雜更困難。
作者最傷人的一段引文,大概是說歷史學家智商太低,否則歷史研究早已成為科學。這段話前半句我同意——智商的概念和測試方法本來就非常科學主義,要是智商考題改成茴香豆的幾種寫法,希特勒的哪本藏書里夾著一根黑毛……科學家未必能討好,后半句顯得智商很低——這段話就是歷史學家說的,他的智力確實有問題。
歷史研究和歷史寫作不科學,這毫無問題。史家作業的方向從來就不是科學。就像你說歷史研究不如東莞喜來登酒店157號小姐性感,這也是事實,但歷史研究從來沒有追求過性感。
歷史研究歷史寫作的基本標準只有一個:真實。史家要記錄、揭發、確認歷史的真相。在科學中,真實和真相的標準歧義叢生,難有定論——薛定諤的貓到底是死還是活?但史家要有一種低智商的頑固和愚蠢,一口咬住他認定的真相,死活不松口。這不是一個科學、技術的問題,更多有關史家的良知。
文天祥在《正氣歌》里為天地正氣排榜,名列榜首的就是史家:“在齊太史簡,在晉董狐筆。”春秋時齊國大夫崔杼殺了齊莊公,“太史書曰:‘崔杼弒其君’。崔子殺之”。老崔連殺了兩個太史,老三繼續寫,老崔放手了。晉靈公死于趙穿之手,大夫趙盾沒有處置趙穿,晉太史董狐記史:“趙盾弒其君。”
科學地看,齊太史、晉董狐的記載都有問題。齊莊公睡了崔杼的老婆,取死有道;趙盾并非弒主的兇手,難當其罪。但春秋時代的兩國史官,就是認定他們有弒君之罪,是元兇首惡,秉筆直書,從容殉職。這種一根筋認死理的勇敢,是中國的良史。它無關科學智商,卻代表了社會的道德智慧,代表了社會的良心。
中國現代史家當下的第一要務,不在學習計算機的聰明,而是要多少保持一點傳統良史的愚蠢。現代史家的油滑世故,已經讓暴君秦始皇大搖大擺地成了開天辟地的英雄帝王,希特勒會不會哪天被追認為國際主義友人?






- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司