▓成人丝瓜视频▓无码免费,99精品国产一区二区三区不卡 ,大长腿白丝被c到爽哭视频 ,高清无码内谢

澎湃Logo
下載客戶端

登錄

  • +1

思勉思想節|關于全球視野下的數字人文:研究與實踐

王曉光(武漢大學教授、數字人文研究中心主任)
2019-04-18 15:01
來源:澎湃新聞
? 思想市場 >
字號

4月17日下午,武漢大學教授、數字人文研究中心主任王曉光在華東師大閔行校區圖書館做了“全球視野下的數字人文:研究與實踐”的演講,從數字人文的時代興起的背景談起,解釋相關概念、研究對象、研究方法和工具、發展趨勢等,最后談到了在大數據時代關于人文社科研究路徑創新的問題。該演講系華東師范大學第五屆思勉人文思想節的系列名家演講活動中的一場,由華東師范大學中文系教授、圖書館館長胡曉明主持。以下系演講現場實錄稿節選。(澎湃新聞實習記者 潘體芳)

武漢大學教授、數字人文研究中心主任王曉光在華東師大閔行校區圖書館做了“全球視野下的數字人文:研究與實踐”的演講

數字人文興起的時代背景

自然科學和社會科學主要是揭示研究對象的基本性質和規律,研究的目的是為了獲得對象的普遍知識。但是人文學科更關心人的生存及其意義,更關心的是人的價值存在和價值實現。柏拉圖說我們要建設理想和美好的社會,但是理想和美好的社會是什么樣的?并不是規律,是我們探索的過程,而且不同的學者的認知、目標是有差別的。

2005年美國總統信息技術咨詢委員會(PITAC)發布的報告中,提出計算機科學雖然本身就是一門學科,但是這門學科可以促進其他學科的發展,而且21世紀在經濟上最有前途的研究前沿,都有可能通過熟練掌握的先進計算機技術并且運用技術得到解決,計算思維、計算技術的發展可以整體上推動美國所有學科的發展,保證它全方位的競爭力。不僅僅是在信息產業上的競爭力,計算有賦能的作用,可以賦予其他學科更大的能力。

我們現在關心的是怎樣利用計算思維來和其他思維一起推動思維的進步,以及解決問題方式的進步。今天的計算機技術是上個世紀40年代開始發展的,60年代有了數據庫,80年代有了互聯網,90年代有了物聯網,21世紀有了大數據,人工智能發展了,技術在不斷進步,在進步的同時我們的理念在創新,技術不僅僅作為富有的賦能,還帶來了人的思維改變。此外還有知識共享和開源。今天軟件開發開源的思想是非常重要的,像谷歌公司把最重要的算法開源了,推動了算法不斷迭代更新。還有大眾的協同,比如維基百科,知識生產讓每個人都能參與進來,而不僅僅是專家。還有人機協同,今天人工智能發展,未來人將會跟機器協同處理各種工作。

技術的進步同時,人的思維理念也在進步。在自然科學領域,計算機徹底改變了自然科學研究的面貌。自然科學領域里對于計算機的技術已經有相當深刻的運用,比如美國高校的化學研究,現在第一步就是做計算,用高性能計算機做模擬分析,篩選出幾百個或者幾十個分子式,再做傳統的化學實驗,而不是先做實驗再計算。

在社會科學領域,研究怎么樣利用計算機建模模擬和分析各種各樣社會現象?怎么樣利用計算機數據分析來做?用計算機和大數據來做,計算機相關技術已經在改變社科研究的基本過程。到了互聯網時代,大量依靠大數據來做研究,比如傳播研究領域用社交媒體來做,用社交媒體推特上的數據,而不是抽樣的小樣樣本做社會關系方面的研究。

人文學科雖然關注的是個體、群體以及社會整體的精神或意義世界,但是這不意味著人文學術和知識生產活動不會受到技術的影響。有些學者尤其是資深老牌學者,可能對技術有一定抵觸,但是我們發現人文學術研究不可能離開技術的影響,因為人文學科生產的知識成果,直接表現為各種形式化的符號,如文字、圖像、聲音、視頻。

信息技術改變了目前的信息環境,信息化環境帶來了互聯網、帶來了大數據,人文知識的表現樣式也被改變了。信息技術已經在改變人文學術具體研究對象,研究對象很多時候就是符號,以及符號上承載的思想,進而通過改變、通過影響符號而影響整個人文學術的流程,所以人文學科的數字化轉型,是社會數字化轉型的重要的組成部分。但是在轉型之中,我們必須要明白到底人文學科里面什么東西沒有改變?人文學科的終極目標會否改變?會不會因為數字化影響發生改變?對于這個問題我們必須保持高度的警戒。

什么是數字人文

數字人文在最早的時候稱之為人文計算,追溯到1949年意大利神父羅伯托布薩在IBM公司幫助下對神學家托馬斯的研究工作。當年對于托馬斯的作品使用的還是傳統的計算機,拿的是傳統的卡片,有500份,成本相當昂貴。到了1954年,出現了磁帶,開始做遷移,轉移到了磁帶上,數據量達到了1500多萬的數字量。

我們發現,人文計算的起點就是文獻資料的電子化。電子技術把印刷的東西開始進行電子化,不僅改變了人們獲取資料的方式,也改變了使用的方式。

計算機科學家說,使用的工具影響了思維方式和思維習慣,也將深刻影響我們的思維能力。在我們使用印刷術的時候和使用電子技術的時候,看起來好象是資料的一種改變,實際上在改變我們的思維,在改變我們的思維能力,這種認識就逐漸地推動了人文計算思維的發展。怎么樣利用計算機技術來解決和發現人文問題,并解決人文問題新的思維模式,導致人文計算的產生。人文計算理念首先在于語言學,在此之后逐漸向其他領域擴展,向歷史、藝術、音樂、宗教其他人文學科開始擴散。不僅僅是技術的擴散,實際上是思維模式的擴散。從人文計算到數字人文,這個詞匯有變化的過程,西方在1980年代的時候一直用的是人文計算,從2004年開始,我們改變了話語。話語的改變有時候蘊含著一種思想的改變,計算這個詞聽起來對于人文學科來說有點刺耳,一直強調的是思想怎么計算有點刺耳。

數字人文研究什么?

數字人文研究什么?數字人文是計算或者數字技術和人文學科的交叉點,包括的是系統化使用數字資源。在人文研究領域里面使用數字資源,一方面包括數據,另一方面包括各種各樣數字化工具,以及對這個過程的反思性的行為。數字人文宣言中也進行了嘗試性的定義:用一種新的從事學術的方式(強調的是協作、跨學科、計算化的切入)在教學、出版和研究過程中使用計算技術(強調了這樣的特征,把數字技術和數字方法、數字工具用到了人文研究里面)。

在這個領域里面,印刷不再是唯一的重要的媒介,數字工具、各種技術和數字媒介正在改變知識的生產和傳播,媒介技術的改變對人類知識生產和傳播、教學方面的改變是底層的,改變了知識的狀態,這是非常顛覆性的改變。

今天,人類剛剛進入數字社會,我們在這樣的初始階段所認識到的數字技術對于社會的影響,仍然是不全面的,是非常粗淺的。

數字人文的研究主題、方法和工具

到底數字人文領域里面研究什么主題?傳統的人文研究從來不會想到建模,說到建模是數學工作,或者是計算機領域的事,但是數字人文的研究非常強調建模,我們今天使用主題模型去做大的文本集合關鍵主題的提取,我們需要新工具方法幫助我們研究實現新的需求。

我把數字人文分成了三個方面。

第一,數字層面。怎么樣利用新的信息化技術,創新方法和研究路徑?比如說建設預料庫挖掘,進行專題數據庫進行挖掘統計分析,比如說通過文本挖掘技術,還有圖像自動識別技術,去分析潛在的隱層的模式出來,讓計算機輔助我們理解,以前這種情況主要靠人,但是大的模式人是解讀不出來,所以需要計算機幫助我們來做,所以工具在任何時代、任何學科都是非常重要的解剖的工具。

第二,工具層面。我們需要開發新的工具或者軟件平臺,比如數字出版工具。

第三,數字人文研究不僅僅是強調資源上的改變、工具和方法的改變,更加強調的是面向未來真正新的問題。問題可能由技術帶來的,比如互聯網虛擬現實、大數據、人工智能帶來新的問題。也可能是技術對于資本主義的影響,比如說對我們國家經濟影響,電子商務、數據的遺忘權等。人類正在向數字社會遷移,在數字社會里面我們遇到新的傳統的社會不會遇到的問題。

數字人文的研究流程,在方法上能分成:獲取數據、創作、分享數據、分析數據、解釋數據、分發數據和活動,這些活動都是數字分析方法的應用,涉及工具很多,比如在出版方面、圖像的處理上面管理與分析方面,文本編碼分析。

中國當代數字人文發展的重點

具體來看目前中國當代數字人文發展的重點是什么?目前來說重點對幾大數據庫,對它的研究項目做了統計,對國家社科教育部基金用數字數據庫做了統計,我們發現相關的項目非常多,而且增長速度開始在加速增長,從2009年開始加速,在早期的時候量不是很大,但是從09年開始加速增長,如果看這個不是很清楚,我們再看看社科重大和重點基金代表了我們國家頂層,或者學者們的集中判斷,他們的基本認識,重大和重點基金里面,在09年以前基本沒有關于數字人文的項目,但是09年以后一下子變成了9個,2016年變成了18個翻倍了,到了2017年又再次翻倍達到37個,目前社科重大基金里面僅僅十分之一都是做數據庫建設的,我們來看這些項目,拓本數據庫、體育非物質文化數據庫、方言數據庫、俗語數據庫、唐宋編輯地圖、藏語語料庫等等,抗戰數據庫,這些數據庫項目是最重要的,目前我們還停留在數字資源建設的層面上,看詞頻越大代表詞頻越高,數據庫語料數據庫建設,目前數據庫建設是數字人文研究里面基礎設施建設的基礎部分,是少不了。

我們起步并不算晚,最早的時候僅僅是項目檢索結果可以追溯到1991年,那個時候武漢大學情報學院前身,現在是管理學院,那個時候老的系管主任,還有在91年清華大學也做了數據庫建設,后來系主任焦老師也做了數據庫的工作,都是比較早的?,F在2017年社科重大的十分之一都和這個相關的,2018年我沒有做統計,但是基本接近40多個都是做數據庫建設的,社科重大基金里面,現在更加寬了,比如說銅鼓數字記錄、少數民族民族數據庫記錄、手工藝要素數據庫、戶籍制度數據庫、檔案數據庫、古籍檔案、民間信仰數據庫,族譜數據庫等等,通過這些看到今天資料數據庫整理是工作很重要的一部分。

還有數據平臺建設,比如北京大學開放數據平臺,復旦大學人文領域平臺,一方面學者自己做數據庫,高校做數據平臺,支撐數據庫建設很重要。我們介紹一下數據研究中心的工作,我們主要做智慧數據,主要是人文社科數據資料數字化處理方法,還有人文社科相關的數據分析軟件,我們做軟件開放出來給學者們使用。我們做成果,數據可視化、語音分析、文本挖掘等等開發成果,這是主題演化可視化分析語義增強、語義檢索記錄等等。這是我們做的詩歌制圖,我們把以前的詩歌只是傳統的樣式,但是變成知識圖譜,我們對文化圖譜進行了標注,對敦煌相關文獻做了知識圖譜構造,這是以前不存在的工作。這是我們對莫高窟做了標注,用了多種方法。

為什么談智慧數據?是戰略問題,人文社科今天的研究,正在計算思維下有新的變化,比如有開放思維、計算量化思維、協同思維、跨學科思維和關聯度思維,這是人文數字化以后帶來新的思維變化,除了需要大數據支撐,還需要關聯數據,需要開放資源,同時我們希望有Smart、data,有一些特征,比如說長達2000年全球協作、數據驅動、融合性的分析和視覺化的分析,這是數字人文基本特征,需要新的思維和新的數據作為支撐,這個時候我們這個學科干這個事,就是提供新的數據做支撐的,我們做什么?因為我們認識到基本的認識,就是數據科學正在成為所有的現代科學基礎性的學科,尤其是在人文領域里面,隨著傳統文獻資源數字化,一切文獻都可能會成為一種可計算數據,數據科學不僅僅是自然科學,還在支撐人文社科,以前我們的人文社科主要靠腦袋想,以后可能還會有數據的處理問題,這個時候都依賴于數據科學的發展,而我們數據科學基礎理論一個研究方向,而且數據處理和文獻閱讀對于人文學者來說是非常重要的,相對自然科學來說,人文學者更依賴于閱讀和使用電子文獻,因為花更多時間使用,但是工作當中發現有時候要的不是海量數據,要的是更高等級的智慧層面的數據,稱之為Smart、data,更關心的是讓數字資源組織水平更高,不再把傳統的文獻一冊放在數字化,而是把文獻內部的知識之間建立跨域的鏈接,就像剛才威尼斯里面提到的做跨域鏈接,知識應該超越圖書,通過某種超媒介在圖書之間相互關聯,而這個工作如果關聯起來,高級的知識組織狀態就是Smart data。

智慧數據怎么樣支撐人文研究?以前有原始數據,比如網頁、小說、政策文本、行為數據、三維模型、古籍,我們通過語義化、數字化、關聯化和形式化變成新的智慧數據的結構,用智慧數據的結構支撐在各種系統支撐下,交付系統、對話系統、軟件終端發現語義支持系統,版本比對,有些問題得到解決,這些問題為人,同時分析需要機器參與,這是未來的目標,是比較宏大的目標。怎么建設智慧數據?我們人類編碼能力一直在進步,從早些時候載體是擬辦、族譜、文字,逐漸到網絡,再到新的技術,這是圖譜或者是關聯數據,人類對于知識的編碼能力一直在進步、一直在超越,所以智慧數據代表的是人類對知識、編碼和表現的一種能力,一種進步,所以智慧數據可能代表了三個階段,首先數字化,我們把傳統的古籍圖像掃描成圖片,這就是數字化,得到了數字化的照片。

隨后我們數據化,把知識結構化處理,進行細致地布置,我們得到了半結構的或者結構化的表格,CBBD數據庫是表格化,是完全結構性的數據,這樣可以做大規模統計分析,最終的目標我們希望是智慧化,可以看到這是鋼鐵俠,他和機器人戰甲進行對話,同時是實體,但是同時也是數據體,就是平行世界里面的數字卵生,是非常新穎的概念,我們正在利用這個概念做文化管理方面的探索性的工作,一個實體本身應該是數據體,數據體能夠反映實體的東西。對于圖書、圖書館文獻怎么在數字空間里面呈現和實體空間里面呈現,有什么樣的對應關系?這就是我們要探索的目標。更多的智慧數據具體表現不再作更多解釋,比如說數據本身必須解釋,數據可以自描述機制,數據可以解釋一切,這就是DNA,干細胞里面DNA有能力,智慧數據可溯源,數據必須是可信的。

為什么在今天歷史研究里面數據不可信?因為證據沒有證據,證據本身不可信,因為不可溯源,憑空產生,如果數據本身溯源,一切歷史研究完全可以回到當下。智慧數據還有一些從高級狀態到低級狀態是兼容性的,想看原始數據、看古籍可以看,想看地圖、GIS空間也可以看,智慧數據現在可以看到的幾個雛形,可以看到未來的微光看到未來。第一個就是納米出版物或者微型出版物,新的論文模型,大多數不會接觸到。第二個是關聯數據,這個慢慢很多圖書館會使用到它,比如說里面有很多博物館、圖書館,把它們的數據關聯化發布了,這樣可以保證做探索,去發現自己,自己不知道,不知道自己不知道發現這種東西。

還有知識圖譜,可以實現知識之間的推理,這樣可以輔助找到不太明確的線索,這是我們讓計算機怎么樣輔助我們做研究的時候,更多體現在發現線索上面。這是我個人的工作,就是跨模態關聯,中國在歷史領域當中總是講一個概念,就是左圖右史,左邊發現地圖,右邊看史書,看史書的時候看位置,這樣古代學者研究理解地圖是非常重要的,但是圖像和文本在多的情況下被分離了,被分割的,在我們很多時候尤其博物館看到實物和圖不知道背后的知識,怎么樣把壁畫和壁畫背后知識關聯起來?需要做探索,我們希望用敦煌構造智慧數據的原型,智慧數據做探索,我們做了本體、數據模型,我們做了敦煌洞窟的本體,我們把幾個綜合起來做的工作。我們用本體、用知識圖譜構建圖像適度標注,標注完了之后再做展示,這樣可以把圖像內部的熱點和知識點和背后知識關聯起來,過程是一個數據驅動的模式,是一種數據驅動的。

大數據時代人文社科路徑創新

人文社科一般遵循流程,發現問題、使用方法、尋找數據和文獻、分析問題、發表成果,這是人文社科基本工作的學術流程和環節,看大數據對這些東西產生了什么影響,或者數字化技術和大數據對每個環節產生了什么影響?我們現在有一些說法,第一個就是新問題,大數據給我們帶來了新的場景,新的場景產生新的問題,但是在新的場景下希望解決老問題,所以在問題層面上最重要的,我們需要創造一些新的環境解決老的問題,同時我們還要發現一些新的問題,在新的數據時代的場景下要解決新的問題。

在方法層面,我們需要有新的方法,比如說數據驅動,數據驅動的方法跟傳統的人文社科研究、理論驅動方法要相結合,不能說誰替代誰,是應該相結合的。還有互聯網觀察法,互聯網正在成為觀察社會的基本視角,以前我們做田野調查,到村里面到市面上去,現在通過互聯網本身可以做田野調查,比如說通過快手可以看大貨車司機他們的生活狀態,還有眾包科學,以前很多研究方法上面采用的是專家,大多數學者研究是專家實現的,但是今天通過眾包可以讓大眾參與到知識生產過程中,還有虛擬實驗室方法,以前我們知道對一個問題的研究,很多時候是沒有辦法通過虛擬仿真實驗的,但是我們通過VI在虛擬空間里面,比如第二人生游戲,可以推演一個事件,或者一個活動,這樣給我們觀察社會,或者研究某些活動給了你新的虛擬空間,這些是方法上的創新。

在數據和文獻上面,今天我們通過文獻數字化,可以把傳統的文獻變成了新的數字文獻,但是更重要的是使用新數據,比如說互聯網數據,互聯網目前是非常龐大的數據載體,記載了人類社會的各個方面,所以我們很多數據都可以通過互聯網數據獲取,可以代替傳統文獻。其次,在物聯網是更大問題,今天智慧地球、智慧城市的發展,可以給我們很多的物聯網數據,這種數據對人文社科都非常有幫助的。比如說公共汽車,公共汽車的通行,什么人使用公共汽車?這些年有什么變化?如果有公共汽車的數據,馬上公交的數據不僅僅是路線優化和數學問題,還反映了民生問題。還有移動手機,今天手機記錄了所有的信息,人文問題、自然科學問題統統可以通過手機反映出來。

分析部分除了定性和定量相結合,空間分析和時間分析、演繹和歸納分析、整體和部分、人工+機器都要結合起來進行分析,再發表,科研成果不僅僅是做成印刷文獻專著,還通過網站和手機,或者通過軟件的方式當作科研成果,越來越多科研成果就是軟件本身。今天大數據同時是一種數據支撐推動我們的研究,而本身數據也是一種社會時代,會改變社會生態,所以兩種視角相結合,可能讓我們把人文社科的研究會更加準確,但是需要注意的基本問題,比如數據只是簡約事實,不代表全部,所以更代表信念,個人隱私不可以觸碰,我們在快手研究的時候個人隱私不能泄漏,數據作為新時代必須遵循新時代的倫理,信息素養制約了人文學者對數據資源的利用,因為不知道數據怎么處理。人文信息思維可能是抽象和思辨能力,人作為研究者本身存在的基本意義。我們武漢大學資深教授馬老師,在數據方法訓練上作最后總結時候,作了非常精彩報告,如果把大數據分析利用自然方法研究自然社科,在同時千萬不能忽略人文社會研究中的價值,還有主體參與的問題,尤其對于價值的觀念,在任何時候不能被忽略了。

總結

數字人文作為一個印刷環境向數字環境變遷中的路標性意義的概念,不光人文學者從低檔復雜的資料當中收集起來,還要從高層次發現,從而加快研究速度提升研究效率,人文研究數字人文推納傳統人文學者接納新的理念、新的思維、新的方法、路徑、工具、數據,推動人文研究在問題本身和手段的持續性的拓展和創新,數字人文基于傳統的人文并不替代傳統人文,而是傳統人文學科在數字時代的自然延伸和發展,是借助于數字技術改變人文知識的生產獲取,標注取向、比較闡釋表現樣式,是數字化式的一種學術活動,所以宏大意義上來說,數字人文致力于新的方式提出人文問題,定義人文問題和研究人文問題,而且數字人文為我們的數字原著文,為下一代提供了新的數字認知路徑,數字人文對數字化革命單向、不可逆轉的回應,數字人文成為未來數字活動里面人文框架里面本題型框架和基礎性范式。

4月17日下午,武漢大學教授、數字人文研究中心主任王曉光在華東師大閔行校區圖書館做了“全球視野下的數字人文:研究與實踐”的演講,從數字人文的時代興起的背景談起,解釋相關概念、研究對象、研究方法和工具、發展趨勢等,最后談到了在大數據時代關于人文社科研究路徑創新的問題。該演講系華東師范大學第五屆思勉人文思想節的系列名家演講活動中的一場,由華東師范大學中文系教授、圖書館館長胡曉明主持。

(演講現場速記稿由主辦方提供,本文系講稿節選。澎湃新聞實習記者 潘體芳 現場報道。)

    責任編輯:韓少華
    校對:張亮亮
    澎湃新聞報料:021-962866
    澎湃新聞,未經授權不得轉載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網安備31010602000299號

            互聯網新聞信息服務許可證:31120170006

            增值電信業務經營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業有限公司

            反饋
            主站蜘蛛池模板: 涟水县| 彭水| 临汾市| 保山市| 焉耆| 交城县| 遵化市| 如东县| 师宗县| 大洼县| 宜兴市| 江达县| 神农架林区| 收藏| 灌云县| 防城港市| 琼中| 裕民县| 通州市| 清河县| 通河县| 定陶县| 信阳市| 武胜县| 陆良县| 宜章县| 阳山县| 武鸣县| 黄浦区| 长顺县| 周至县| 炉霍县| 金阳县| 五莲县| 宁德市| 常山县| 抚顺县| 瓦房店市| 旬邑县| 沧源| 武乡县|