摘 要:在“数字人文”的研究浪潮进入欧美人文学科之后,如何将文学批评与数字人文进行有益结合,是一个亟待思考的议题。本文回顾了在近几十年来自然语言处理和基于语料库和话语/叙事分析的文学文体学的发展,指出面向文学研究的数字人文应该继承但有别于这些领域已经做出的跨学科尝试。在大数据时代,数字化的文学批评可以充分借助人工智能中机器学习的方法,并在一种弗朗西斯?培根式“新工具”的思维下,开展对于海量文本内部与外部模式的勘察。这样的文学批评最后并非是彻底走向“远读”,或者将阐释的任务交给“自动化”的学习算法来完成,而是让机器阅读成为对传统阅读的一种激发与挑战。构建一种具有独特的数字化思维,但又根植于传统文学批评观念和认知模式的新型文学批评,是本文无法给予回答但却迫切希望能展开讨论的议题。
关键词:数字人文 文学批评 算法 文体学
Abstract: Since the digital humanities (DH) has burst upon the scene of the Western humanities, how to combine literary studies and DH in a mutually beneficial way has become a burning issue for us. This article, in a retrospective manner, at first considers the evolution of natural language processing (NLP) and the corpus-based, discourse- & narrative-oriented literary stylistics over the last few decades. I then point out that a literary DH approach should learn from NLP and literary stylistics and distinguish itself from these old inter-disciplinary endeavors. In the age of Big Data, a digitalized literary criticism can make best use of artificial intelligence (AI) and in particular, machine learning. Equipped with Francis Bacon’s idea of novum organum, our DH scholars can pry into massive texts for their internal and external patterns. Such a new mode of literary criticism doesn’t mean an eager embrace of “distant reading”; nor is it to give over interpretation to an “automated” learning algorithm. Rather, in this scenario machine reading is employed to challenge and stimulate human readers, so as to foster a brand-new digital thinking, or an algorithmic criticism deeply rooted in traditional literary criticism and epistemology. The aim of this article is to address, but not to answer, these above-mentioned questions.
Key words: digital humanities, literary criticism, algorithm, stylistics
一
上世纪60年代初,一个来自南非的年轻人游荡在昔日帝国的首都伦敦。虽然他暗地里憧憬成为一个艺术家,但凭着不赖的智商还是在IBM公司谋到了编程的差事。他工作的对象是全英国当时只有四台的Atlas计算机。工作之余,他琢磨着用计算机来统计聂鲁达(Pablo Neruda)诗歌中的高频词,然后将这些词打散后重新排列组合,最后再连缀成“诗”。这些聂鲁达伪作被署上假名,然后投稿到南非的文学期刊,其中几首甚至得到了发表。他在想,或许有一天这个笨拙的机器能凭借着“非此即彼”(either-or)的计算逻辑,写出伟大作品打败莎士比亚。 这个年轻人后来去美国德克萨斯大学奥斯丁分校留学,并在那里完成了一篇关于萨缪尔?贝克特(Samuel Beckett)小说文体分析的博士论文。后来,这个人成为了职业作家,拿到了诺贝尔文学奖,成为了那个叫库切(J. M. Coetzee)的人,并把这段往事写在了自传体小说《青春》(Youth)里。
如果我们将库切与Atlas计算机的这段遭遇,定义为“数字人文”(Digital Humanities)前史中计算与文学相遇的某个象征事件 ,或许并不为过,因为在六十年代库切的这段经历中体现了数字人文两条主要的隐线:自然语言处理(NLP)和文学文体学(Literary Stylistics)。前者发轫于1950年计算机科学之父阿兰?图灵(Alan Turing)所提出的“图灵测试”(Turing Test),他将机器智能的判定标准定义为人与机器交流的无差别性,这实际指向了机器是否能获得与人类一样的自然语言处理能力。然而,在自然语言处理研究的前三十年,计算机专家和语言学家的合作走了很大弯路。当时普遍的认识是,可以借助传统语言学研究,将自然语言的语法规则一网打尽,并在此基础上人类学习语言的知识全部以符号、代码的方式教给计算机,从而实现用电脑模拟人脑来处理自然语言。但事实上,基于乔姆斯基形式语言的编译器技术很快遇到了瓶颈。首先,自然语言真实词句的形态是极其庞杂的,仅仅依靠知识工程的方式由人工来穷尽文法规则是不现实的;其次,即使这样的规则集合可以写出来,那么它们必然是与语境相关的语法(context dependent grammar),而人工设计的计算机程序语言使用的是与上下文无关的语法(context independent grammar)。如果考虑自然语言的上下文,那么“计算复杂度基本上是语句长度的六次方”,以当时IBM公司大型计算机的运算能力都无法完成这样的计算量。
七十年代统计语言学的出现改变了自然语言处理的窘境,也为数字人文的出现奠定了方法论基础。从规则到统计的变化,让计算机科学家不再执迷于对自然语言进行深层研究,而是利用统计模型在语料中寻找自然语言的浅层规律。这其中的一个核心模型就是隐含马尔可夫模型,它被证明能有效计算出句子内相邻词同时出现的概率。 于是,计算机面对自然语言需要做的不是根据人工规则来挖掘出语义,而只是按照训练数据后得出的统计经验,去预测出哪一种词与词的连缀组合方式具有最大可能性。随着计算机运算能力的飞跃发展,以及互联网技术下自动抓取的自然语言数据量的激增,这种基于统计的自然语言处理技术已经成为当下的主流。“大数据”时代下,自然语言处理的人工智能技术为计算机去进行数字人文中的文本挖掘——无论是词语共现(concurrence)的规律,还是文本的情感分析(sentiment analysis)——提供了前所未有的便利。
但是,这一条隐线是以计算机科学为主导的,同时辅之以统计学方法,并未向文学批评伸出橄榄枝。换言之,转向统计思维的自然语言处理技术无意去探索文学文本这种更加复杂的自然语言形式,它服务于特定的日常生活情境(如语音识别、输入法、垃圾邮件分类、网络舆情监控等等),仅满足于在普通的语言质料中寻找人类语言使用的近似规律与模式。真正矢志于将计算与文学相结合的,其实是另一条更重要的隐线,那就是以应用语言学家为主导的文体学研究。1958年在美国印第安那大学召开的“文体学研讨会”被视为是语言学与文学之间的交叉学科在英美诞生的标志。所谓的文体学,按照辛普森(Paul Simpson)的定义,是“一种将语言置于主要位置的文本阐释方法” 。库切在60年代初对贝克特小说的文体分析,就是这个新兴学科的产物。而更早期的“新批评”(New Criticism)的先驱瑞恰兹(I.A. Richards)等在提出Basic English的时候,其实也是在对英语文学的文体特征做一种定量的统计计算。
作为一种将文学和语言学相结合的跨学科研究,文学文体学在最近五十年已经有了非常迅猛的发展。尤其是英国和美国,这两个地区是西方文体研究事实上的中心。我们甚至可以这样说:远在最近关于“数字人文”的概念被炒热之前,应用语言学的学者们早已跨越文学和语言学的鸿沟,在文学的人文计算领域耕耘了半个多世纪。然而,和自然语言处理一样,文学文体学的发展同样经历了曲折道路。当六七十年代“新批评”在美国逐渐式微时,文学文体学曾短暂接过了其衣钵,因为两者都关注文学语言的形式。但在后来解构主义、后结构主义的冲击下,这种过分依赖传统语言学去定量分析文学的形式文体学好景不长,很快被视为是一种保守的、孤立的、机械的文学研究方法。美国重要的文体学杂志要么停刊,要么转而刊登叙事学(Narratology)方面的论文。 面对瓶颈,文体学几乎与自然语言处理同时在八九十年代出现了重大转向,不过后者是得益于统计与概率,而前者则是因为英国语言学家韩礼德(M.A.K. Halliday)带来的系统功能语法(systemic functional grammar)。
文体学的这种功能转向,对我们之后理解数字人文与文体学的异同颇为关键。韩礼德最大的理论贡献,是不再像索绪尔、乔姆斯基那样将语言视为一个符号系统,而是将语言作为一个社会的、文化的现象,转而去关注语言具体情境下的使用。韩礼德将意义理解为一个在语境中生成的复杂系统,进而区分了三种意义:概念意义(ideational),人际意义(interpersonal)和语篇意义(textual)。 同时值得注意的是,韩礼德用于阐述这种功能文体学具体实践的,正是依靠他一篇经典的文学文体学论文,个案就是戈尔丁(William Golding)的短篇小说《继承者》(The Inheritors)。通过对该小说中两类人(分别是尼安德特人和智人)语言的及物性过程(transitivity)做定量统计与分析,韩礼德以可视化图表的方式展现了小说语言是如何形塑世界和世界观的。 随着功能文体学的日益蓬勃发展,文体学家从分析语气、情态、语调、人称、自由间接引语、及物性、表达情感色彩与态度的形容词和副词入手,探讨文学文本中反映的作者/叙述者与人物、读者之间的关系以及由此产生的文本意义。
然而,韩礼德及其追随者的这种功能文体学分析较为精细,更适合篇幅较短的文学作品分析,如诗歌和中短篇小说等。将文体学进一步推向“人文计算”方向的,则是八十年代进入研究视野的语料库语言学(corpus linguistics),其中最具代表性的人物要算辛克莱尔(John Sinclair)。辛克莱尔代表了英国“伯明翰学派”所走的话语分析(discourse analysis)之路,而以文学文本为语料库来驱动自然语言中的话语研究,这对未来的数字人文发展具有重要的方法论启示。辛克莱尔早期研究以文学文体学为主,分析过拉金、华兹华斯和莎士比亚等人的诗歌,后期则倾向于将文学作为一个数据库,因为他相信“只有通过亲近文学,才能找到一种系统化工具来描述语言” 。不难想象,辛克莱尔选择了从语料库语言学发展出一种适合文学的语料库文体学(corpus stylistics)。用现在的时髦术语来说,它比中规中矩的文学文体学研究更像“大数据”,毕竟前者可以介入到对长篇小说的分析,甚至包括相关性高的多部小说的聚类分析(cluster analysis)。
必须特别指出的是,语料库文体学并不等同于文体测量学(stylemetics)和文体统计学(statistical stylistics)。后面两种研究虽然听上去更强调计算,也像是严格意义上的纯实证研究,但它们往往并不关注文本阐释,而是“通常以词频为研究变量来判断语篇的统一性,作者的身份和语篇产生的年代。” 它们最重要的应用,是对所谓“莎士比亚伪作”(Shakespeare Apocrypha)的文体测量,比如确定《爱德华三世》(The Reign of Edward III)和《托马斯?摩尔爵士》(Sir Thomas Moore)等争议作品的归属。但我们很难说这种以文本“指纹”来推断作者身份的研究是一种文学阐释方法,而在面向文学的语料库文体学中,阐释应为研究的题中之义。研究者对语料库的使用,比如“在对语料进行加工标注的基础上,通过词频统计、主题词检索、索引、词类分布以及特殊结构的人工标注与检索统计等手段”,目的是为了阐释“文学作品的主题、人物形象的塑造、叙事的发展以及作家风格等”。 辛克莱尔的一句名言是,“当你同时看大量的语言时,它就会显得不一样。” 这句话自然也适用于对文学文本做语料库驱动的话语分析。正是因为对很多作品同时进行分析,批评家才能发现那些在传统方法的阅读下无法找到的意义模式。一个经典的例子,就是辛克莱尔在语料库词汇搭配(collocation)研究中特别强调的“语义韵”(semantic prosody) 。
将韩礼德和辛克莱尔结合得最好的,或许当属英国文体学家图兰(Michael Toolan)。一方面,他像韩礼德那样拓宽了文体学研究的对象,将“文体”和“话语”视为写作技巧的一体两面,从而将文体学与叙事学糅为一体,使之成为了“叙事文体学”(narrative stylistics)。在研究“文体”时,他聚焦于语言成分,包括“词语选择、小句模式、[文字]节奏[如韵律、词语或句子的长短]、语调、对话含义、句间衔接方式、语气、眼光、小句的及物性等等”;而在探讨“话语”时,图兰关心的是“讲故事的人选定创造事件的特定顺序,选定用多少时间和空间来表达这些事件,选定话语中(变换的)节奏和速度[究竟是快速简要概述还是慢慢地详细描述]。此外,还需要选择用什么细节、什么顺序来表现不同人物的个性”等等。 另一方面,图兰又续接了辛克莱尔的语料库文体学,尤其是在近年来,开始将研究方向转向如何通过语料库的文体研究方法,来探究短篇小说的叙事进程(narrative progression)和叙事性(narrativity)。图兰的语料库中涵盖了20世纪短篇小说的代表作,使用了一些经典的统计语言学分析工具(如Word-Smith Tools,Wmatrix)以及特别的软件程序,追踪文本中高频词和新词汇的分布规律,并以此来揭示短篇小说文本叙事进程的规律。
二
此时,我们可能已对所谓“数字人文”框架下的文学批评产生了疑问:“数字人文”作为一种新鲜术语进入欧美人文学科的场域不过是近十年的事情,但文学研究是否已经在应用语言学的文学文体学中被“数字人文化”几十年了?韩礼德、辛克莱尔和图兰这些学者对文学的研究,不就是一种定性的、计算的研究吗?这种命名的滞后,很像图书馆学、地理信息学、计量史学圈子很多学者的抱怨:早在DH被作为一个学术概念炒热之前很久,他们其实早已开始走数字人文之路了。果真如此的话,那么当前数字人文的文学研究进路,是否仅仅需要在现有的文体学研究框架下,用“文学文体学 语料库 更多的计算、统计方法”这样的配方就足够了?
然而,问题绝没有那么简单。笔者认为,“数字人文”旗帜下的文学研究并非简单地在研究文学的过程中运用计算机软件、统计工具或数据库/语料库,也不是应用语言学框架内文学文体学某种“顺水推舟”的发展。作为学科融合的概念,“数字人文”产生于这个以互联网、大数据、人工智能/机器学习为特点的信息时代,它也作为一个“伞状概念”(umbrella concept)被不同学科、不同机构用来指代不同的方法与理念。 但我最认可的,是安斯沃斯(John Unsworth)在那篇颇具争议的《什么是人文计算?(什么不是?)》中谈及的观点:“人文计算是一种再现的实践(practice of representation),是一种建模(modeling)或模仿(mimicry)形式。它是一种论证(reasoning)方式,是一套本体论的许诺(ontological commitments),它的再现实践一方面由其所需要的有效计算决定,一方面则取决于人的交流。” 换句话说,安斯沃斯认为“人文计算”本质的要素不是使用了什么工具,而是人作为研究问题的提出者,在处理问题过程中和这个工具处于一种怎样的关系中。为了正本清源,他指出了那些被称之为“江湖骗术”(charlatanism)的人文计算,它们的共有特征就是将原本复杂、庞大的再现实践变成一种“拙劣而浅显的模仿”(quick-and-dirty simulacrum),仅仅是为了追求计算的浅层效果。 那么,检验这种人文计算含金量的指标到底是什么呢?安斯沃斯认为,判断依据就是制定研究问题的用户与人文计算之间的“相互作用性”(interactivity)。 如果完全没有相互作用发生,只是借人文计算的皮相,那就是“江湖骗术”;如果运用到了关键词搜索、组合检索等,这属于较为初级的;如果在计算过程中有可以改变的变量和参数,并引入了新的算法,那么这就是相当好的人文计算。
这里,笔者想借用海尔斯(N. Catherine Hayles)的术语对“相互作用性”做进一步的引申。在数字化文学批评中,应该存在着两种意识载体在活动:一个是批评家的人脑,它是具有认知能力的意识主体;另一个则是来自机器与算法,它被海尔斯称为“认知的非意识”(cognitive nonconscious)。 海尔斯创造这个概念的本意,其实是想说明数字人文中计算机虽然不具备意识能力,但却和人一样可以有认知,同时人类也不必为机器无法效仿的意识能力过于傲慢,因为这种意识在认知活动中具有无法克服的偏见与负面代价。 本文进一步认为,理想的数字化文学批评,应该是这两种批评认知力量的“战争”(agon),两者保持一种紧张对峙状态,并不仅仅用于相互印证或否定,而是相互启发和批判。同时,人类读者(human reader)是作为这个“战争”的主角(protagonist)存在的,而机器读者(machine reader)是敌人(antagonist),两者关系既不可等同,也不可互换。这不是一种简单的折衷主义立场,而更像是一种元批评(meta-criticism),即不对结论做先入为主的预设,而且对批评方法、模型本身也保持暂定性。一切都有待对数据计算中揭示出的令人意外的“20%”去进行反思式、生产性的解读。
芝加哥大学“文本实验室”(Text Lab)的霍伊特?朗(Hoyt Long)和苏真(Richard Jean So)近年来合作的一系列数字人文方面的论文,为机器与人的这种竞争式阅读做出了绝好的示范。在《文学模式识别:文本细读与机器学习之间的现代主义》中,两位作者试图以日本俳句(Haiku)在美国现代主义中的接受和改编为个案,让计算机用朴素贝叶斯算法构建的分类器去学习识别哪些英文短诗是属于俳句,并将机器学习后的识别结果与文学史对这个独特体裁的认识进行比较对照。然而有趣的是,这种对比并不是为了证明机器可以具备“鉴诗”的人工智能,而是要让文本细读、机器学习和历史主义批评这三种阅读阐释“模型”产生一种安斯沃斯所说的“相互作用性”。进一步的说,两位作者认为三种读法都内化了某种关于文本的本体论认识(或用安斯沃斯的术语,“本体论的许诺”),他们的做法“并非要偏重某一种模型而贬低另一模型,而是要主张通过这类人力阅读和机器阅读的交互作用,凸现出一种关于俳句这种文学事物的新的批评视角。通过讲这些文学分析模型理解为按其自身视域具有理据、而在更广阔的模式识别阐释学中可相互对照,一种关于俳句——以及广义地关于现代主义文本——的新的本体观出现在人们视野中。”
另一个范例是莫莱蒂(Franco Moretti)在斯坦福大学“文学实验室”(Literary Lab)用“网络理论”(Network Theory)重读《哈姆雷特》的尝试。和霍伊特?朗与苏真不同的是,莫莱蒂的研究并未凸显大数据和人工智能的技术维度,他甚至坦言这是基于人物网络的极为原始的研究,剧中人物关系拓扑图完全由人工绘制而成,全然没有当下主流社会网络分析工具Ucinet和Gephi的“复杂气质”。但即使在这样看似“低端”的数字人文实践中,我们依然感到莫莱蒂强烈的问题意识,他始终强调自己是在操练一种“再现的实践”,并对其“模型”运用了一种批判性解读。具体地说,《哈姆雷特》的人物关系网链有三个关键人物,即哈姆雷特、好友霍拉旭(Horatio)和继任国王克劳狄斯(Claudius),经由他们三个人全剧所有人物获得了联结。莫莱蒂惊奇地发现,如果将克劳狄斯拿掉,剧中人物的网络结构不受太大影响;但如果将原本在剧中分量轻微的边缘人物霍拉旭拿掉,剧本的关系网络就会坍塌。
莫莱蒂以一种极富思辨性的解读,首先追问了这种将剧中人物关系做可视化建模到底有何意义。他的答案是:这种阅读模型的可以将时间性的情节,变为一种将“过去”与“现在”并置的抽象关系,这是传统的阅读所不能给予我们的观察角度。 正是在这个“网络理论”的驱动下,莫莱蒂发现了霍拉旭对关系网络的奇特意义——他虽然看似在剧中无足轻重,但帮助哈姆雷特联结了宫廷之外那些游走于戏剧中心的“小人物”。 该研究最大的方法论意义,实际上是莫莱蒂试图打通“风格”与“情节”的野心。他认为,自己的研究可以指向一个更具普遍性的数字人文文学研究方法:“风格嵌入情节,变成情节的功能。这可能会是一个突破,不仅仅针对文学分析——(文学分析)目前还无法创造出一种将情节与风格统一的理论——而且适用于更广泛意义上的文化分析…情节-风格这个连续体所能提供的,是基于我们的行动和我们如何思考这种行动之间的一种关系模型。” 虽然我并不认为莫莱蒂的这个研究已经达到突破的奇点,但他对于不同阅读模型的“元批评”意识无疑是和霍伊特?朗、苏真等人的研究殊途同归的,也彰显了安斯沃斯所心仪的那种“人文计算”。
那么,文学文体学是否已完成了朝向数字人文的范式转换呢?答案是否定的。一方面,虽然文学文体学比语言文体学更关注文学语言,但文体学总体上依然是以语言、语言学为导向,其价值归宿是如何借助文学来更好地完善语言(包括话语与风格)分析模型。如果仅仅将简?奥斯汀、麦尔维尔、乔伊斯的文学作品作为“风格化”的语言质料加以统计处理,那么,这样的数字化文学批评很容易会沦为验证某种语言学理论(如系统功能语法)或特定语言分析方法(如认知心理学)的酸碱试纸。然而,文学批评作为一种主观、直觉的阐释活动,它探讨的是文本意义及其背后的深层含义。艾布拉姆斯(M. H. Abrams)在《镜与灯》中认为,批评理论考察的是四个要素,即作品、作者、世界和读者。 无论是将文本作为客体,还是强调作者主观意图(authorial intent),或是关注“读者反应”(reader-response),文学批评都是在文学的复杂系统中探究不同要素之间的关联和意义的生成,其价值取向是基于艺术审美的,关注的是信仰、伦理、天赋等“非功利主义的、非经济的、非物质的、内在的领域,而且在本质上,它是不变的、超验的”。 显然,这与语言学的功能主义、工具主义、物质主义的取向有着深刻差异。
另一方面,文学文体学的一些最新领域(如女性主义文体学、认知文体学、叙事文体学)虽然在做“去语言学化”的尝试,但与人文计算的大数据、自动化、智能化方向却渐行渐远。如前所述,自然语言处理面对文学最大的困境,在于后者是高语境的(high-contextual)。韩礼德对于文体学的改造,正是向语境的一次进军,人际意义和语篇意义都是在上下文中生成的。辛克莱尔强烈反对语料库文体学中对于人工标注(tagging)的过度使用,并认为“计算机能够被训练用来识别标签,而且标记式语言(mark-up language)可以帮助文本在机器之间输出……文本中的语言和内容等会有越来越多的方面可以被(计算机)标注出来。” 然而,依然有众多语料库文体学家认为,“一些复杂的话语现象,比如话语陈述,它们并非基于词汇,是无法被计算机程序系统地、定量地检索,也无法在上下文中被阐释。” 图兰对于人文计算的自动化过程也持保留态度,譬如他就反对将文学文本做数字化处理后的特征结果与参考语料库(reference corpora)直接进行比较的做法,因为对文本叙事元素的究查应该离开语言的束缚,而更多地转向心理学、社会史和文化。 换言之,图兰认为意义的生成不是在一个标准语料库中观察比较得到的,而是应该考虑读者个体化的认知过程,这其中涉及到一时一地的读者主体带入阅读过程中的推理、图式(schema)、文类期待和自身的文化背景。 这样的研究是基于叙事认知的细微过程,同样也是高度语境化的,很难被目前的计算机建模(modeling)或模拟(mimicry)出来。
简言之,文学文体学自身在其发展中就存在“重语言”还是“重语境”、“重文化”的分裂争议,它的发展转化面临着来自学科内部自身的危机,既与文学批评传统中的“细读”模式存在抵牾,同时也依然对是否应该进入数字人文的算法批评心存疑虑。诚如拉姆齐(Stephen Ramsay)所言,尽管“数字化的文学研究”(digital literary studies)在自然语言处理、统计语言学、语料库文体学等领域已经早已展开了几十年,但真正的“算法批评”(algorithmic criticism)其实还未出现(或者说,仅有一些雏形),它远未渗入文学批评的核心区域。
三
到底什么是“算法批评”呢?按照拉姆齐的定义,它是“一种源自对文本进行算法处理(algorithmic manipulation)的批评” 。这种数字化的文学研究绝不只是单纯在文学分析活动中使用统计模型、计算机软件等,而是让“算法”以人工智能的方式嵌入文本阐释的过程中,使之成为一种前文所述的“认知的非意识”,并与传统批评范式或意识产生互动。拉姆齐格外强调,算法批评在其发展之肇始,就应该考虑到“科学的方法如何在人文计算自身中被使用(used)和滥用(abused)” 。这种对于人工智能技术在文学批评活动中的批判性接受,也恰恰是安斯沃斯对人文计算的那种理想性规划。芝加哥大学“文本实验室”借助机器学习来分析英文俳句的个案,或许只是贝叶斯算法在文学批评中的一次初级应用,但或许称得上拉姆齐所言的“算法批评”的雏形。
那么,我们该如何进一步走向这种“算法批评”呢?或者更具体地说,我们如何能利用人工智能领域的飞速发展,将机器学习(甚至深度学习) 引入到文学批评的实践中,让这种批评帮助我们进一步解析已经被确立为文学正典的那些作品,同时还借助计算机的超强运算能力和学习算法的自我完善能力,去观察更大的文学数据中人类读者无法觉察到的模式与规律?
要迈出的第一步,或许是文学批评家对于机器学习的破冰之旅。时下,机器学习的发展令人应接不暇,已经深入到我们日常生活的方方面面,那个依靠深度学习飞速提高棋艺的AlphaGo不过是最近引起媒体关注效应的案例之一。机器学习已经分化为五种主要流派:符号学派、联结学派、进化学派、贝叶斯学派和类推学派。来自英文系、中文系、比较文学系或东亚系的专业文学研究者最应该去关心的,应该是机器学习中有哪些具体的方法、模型、规律、算法等可以用于帮助解读莎士比亚、托马斯?品钦(Thomas Pynchon)和大卫?福斯特?华莱士(David Forster Wallace)。以谷歌、IBM、百度、腾讯等为代表的科技公司巨头固然有强大的盈利驱动力和技术资源去推动人工智能的急速进步,但文学研究者恐怕不能指望商业机构能慨然为人文计算提供现成的算法工具或软件。 毕竟,以商业为导向的自然语言处理技术并不关注精微的文本意义,它们更愿意去实现的,恐怕是如何从电商网站的客户评价中自动提取情感反馈,如何实验自动翻译并让准确率达到日常交际的基本需求,如何从社交媒体每日发布的亿万条信息推送中发现舆情变化,或如何监测网页中动态生成的语码信号以帮助华尔街完成股票高频交易。而另一方面,在现实的人文计算中,研究者对文学文本所提出的研究问题往往是个性化的,对文本语料库的特征标注和分类需求千奇百怪,显然无法以某一种或几种通用工具来完满对接该课题的全部计算需求。未来的数字人文研究者跨出自己的专业区域,去学习Python或R语言的基础知识,或许将成为一种必要的入门条件。
另一方面,我们也必须承认,除了极少数像控制论之父维纳(Norbert Wiener)那样的文艺复兴式天才,绝大多数文科学者都很难深入到机器学习的技术内核和细节层面。在“AI浅水区”,我们可能了解一下自然语言处理、知识库、数据挖掘、深度学习、神经网络、熵、分词、贝叶斯定律、聚类和分类等概念就够了;可如果想进入“AI深水区”,我们需要弄懂的将是正则表达式、感知器、马尔可夫链、支持矢量机、BP网络、K最近邻算法等令文科学者眼花缭乱的术语以及背后复杂的数学公式。如果未接受过起码的统计学、离散数学训练,就贸然宣称要在文学研究中植入人文计算的方法,那么即使不是有意去“装神弄鬼”,恐怕也只能是一次堂吉诃德式的冲锋。当然,采取跨学科合作的方式也是当前数字人文研究的重要策略,但在这种与统计学家、人工智能专家的分工中,如何让文学批评保持自身独立性,却是一个非常棘手的问题。毕竟,文学研究的知识生产在本质上有别于科学,甚至与物理这类硬科学(hard science)恰好南辕北辙,因为前者的特点是“任务的高度不确定性”,同时习惯于单兵作战、以单一作者署名的文学研究者又“具有极低的相互依赖性”。 所以,未来的人文学者选择拥抱人工智能、却又无法真正深入并成为技术层面的主导者,这恐怕是知识爆炸时代下学科壁垒和专业分工带给人文学者的一种宿命,也是我们作为自然人的必然局限。
要迈出的第二步,是对学习算法、文本挖掘、概率统计、可视化结果等科学方法的“祛魅”(disenchantment)。当然,这种“祛魅”不是对科学内部细节的敬而远之,而恰恰是要求人文学者在认识人文计算的原理、方法的基本属性之后,获得一种祛魅化的智识立场,即对科学本身的局限性、暂定性保持一种学理上的警惕和反思,不以“科学主义”(scientism)来取代文学研究传统中基于意义含混、悖论、反讽等要素的诗学价值观。事实上,统计科学中存在着各种各样的陷阱,譬如著名的“辛普森悖论”(Simpson’s Paradox)就提醒我们:在分组比较中出现的变量趋势,在合并组的统计计算中可能会获得相反的结果。 如果不了解统计数据在分组与合并中可能带来的截然相反的结果,我们可能就会掉入陷阱而不自知。同样,而在机器学习中也会出现“过拟合”(over-fitting)的问题,这往往意味着算法在数据中找到了现实世界里并不存在的虚假模型,它不过是数据带给我们的幻觉。 甚至有一种说法是,数据挖掘意味着“折磨数据,直到数据妥协”,而在学习算法中又特别容易出现“过拟合”问题,“因为它们拥有从数据中发现模型、近乎无限制的能力”。 如果在数字人文范式下的文学研究中进一步引入读者心理认知的维度,我们还需要提防在心理学研究中早已为人诟病的“重复危机”(reproducibility crisis), 不要过分相信在中小规模的受试读者中以调查问卷方式获得的统计分布规律。
如果上述“祛魅”是在科学方法范畴中进行的,那么还有另一种人文学者需要正视的认识论迷信,它某种程度上源于我们在图像时代对于研究结果的可视化图形的“返魅”(Re-enchantment)。从艺术批评的角度看,中世纪的宗教绘画中隐藏着人类对于神圣力量的圣像崇拜。而在文艺复兴之后,当“圣像破坏运动”(iconoclasm)已经成为强大的世俗共识之后很多年,信息时代的我们却被重新带入另一种对于图像的崇拜。此刻,我们顶礼膜拜却不自知的,不再是教堂壁画中的圣母或耶稣,而是计算机通过程序生成并呈现在我们面前的各种图表(graphs)——曲线图、柱状图、圆饼图、点状分布图、网络关系图等等。它们不仅是图像化的数据,而且在人类潜意识中构成了机器的一种“绘画”,它似乎表征着某种真理的显形。然而,格金姆(Anna Marazuela Kim)一针见血地指出,这些图像尽管看似无所不能,但其实不过是“对那个由人、物体和人际关系所构成的无比复杂的物质世界的一种苍白反映” 。因此,习惯以纯文字来进行学术生产的人文学者应该本能地警惕自己对于“图表”的敬畏感。对于莫莱蒂在《图表、地图、树状图:文学史的抽象模型》(Graphs, Maps, Trees: Abstract Models for Literary History)所倡议的制图方法,我们既要保持开放的学习态度,但同时也要小心这些图表背后每一个数据的可检验性(retrievability)、制图方式的任意性(arbitrariness),以及对于文学复杂系统进行制图所造成的简化主义(reductionism)弊端。
这样的“祛魅”不仅不是反科学的卢德主义(Ludditism),反而是真正科学的理性态度。早在1620年,培根(Francis Bacon)在《新工具》(Novum Organum)中就对科学的方法论提出了一个变革性描述:科学应该从演绎走向归纳。这并不是说用归纳法取代演绎法,而是实现两者的有机结合,即“从感官和特殊的东西引出一些原理,经由逐步而无间断地上升,直至最后才达到最普遍的原理。” 不难看出,培根心仪的这种归纳方法反对由特殊材料一劳永逸地飞抵“最普遍的原理”,而是以一种“三步走”的流程循环渐进:首先要求尽可能多地运用观察获得经验数据,接着对这些数据“观其大较”并做客观地整列、类编与分析,在此基础上“捕获原理,然后再由业经确立的原理进至新的实验” ,如此往复。有当代学者认为,培根的描述不仅构成了西方现代科学实验的方法基石,而且已经颇具远见地将“科学发现从本质上视为一个算法的过程” 。在这种图景下,新的观察结果不断充实数据库,而称为“科学”的一般性假设随时等待被证伪,并被新的一般性假设来取代。
波普尔(Karl Popper)对科学命题有一个著名的划界,那就是“可证伪性”(falsifiability),而库恩则进一步将科学革命定义为一种来自科学家社群内部的“范式转换”(paradigm shifts)。无论怎样评价波普尔和库恩的立场异同,至少我们可以确知在科学哲学圈子内部,早已放弃了“科学即亘古不变真理”的幼稚想法,转而强调科学方法、科学知识的暂时性与相对性。既然如此,我们恐怕更没有理由去将人文计算引入文学研究不加甄别地视为一种“进步”;至少在库恩那里,这种“范式转换”的后果往往喜忧参半,甚至还有倒退的可能。 进一步说,我们从一开始就不必认为人文计算是所有文学研究中必须引入的批评工具 ,或将人工智能、机器学习带来的算法视为具有玄奥力量的神秘之物。事实上,它们随时可能犯错,有着自身的边界,但强于人脑之处在于它持久的、高速的计算能力,它们还可以在不断重复中自我学习和优化。批评家期待它们会“撞大运”般在文本挖掘中找到有趣的“原理”,从而帮助我们抵达文学阐释的某个奇点;但同时我们也应该做好心理准备,那就是它会在不断运算中一无所获。
我之所以不特别强调人文计算和算法对整个文学研究的必然意义,是因为正如伽达默尔所言,“阐释在本质上并不是一个方法的问题” 。阐释,不是一种可以像其它经验客体那样拿来进行科学调查并达到理解目的的方法。但尽管它有别于科学的方法论,阐释仍然是关乎知识和真理,只是这种知识和真理有别于科学家追求的对象,它关乎直觉和信仰,是我们和AI(那种被认为可以像人一样去思考的东西)最大的区别所在。同时,基于大数据的机器学习在目前的主要应用是寻找相关性,并在此基础上作某种预测。然而,除非我们要做的只是单纯对文学文本进行风格测量,否则对真正的文学研究而言,需要实现的是阐释,而非预测。事实上,文学批评家之所以需要一个具有人工智能的分类器算法,并不是指望它用87%的准确率告诉我们一首诗到底是不是俳句,或者一部戏到底是悲剧还是喜剧;算法批评的意义恰恰是利用它的人工智能,促使批评家发现之前使用别的方法未曾觉察的问题,帮助批评家分析和阐释文本并解析出新的意义。唯有这样的数字化文学研究,才会真正吸引我们扬帆驶向数字人文的“比特海”。
最后,让我们再回到库切,以《青春》中主人公面对计算机那段遐想作为结语:“逻辑其实是人类的一种创造,而不是生命的一个构成部分……计算机只是一些家伙为别的家伙娱乐而发明的玩具而已。他相信还有许多别的逻辑(但是还有多少呢?),每种都和‘非此即彼’的逻辑一样好。他赖以生存的这个玩具构成的威胁是它会把‘非此即彼’的途径深深地印进它的使用者的大脑中,因而将它们无可挽回地栓在了它的二元逻辑上,这就使它不仅仅是个玩具了。”