数字化时代古籍整理的新思路
上海师范大学 方广锠
中国是一个文明古国,中华文明有着高度的文明自觉。所谓“文明自觉”,我的定义是:“对自己创造的文明有着充分的价值评估,并力图采用一切方式使这一文明传承下去。”典籍是传承文明的最好方式。孔子以下,历代整理典籍的仁人志士前赴后继,就是这一文明自觉的体现。所以中国古籍之多,汗牛充栋。
自古到今,中国的典籍经历了写本、刻本、近现代印刷本等不同时期,现在已经跨入数字化的门坎,进入电子本时期。不同时期的典籍,因其制作方式不同,具有不同的特点。有关这一问题,我已经有文章论述,本文不再赘述。我认为,典籍在不同时期的不同特点无疑也是后代中国人不断进行古籍整理的原因之一。但是,由于种种原因,中华民族这个在历史上非常善于创造文化的民族,却不能同时也称为是一个善于保护文化的民族。深夜读书,每当读到一次次的文化浩劫、古籍零落,未尝不掩卷叹息再三。
社会在发展,文化也随着社会的发展而发展。新文化不可能凌空而生,必然应因时代需要,吸收新的营养,从旧文化中蜕变。自古到今,外来的文化也因在中国这块土地上与中国文化不断濡化,充分结合,才有了旺盛的生命力。这些都是每朝每代文化发展的高潮时期必然会进行古籍整理的内在动力。
一百多年前,中国的有识之士已经认识到中华文化面临着三千年未有之大变局。当时,中国人所谓的大变局主要是指西方文化的挑战。实际上,文化的交流从来是双向的,所以,所谓“挑战”也是双向的,这就是美国塞缪尔·亨廷顿提出:冷战后世界格局的决定因素表现为“文明的冲突”的文化背景。
在数字化时代的地球村,中华文明如何自存、如何发展?这里涉及到诸多问题,其中不少问题非笔者所能置喙,也不是本文的任务。本文仅谈谈笔者对数字化时代古籍整理的几点想法。应该说明,古籍数字化工作,在我国已经开展多年,取得可喜的成果。但目前的古籍数字化,大体是两种方式。一种是对应于传统排版书籍的电子植字本,一种是对应于传统影印书籍的电子影印本。虽然目前已经在古籍的电子植字本基础上开发了全文检索、主题索引等功能,但从总体看,以往古籍数字化的基本思路依然是立足於传统古籍,仅是利用数字化技术,开发出若干功能,因此依然保留传统古籍整理的种种弊病。笔者认为,我们应该转换立场,立足於发掘数字化技术的无限可能性,从底层开始,从数字化应用的角度,重新构建数字化时代的中华古籍,以充分拓展与利用数字化的优势,全面开发中华古籍资源,更好地弘扬中华传统文化。
一、利用数字技术重新构建中华古籍应该成为中华古籍整理的方向
现代数字技术的发展与人工智能的开发为人类社会的未来发展提供了新的无限的可能性。最近,谷歌围棋人机大战,阿尔法狗4比1战胜韩国李世石,这可以视为人工智能发展的又一个里程碑。科学技术就是生产力。正如有人评价人工智能时所说,这种人工智能正在颠覆整个世界。如果将互联网作为人工智能的一种表现,它已经大幅度改变了整个社会的面貌。那些在信息交换方面不够透明的行业,那些交易成本高的领域,都可能被新技术席卷而空。毫无疑问,利用数字技术重新构建中华古籍应该成为中华古籍整理的方向。
本文称“利用数字技术重新构建中华古籍应该成为中华古籍整理的方向”,乃基于如下几个理由:
第一,利用数字技术可以做到古籍的信息全覆盖,使我们将古籍整理的水平提高到新的高度。
一本古籍,它所包含的信息是多方面的。就敦煌遗书而言,包含了文物、文献、文字三个方面的研究信息。以往的古籍整理,往往将三者割裂开来。传统的古籍整理者,更是往往仅关注其文献价值。其实,上述三个方面的信息相互融合贯通而成为一个整体,利用数字技术可以全面覆盖与发掘敦煌遗书内涵的各种信息,可以让我们将敦煌遗书的整理水平与研究水平提高到新的高度。笔者主持开发的“敦煌遗书数据库”全面采集敦煌遗书中文物、文献、文字三个方面的研究信息,努力将这些信息组合起来,全面研究敦煌遗书,更好地发掘与体现敦煌遗书的内在价值,已经取得一定的成果,目前正在进一步完善系统。
第二,利用数字技术重新构建中华古籍可以避免重复劳动,实现有效学术积累,让所整理的古籍真正达到“尽善尽美之境”。
以往的古籍整理,采用的依然是刘向以来中国两千年古籍整理的传统模式。但人力毕竟有穷尽时,所谓“校书如扫落叶,旋扫旋生”。无论何人,无论其学术水平多么高超、工作态度多么精审,他的古籍整理成果,依然会有错误,差异只在错误的大小与多少。笔者主编的《藏外佛教文献》,用“以精益求精之心,求尽善尽美之境”这一口号自我勉励,但出版以后,其中的错误,有时让笔者自己无地自容。所以,在中国历史上,从古到今,同一本古籍,虽有不同的研究者反复校勘标点,依然难以让所有的读者都满意,于是新的重复劳动不断涌现。此外,还有这样的情况:研究者对某一古籍发现前此未曾利用、但很有价值的传本。按照传统整理方式,此时就会有人将该古籍再整理一遍。如此等等,20年来,仅《史记》、《敦煌变文》等古籍的整理本,出版不知凡几。
利用数字技术重新构建中华古籍,可以让我们彻底跳出刘向以来的这一传统模式,避免重复劳动,实现古籍整理的有效学术积累。且积以时日,可以让所整理的古籍在与读者的不断互动中真正达到“尽善尽美之境”。
第三,利用数字技术重新构建中华古籍,可以按照不同工作程序所需的不同学术含量,把古籍整理工作分解为若干个环节,从而尽量减少古籍整理者的工作量,减少无效劳动,让古籍整理者将更多的时间用于学术含量更高的创造性思维劳动。
传统的古籍整理方式,需要整理者对底校本的文字一一比对。一般来说,底校本的文字差异不会超过10%。因为如果超过10%,应当视同异本,只能参校,不能用来作校本。由于整理者最终核对出来的异文不会超过10%,也就是说,整理者90%以上的比对工作都属于无效劳动。虽则如此,整理者必须圆睁双眼、逐一比对底校本的文字,唯恐有所疏漏。自然,古籍整理本来就属于沙里淘金。金子再少,也不能漏掉;沙子再多,也得一粒一粒去数。但如果能有一种方式,直接将沙子淘掉,将金子挑出来,岂不是可以大大减少整理者的工作负担?笔者主持设计的数字化古籍整理系统,按照不同工作程序本身所需要的不同学术含量,把古籍整理工作分解为不同的环节,可由一般工作人员及系统本身去完成那些学术含量较低的工作。比如可以由系统自动进行文字比对,忽略相同的文字,仅将异文提示给整理者。与传统古籍整理方式相比,这一系统可以为整理者减少90%以上的文字比对工作量。让整理者把时间更多地用于文字的订正、词义的辨析、标点的正误、内容的诠释。
自然,这样的古籍重建工作不是仅凭个人力量可以完成的,故此时的古籍整理也从传统的个体劳动变成集团化劳动,中华古籍整理将出现全新的局面。
第四,笔者目前主持设计的数字化古籍整理系统,将包括诸多模块,可以按照使用者的不同要求,从文字、词语、句法、文本等各种不同角度,提供各种不同形态的古籍整理成果。并可以在上述成果的基础上,建立各种数字化知识模型,对中华传统文化进行更加深入的研究。此外,如古籍的现代汉语译注、外语翻译等工作,都可以在同一平台上进行。目前除了字库初步成型,其他方面的工作正在设计中,其前景是令人向往的。
二、利用数字技术重新构建中华古籍,需要建立古籍整理新理念
数字化古籍整理与传统古籍整理是完全不同的两种工作方式,需要建立相应的古籍整理新理念。
第一,废除底本、校本区别,对参校古籍一视同仁。
由于古籍整理需要诸本对校,指误正谬,工作量浩大,为了减少工作量,传统的古籍整理采用尽量压缩校记数量这一方法。具体的做法是:整理者首先需要找到一个好的底本。所谓好的底本,就是相对来说,它的行文错误较少。整理者以底本为依据,参校其他校本。传统一般采取凡是底本正确,一律不再出校;凡是底本有误,则斟酌校本出校或作理校。采用这种方式,如果选对底本,的确可以大大减少整理者的工作量。
问题在於,什么样的传本才是好的底本?这自然完全由整理者判定。张之洞当年撰写《书目答问》,就是为给天下读书人提供一个相对好一点的读本。但个人的见闻、水平毕竟有限,整理者又怎么能够保证自己所选择的底本一定是该典籍的最好版本?
如上所述,数字化古籍整理能够利用数字化技术比对文字、提示异文,大大减轻了整理者的工作量,故没有必要再对参校诸本作区别对待。相反,应该对参校诸本一视同仁,这样才能真正做到参校诸本的信息全覆盖。所以,传统的底校本观念在数字化古籍整理中将被颠覆。
第二,逢异必校,择善而从,提供原始资料。
如前所述,为了减少工作量,传统的古籍整理在校勘中,凡是底本正确,一律不再出校;凡是底本有误,则斟酌校本出校;诸本皆误,由整理者理校。与上述哪个传本可作底本完全依靠整理者主观判定一样,底校本的哪些文字正确,是否需要出校,也完全由整理者主观判定。由此,所完成的整理本的质量高低,完全依赖於整理者的学术水平及工作态度。然而,是人就会犯错误。所以,上述方法不能保证整理本不出错误。
由于上述校勘方法的弊病,所以中华古籍整理又出现“逢异必校”这一方式,即只要底校本文字有岐异,则一律出校。
采用“逢异必校”这一方式,此后又有两种选择:
一种是“不作案断”。即仅仅校异,然后把各种异文写入校记,交给读者去判断正误。《中华大藏经》(汉文部分上编)就是这样做的。
一种是“择善而从”,即整理者从诸多异文中确定自以为最正确的文字写入整理本,诸本皆误则作理校,同时在校记中罗列所有的异文。这种方式便于读者对整理者的工作进行评判。我主持的《藏外佛教文献》就是这样做的。
坦率说,上面提到的“废除底校本区别”、“逢异必校、择善而从”等理念,虽为数字化古籍整理之必须,但从原则上讲,依然属于传统古籍整理也可以采用的,如《藏外佛教文献》实际上就是这样做的。与底本正确不出校相比,后一种方法的优点仅在于提供了参校诸本的所有异文,让读者有可能对整理本的正误做出判别。
从理论上讲,采用“逢异必校、择善而从”这种方式,由于整理本中已经包含了参校诸本的全部信息。即使整理者有误,读者亦可以根据校记来进行勘误。但俗话说“无错不成书”,整理者是否能够真正做到把参校诸本的异文全部校出,并全部正确列入校记,显然是要打一个问号的。由于此时整理者仅提供一个整理本,而他所使用的参校诸本往往不少属于希见本,甚至属于文物,一般读者难以见到,于是对一般读者而言,也就只能凭籍整理本提供的信息来评判整理者所作的工作。这种评判的效果,自然也要打一个折扣。亦即整理者掌握的参校诸本,读者并不掌握,整理者与读者处在信息不对称的两端,借用上文的表述,传统的古籍整理就是一个“信息交换方面不够透明的行业”。读者对该整理本,要么信从,要么拒绝。如果信从,则如整理本(含校记)有误,作为信息链下端的读者,很难发现整理本的错误。那么,依据整理本所作的学术研究也就难免会出现这样那样的问题。
利用数字技术重新构建中华古籍可以彻底改变这一局面。笔者主持设计的古籍整理系统将在整理本层面,把整理本与每一个参校本链接起来;在参校本层面,将每一个参校本的每一个文字与它的原始资料链接起来。这样,读者可以通过系统提供的追溯功能,对自己存疑的每一个校本、每一处文字进行复核,查核其原始资料。这样,读者便与整理者处在信息完全对称的同一平台上,就可以对整理本进行全面、深入的评价;发现有问题,可以提出修订或商榷意见。系统会自动记录读者的意见,反馈给整理者及其后的所有读者,供大家择善而从,以进一步完善与提高整理本的水平。笔者相信,如果采用这种方式不断互动下去,中华古籍整理将有希望臻于尽善尽美的境地。
第三,对古籍整理著作权的新挑战
利用数字技术重新构建中华古籍,古籍整理由传统的个体劳动变成集团化劳动;由传统的不断推倒重来的重复劳动,变成不断进行知识积累的过程。这一工作方式的彻底转变,对传统的古籍著作权提出新的挑战。在知识产权变得日益重要的今天,如何解决“利用数字技术重新构建中华古籍”过程中产生的古籍整理著作权问题,也需要我们未雨绸缪。
第四,充分发挥数字化优势,不断开发、完善新的功能。
如前所述,现代数字技术的发展与人工智能的开发为人类社会的未来发展提供了新的无限的可能性。本文在已经试运行的古籍整理系统的基础上,提出了一些令人向往的前景。但坦率说,我们现在还不能把数字化古籍整理可能给我们提供的“无限的可能性”看得很清楚。这就需要我们不断地摸索创新,充分发挥数字化的优势,不断开发利用数字技术重新构建出的古籍的各种新功能,以使中华传统古籍在新时代发出焕发新的生命力。
三、结语
人类社会从渔猎时代、农耕时代、工业时代、信息时代走来,现在已经见到智能时代的曙光。历史的经验告诉我们,不同种类的工作,往往会因为技术手段的更新换代,出现断崖式的更替与兴衰。这对我们古籍整理工作者来说,同样既是挑战,也是机遇。能否面对挑战,抓住机遇,使我们的古籍整理工作与时俱进,跃上新台阶,是我们这一代古籍整理工作者面临的任务。这里当然离不开国家层面的扶持,但更主要的是我们自己的创新性劳动。我想,只要我们盯住时代前沿,重视实用创新,不作玄虚空谈,踏踏实实,一步一步走下去,总能达到理想的彼岸。
- 上一篇:医疗胶片数字化 2017/5/8
- 下一篇:没有啦