激活中华典籍的“数字生命”
——对我国古籍数字化建设的调查与思考
作者:光明日报联合调研组(执笔人:北京市习近平新时代中国特色社会主义思想研究中心特约研究员吴占勇、本报记者白雪蕾;调研组其他成员:中央民族大学新闻与传播学院张亚文、张志颖)
编者按
我国古代典籍卷帙浩繁,见证着中华民族悠久的历史,是中华文化的重要载体。2023年10月,习近平总书记对宣传思想文化工作作出重要指示,明确提出要“着力赓续中华文脉、推动中华优秀传统文化创造性转化和创新性发展”。2022年4月,中共中央办公厅、国务院办公厅印发《关于推进新时代古籍工作的意见》,明确提出“推进古籍数字化”。同年10月,全国古籍整理出版规划领导小组印发《2021—2035年国家古籍工作规划》,将“国家古籍数字化工程”列为四项重大工程之一,对相关工作进行详细规划。那么,当前我国古籍数字化的建设状况如何?产生了哪些大众喜闻乐见的案例?未来又该如何优化发展?围绕上述问题,光明日报记者会同中央民族大学组成联合调研组,对参与古籍数字化建设与传播工作的图书馆、科研院校、互联网企业、出版单位等工作人员开展深度访谈,并对文化类数字产品的活跃用户—青年群体进行问卷调查(有效问卷689份),在系统梳理古籍数字化建设经验的基础上,针对其高质量发展提出对策建议。
轻点鼠标,随着一缕悠远的音乐,“永乐大典”在隽秀的书法背景中缓缓浮现……
“终于让我们普通读者一睹国宝真容。”家住山东滕州的古籍爱好者李庆,在电脑屏幕前浏览《永乐大典》数字版时发出感叹。他所观看的,是由国家图书馆出版社有限公司和北京大学-字节跳动数字人文开放实验室联合研发的“《永乐大典》高清影像数据库”。历经600多年风雨,成书于明朝的《永乐大典》存世数量不及原书的4%,眼前的影像数据库让每一位读者都能感受它的厚重与魅力。
保护和传承中华古籍不仅是维护中华文明根基的重要任务,更是向世界传播中华文化智慧、造就中华文明新形态的关键环节。在学术意义上,古籍数字化意味着运用数字技术对古籍进行收藏与保护、整理与研究、呈现与出版,而在更广阔的人类文明衍进层面,数字化使古籍中的智慧精华,能够通过趣味性、前沿性和大众化的方式,得到传播与推广。调研中,98%的受访者认为应对古籍进行数字化转化,几乎相同比例的人认为数字技术对古籍保护和传承发挥着显着作用。
焕新 以数字科技赓续中华文脉
古籍保护层面,数字化实现古籍生命永久存续,助力海外遗珍重现容颜。
中华文明是世界上唯一没有中断的文明,在数千年历史进程中,传世古籍浩如烟海。古籍不仅包含传统线装古籍,还包括甲骨、简帛、碑帖拓本、古地图等。《中国古籍总目》显示,我国现存古籍约有20万种。数字科技从根本上改变了古籍保护逻辑,通过“数字孪生”和“入库共享”,使古籍以数字形态永久保存。
“古籍数字化关系到我们国家文化资源的安全。古籍一旦遇到火灾、水灾等,将带来不可逆的损坏”,国家图书馆(国家古籍保护中心)办公室介绍。由国家图书馆(国家古籍保护中心)建设的“中华古籍资源库”,目前已发布古籍资源10.3万部(件),共2640万页,其中,读者利用率最高的善本古籍,已有2万多部实现上网。
对于壁画、彩塑等无法永久传世的文化形态,数字复刻更为重要。敦煌研究院的“数字敦煌”项目,将洞窟、壁画等制作成数字图像,一方面能永久保存敦煌文化信息,另一方面可使游客将线上参观与实地游览相结合,降低过量游客进入洞窟带来的文物保护压力。
除了在时间维度上永久延续古籍生命,数字技术还打破空间限制,使散布于国外的中华古籍能够以数字方式重现真颜。公开资料显示,由山东大学作为主体单位实施的“全球汉籍合璧工程”,对境外存藏的中华古籍进行调查摸底和数字化回引,至2023年7月,已经发现1900多种中国大陆缺藏的珍稀汉籍,并复制回归1600余种。
古籍整理层面,数字化推动古籍搭上智能“快车”,促进整理工作提质增效。
在影像复刻基础上,运用人工智能技术对古籍文本进行提取、标引、分析等,是数字科技助力古籍传承的关键一环。北京大学数字人文研究中心主任王军曾指出,依照国内修复整理古籍的速度,可能需要300年才能将现存古籍全部修复整理出来,但借助人工智能技术,这一时间大概会缩短至二三十年。
“古籍的数字化整理部分,我们从人力和资金的投入上来说是比较多的”,字节跳动公益古籍项目相关负责人告诉调研组。由于数字化整理需要把纸本内容转化成数字文档,古籍特有的假体字、异体字和书写方式等,对转化准确率形成挑战。在文本提取基础上,自动断句、自动标点以及识别文本中的人名、地名、官职名等,更体现着智能科技对古籍整理工作的颠覆式迭代。
当然,机器无法百分百准确地识别语义,人工标注和校对依然重要。借助数字平台,古籍整理的众包模式悄然兴起。中华书局下属的古联公司在2018年推出古籍整理众包平台,2020年上线了能在移动端分发任务的“i编纂”小程序。公司总经理洪涛向调研组介绍:“众包平台有5000多位注册用户,他们是来自各行各业的古籍爱好者。”据悉,该平台上编校过的任务近5万个,处理的古籍超14亿字。
古籍传播层面,数字化推动“蒙尘”古籍走向前台,搭载互联网实现开放共享。
小谭是中国古典文献学专业的在读研究生,日常学习“穿梭”于各大古籍网络平台。“这些平台基本能满足对材料的初步检索搜集,许多平台还提供珍贵古籍书影数据,不用去各地奔波就能看到古籍原貌。”
点开国家图书馆(国家古籍保护中心)建设的“中华古籍资源库”,排列着数字古籍、数字方志、赵城金藏、碑帖菁华、甲骨世界等20余个子栏目,支持单库检索、多库检索、精确检索、模煳检索。由北京大学-字节跳动数字人文开放实验室打造的“识典古籍”平台,提供原本影像对照、繁简转换、文白翻译等功能,并对内容添加了标点和注疏,还能显示文中人名、地名、书名等专有名词详细介绍。据调查,超过80%的受访者期待使用集搜索、翻译、注释等功能于一体的古籍应用平台,这些功能使古文褪去晦涩难懂的外壳,极大方便用户阅读和学习。
分布于全国各地的珍贵古籍也借助数字化浪潮纷纷亮相。截至2023年9月,国家图书馆(国家古籍保护中心)联合各地图书单位开展了8次古籍数字资源发布活动,地方图书单位累计发布古籍资源超过2.8万部(件),参与发布的机构下沉至县级图书馆。针对全省各地市馆不少珍贵古籍已做数字化处理但未能发布的情况,浙江图书馆建立了“浙江省历史文献数字资源总库”,已发布古籍2600余种,约6.5万余卷。联合发布让散布于中华大地的珍贵古籍重焕光彩。
活化 融古于今绘就现代文明
内容的活化:萃取海量古籍中的知识网络
将海量古籍文本进行数字化提取,就形成了汇聚先哲智慧的“大数据库”。借助智能分析技术,能够针对其开展深度文本挖掘、社会网络分析、时空关系分析、知识图谱建构等,让大众全面又直观地理解古籍中的知识网络。
浙江大学徐永明教授团队开发的“智慧古籍平台”,在提供文本分词、标注、释义、文白翻译等功能基础上,还为用户呈现古籍着者的世系图、社会关系图等。“未来的发展方向,是将古籍文本与结构化数据进行关联,实现智能化处理”,徐永明教授告诉调研组,他的团队还开发了学术地图发布平台,以地理信息系统为依托显示其规律性、综合性数据,比如李白、杜甫一生中的地理迁徙轨迹图等,这一平台在中学语文教学中得到广泛应用。
对古籍文本知识进行显性化提取,也是北京大学数字人文研究中心持续发力之事。近期该中心上线“文献溯源分析平台”,能够呈现词语在古籍文本中的出现频次、共现情况等,并可追溯句子的来龙去脉,观察句意相似句子在形式和内涵上的流变过程。“吸引大众参与是古籍活化的重点,要利用智能技术让社会更多接触和使用古籍数据”,中心研究员位通谈到。在北京大学2022年举办的首届“北京大学数字人文作品展”中,“中国古代名人迁居地图”“中国古典诗歌声律分析系统”等也令人印象深刻。
形态的活化:虚拟仿真推动古籍融入现代生活
“千年之后,还有这么多人喜欢我,我还是蛮欣慰的”,在2023年央视《中国诗词大会》现场,诗人苏轼“穿越”而来,不仅为选手出题,还与演员饰演的黄庭坚一起再现了“鄱阳湖相会”。这位“苏轼先生”让人难辨真假,而“他”正是当下火热的虚拟数字人。
再如,深度沉浸的超现实技术将古籍活化推向新高度。2023年在国家典籍博物馆举办的“古籍寻游记”体验项目引发热烈追捧,观众只需头戴虚拟现实头盔,手持操作手柄,便能够“亲身”穿梭于历史时空,“亲手”将文物捧在掌心。
在技术加持下,虚拟现实、沉浸参与、人机交互、智能传播等为文化创新持续赋能。从“阅读古籍”到“身临其境”,技术重构了人与古籍的互动场景,让人能在综合感官体验中领略文化魅力,提升对文化的归属感和认同感。
此外,网络游戏、数字展厅、数字藏品等当下流行的传播形式,在多个维度上助力古籍从“活”起来到“潮”起来。
体验的活化:借助数字影像讲好古籍故事
古籍不仅蕴含古人智慧,也承载着中华文明发展的集体记忆。传播经典古籍,要将古籍知识与古籍历史相结合,运用具象化、生动化的手法讲好古籍故事。近年来,《典籍里的中国》《山海奇幻夜》《穿越时空的古籍》等视听节目,不断创新古籍影像叙事策略,引发一轮又一轮“古籍热”。更为重要的是,这些节目注重在时空交融中诠释中华古籍的当代价值。
“一直说‘古’会陷入曲高和寡,一定要汲取古籍对当下有指导意义、能够产生共鸣的点。”《山海奇幻夜》总导演雪芬向调研组介绍,“比如我们把夸父追日诠释为奔跑在路上的执着,将飞走的神鸟演绎为追求光明,这都能与现实唿应。”
短视频平台上,古籍的能见度也越来越高。抖音平台#寻找古籍守护人#话题播放超过25亿次,快手平台#古籍古书#话题播放3亿多次,古籍专家、普通用户和文化机构等讲述各自故事,让古籍及其文化通过手机屏幕进一步走进大众生活。
反思 古籍数字化还需要完善什么
建设主体各自为政,技术标准不统一,数据库之间壁垒明显。当前,全国范围内的古籍数据库,在建设中缺少统一的技术规范,古籍的呈现、标注、检索等“千库千样”,质量参差不齐。随着数字化平台增多,库与库之间的壁垒愈加显现,用户难以实现“一站式检索”。面对海量古籍,对哪些书目进行数字化处理,各个建设单位缺少协同。“因没有相对可持续的规划,有较多重复制作,造成浪费”,某省级图书馆管理人员向调研组坦陈。
行业开放程度不足,版权保护不健全,制约古籍的全社会共享。古籍是属于全社会的文化遗产,部分图书馆抱有“奇货可居”的思想,共享意识不足。古籍馆藏量仅次于公共图书馆的高校图书馆,长期定位于服务本校师生,向全社会开放程度不够。同时,古籍数字化建设的版权保护体系尚未形成,削弱了图书机构数据库建设的主观动力。“我们做数字化工作,最担心的是出现盗印、非法牟利等现象”,广东省立中山图书馆工作人员告诉调研组。
古籍活化系统性弱,资源配置待完善,“数字高阁”隐忧凸显。在古籍数字化建设目标上,多位受访专家表示,结构化、智能化开发古籍数据更为重要,但目前国内在这一层面“只见树木,未见森林”。从事古籍活化的主体数量较少、力量分散、单兵作战,在人力、财力和技术上面临制约。部分数字影像内容,将古籍元素作为噱头谋取利益,缺乏真正的文化传播意识,而与之形成对比的是,73%的受访者认为古籍数字化产品的宣传推广不充分。长此以往,古代典籍难免会被置于“数字高阁”。
古籍活化内容单一,集中于文史题材,更多古代智慧亟待呈现。在活化产品层面,65%的受访者认为产品形式相对单一,57%的受访者认为内容活化程度不够。在活化对象上,当前的数字产品通常聚焦文学和历史题材内容,对于中医、数学、生物、天文等自然科学领域古籍呈现较少。不少经典文学巨着已得到不同建设单位反复深度开发,但辉煌灿烂的古代科技发展图景,尚未进行有效的数字化呈现。如何克服技术难关,活化更多题材中华典籍,是未来建设不可忽视的问题。
展望 我国古籍数字化工作高质量发展的策略建议
加强统筹规划,推进行业主体协同建设,助力中华古籍高效数字化传播。当前全国尚有大量古籍未被数字化,应制定出台古籍数字化建设统一标准,在元数据规范、技术选型、平台功能等方面进行系统规划。加强各类图书馆、互联网企业、出版社等在古籍数字化建设中的联通渠道和共享机制,编制全国性古籍馆藏联合目录以及数字化古籍联合目录,打造一体化检索平台。完善古籍数字化建设版权保护,分析制定针对古籍整理、技术开发、活化设计等不同环节的版权认定与保护细则,规范行业与市场发展。
完善顶层设计,布局数字人文战略方向,引领文化软实力建设国际前沿。社会各界应充分认识古籍活化在当代文化传承中的重要作用,大力推进人工智能、大数据、云计算、可视化等技术融入古籍工作。针对前沿技术创新需求,发挥高水平企业和科研院所技术研发优势,破解技术创新难题。将全局规划与重点支持相结合,打造一批高质量古籍类数字人文产品。积极引领世界数字人文发展前沿,加强对外合作交流,向世界宣传推介我国古籍数字化建设成果,增强我国文化软实力和中华文化国际影响力。
坚守传承导向,丰富古籍活化产品层次,满足大众的文化精品阅听需求。68%的受访者愿意为古籍数字化产品付费,46%的受访者会出于体验新奇技术的目的使用古籍活化产品。应积极利用前沿数字科技和交互传播技术开发古籍活化产品,满足受众对传统文化体验和参与的多重需求。打造古籍产品IP,开发适配网络空间和现实世界多重场景的系列产品,在展览、文旅、科普、出版等事业方面积极应用。面向大视听时代,在短视频平台、播客平台和专业视听节目中嵌入古籍产品,搭载网络超链接汇聚古籍内容,引导大众关注古籍、传承文化。
优化人才培养,打通专业教育与社会参与,造就数字化建设有生力量。2022年,教育部将数字人文专业列入普通高等学校本科专业目录,但目前仅有个别高校开设此专业,应推动有条件、有基础的高校积极布局、开展办学。同时,依托国家新文科和新工科建设战略,加强信息技术、新媒体技术、视觉设计等学科知识与古典文献学、汉语言文学等专业交叉融合。推进高校与企业协同,在产、学、研深度融合中培育人才。面向社会开办古籍数字化专项培训班,统筹建设在线课程,推广古籍整理与数字出版众包模式,激活社会力量参与古籍数字化建设与传播。
开展成果转化,推动古籍数智产品进校园,以现代科技促进青少年文化传承。中小学校是古代文化历史教育重地,将古籍数智产品与学校教育相结合,能够以新鲜、趣味的方式提升育人效果。教育机构与出版机构、科技企业等统筹规划,建立面向不同学习阶段的古代文化教学资源库,推动古籍整理、智能开发、数字出版和校园应用一体化发展。举办灵活多样的古籍相关主题活动,培养青少年学习兴趣,以线上线下联通的方式推动青少年传承中华文明。
《光明日报》(2024年01月25日 07版)