设为首页 | 加入收藏 | 联系我们

河北法学

精文推荐

当前位置: 期刊首页 >> 精文推荐 >> 正文



【专题 构建中国自主的法学知识体系研究之三|徐小芳 柯岚】中国传统司法数据库构建的方法、拓展路径与挑战
日期: 2024-09-23      信息来源:      点击数:

作者简介徐小芳,女,江苏如皋人,华中科技大学法学院法学理论博士研究生,研究方向:中国法律史、法律文化;柯岚,女,湖北孝感人,华中科技大学法学院教授,博士生导师,研究方向:法理学、中国法律史、法律文化。


摘要在新科技发展时代,中国传统司法数据库的构建已成为当下及未来的必然趋势,系统的方法、可能的拓展路径及未来面临的挑战等问题是数据库构建完善的重点。就方法构建而言,应采取数字人文形式,完成数字分析功能与可视化程序,同时立足整个人文社科领域,进行多样数据类型联动。至于拓展路径,则可从传统司法哲学”“司法机构司法官员着手。即使如此,未来数据库的发展也必然面临人文性保持、经验传授、化约、完美运用可视化程序技术、数据化过程中难免错漏的五重困境。

关键词中国传统司法数据库;数字人文;方法;拓展路径;五重战


引言

法学界早在20年前就展开了对所处时代科技应有法律约束力之研究,预测到人工智能、区块链、司法大数据等必然会成为未来法律与科技主题的研究热点。当互联网似乎渐渐失去魅力,人们的视野就转向了人工智能、区块链、大数据等未来科技上。如於兴中多讨论人与科技、数字编码、人工智能;郑戈多关注区块链、大数据、数字社会、算法、基因编辑技术、司法科技;彭中礼将人工智能与司法裁判相融合;杨安卓集中于数字、科幻、网络法等等。其中司法大数据是上述众多学者关注的重要一环,主要集中于对未来司法大数据实务中所起到作用的提前预测以及司法大数据提高司法效率和公正性等方面。与此同时,司法大数据的发展也对我国传统司法资源的挖掘与研究产生着负向正向的冲击,如何在冲击下寻求学科健康持续的发展成为法史研究新命题。我们需知挑战往往与机遇并存,这不禁让人开始设想法史生命延展的一种新方式,即与司法大数据相融合,积极应对、充分发挥司法大数据大容量、大流量、应用价值高的特点,帮助法史研究摆脱应用价值低、长期处于困境的情况。这一设想也带来了一系列疑惑:传统司法数据库的设立是可能还是一种必然?中国传统司法数据库对法史研究有何种帮助,又是否存在不足?此类数据库构建过程中应遵行何种方式方法、有哪些注意之处?这与传统的法史研究、人工智能的结合等方式又有何种不同?

答案显而易见,中国传统司法数据库的建设不再是一种未来可能,而是新时代下正在兴起与发展的必然。国内学界已建立了诸多地方司法数据库,法律史学者在实际研究中也进行着构建各种数据库类型的摸索。只不过这一构建的区别与传统融合人类学、社会学方式不同,它并不是一种范式,而是一种对科技的利用。换言之,将新时代科技作为推进法史研究的工具,使法史研究更为具象化、科学化,更多地趋向于工具论,而非方法论。因此,传统司法数据库的构建与当代裁判文书网、司法数据库有所不同,它不应仅是对传统司法案例的搜集与限于地方或某一历史时期,还应包括案例之外的传统司法智慧、哲学、官员等诸多可拓展路径,研究年限不断扩充以及结合当代诸多学者在这些领域认识的争鸣,实现地方与全国传统司法数据库建设的联动。它是数字与人文的结合,依旧离不开法史研究应有的人文关怀。它与人工智能也不同,人工智能只是一种机器学习,而传统司法数据库走向的是数字人文时代,不追求泛数字化,它的存在是为了通过诸多数据整理,摸清传统司法中的因果关系或人、事、物的关联性以及通过可视化程序演示法史研究中传统法哲学演进脉络、中国传统法学符号背后的哲学智慧、法律儒家化程度等颇具争议的议题及以往未被发现的新问题。

职是之故,本文将着重就当下司法大数据与法史结合的现实案例、构建方法、未来可能拓展的路径以及必然面临的挑战四点进行尝试性论证,以期为法史研究提供新的工具,推进法史研究的实用性,加快法史与其他学科的对话进程,确保其与时代接轨。


一、数据与法史相结合的实际案例

随着数字时代的发展,许多学科很早就对传统历史文献资源数据化、数字化展开探索,形成跨平台与多格式的原生数字文化资料,此类研究成果也成为了法史传统司法数据库建立时可供参考、使用与合作的资源之一。学界目前对传统法律资源数据化或数据库进行实践的方式共两类:一类是高校与图书馆、档案馆等单位合作建立的地方传统司法资源数据库;另一类则是高校学者根据各自研究方向开展的不同类型数据库研究。两种形式在实际展开过程中各有优势,也存在相应不足。

(一)法史学界对法史+司法档案未来形式的理论探讨

在上世纪80年代,中国法史学界便意识到司法档案的重要性,近来学者们也对档案进行了量化研究,并在量化研究基础上探讨档案数字化”“法史研究人工智能化等议题。就档案重要性来说,1939年杨鸿烈就指出档案对中国近代历史研究,尤其对社会史、法制史与犯罪史研究的重要性。80年代早期,学界开始注重对一些清代地方档案的运用,但此种研究方式在当时并未形成风气。一直到1998年黄宗智Civil Justice in China: Representation and Practice in the Qing中文版书籍的出版,才将法史学界对档案的利用与研究从门可罗雀走向万人空巷。一时间与司法档案整理与研究相关的作品不断涌出,如《从诉讼档案出发:中国法律、社会与文化》《龙泉司法档案选编》《清代南部县衙档案目录》等。马小红也曾呼吁学界多注意乡村社会经济史与地方档案资料的运用,即使在后来的法律文化研究中,她也认为诉讼案件档案,尤其是县级民事案件,使用的学者极少,乃是一个等待发掘的宝库。后来,随着档案研究热潮的深入,法史学界逐步意识到档案自身不足。尤陈俊觉得应注意某些司法档案中虚构成分,但只要议题选择得当,司法档案在法律史研究中还是具有一定的学术价值。谢晶则指出司法档案的挖掘丰富了法史研究,但要注意理论先行+材料填充的陷阱。确认司法档案重要性与辨证运用后,陈志武、林展、彭凯翔等人针对清朝刑科题本中的债务、婚姻、命盗等案件进行量化研究,该研究建立在馆藏清代内阁全宗刑科题本电子档对外开放的基础上。然而量化研究在法史学界的运用存在较大的局限性,它不仅要求法史学者要娴熟掌握统计学研究方法,对研究对象必须达到可量化性水平,还多以因果关系的建立对某一理论或假说进行证伪、证成或归纳,要求法史学者在自身综合能力过硬的同时,还要不断转变思路,一直保持突破陈规。周东平曾言,当前中国法律史学存在的问题多面性和复杂性的,需要多方面共同努力,有鉴于此,在前者研究基础上,结合新时代发展特色,学者对法史+司法档案未来形式的探索开始不再满足于纸质与量化,而是向电子数据、电子数据库建设、人工智能化及数字人文领域进军。赵彦昌曾对中国司法档案与中国法律史研究作专文论述,并于2022年倡议在数字人文视野下采取多元主体参与、档案资源整合、基于文本档案信息挖掘等方式,可视化展示法律史档案;刘顺峰也从法律史视角表示了在人工智能时代法史研究未来何去何从的思考。理论先行,实践随后。经过对司法档案量化、数据库及人工智能与法史结合的几个阶段探讨,中国传统法律资源数据化的实际操作及类型划分走向了当代数字舞台。

(二)局限于地方、案例为主的传统司法数据库

没有纸质档(或其他可实际接触形式)的传统法律文献资源,数据库形成阶段的第一步电子化就无法完成。那我国原始法律资源档案有哪些呢?其一,简牍类。例如清华大学出土文献研究中心对清华简的整理与解读,其中不乏对中国战国时期法律符号和法哲学观念的研究;长沙走马楼发现的十几万枚三国吴简中就含有当时的司法文书,主要记录了孙吴嘉禾时期的户籍审核、民事诉讼、经济审判等案件,学界对吴简进行探讨与研究的著作与文章不在少数。如已经发掘的一千一百多枚睡虎地云梦秦简,出土的《法律问答》《秦律杂抄》《秦律十八种》《封诊式》等被历史学者和法史学者相继解读,成为法史学界了解秦律最基本的历史文献;又如甘肃简牍博物馆保存的四万多枚中古时期的简牍中记载了中古时期丝绸之路上中国的司法案例。其二,各级档案馆保存的纸质司法档案。上述中古时期的原始档案就如此之多,明、清、民国时期的档案就更是浩如烟海。这些司法档案包括:四川省档案馆的巴县司法档案汇编、浙江龙泉档案馆的《龙泉司法档案选编》、江苏省档案馆馆藏的司法档案、《清代四川南部县衙档案》、中国第一历史档案馆馆藏的清代档案、中国第二历史档案馆馆藏的民国档案等。其三,业已成书的档案资料。如《中国明代档案总汇》《中华民国史档案资料汇编》《历代判例判读》《中国珍稀法律典籍续编》《明清法制史料辑刊》等。

基于原始传统司法档案的整理基础,一些电子化的传统司法数据库悄然上线。如台湾大学图书馆已建立专门的淡新档案资料库http://thdl.ntu.edu.twhttp://dtrap.lib.ntu.edu.tw),该资料库对每一件案件都进行了分析,并建立了关键词”“人名注解”“印记种类”“主要关系人及职称/身分等元数据。针对淡新档案中的客家事件,台湾还建立了淡新档案客家研究数位分析系统。该数字化档案依据特定使用对象与目的进行专业编排,以多重脉络作为系统性的方法论,将标题、摘要、日期、相关人员与关键词等做元数据处理,同时,也对元数据进行深层次的、门//款、客家事件、客家事件主题表设计。基于淡新档案资料库元数据的原始设计,淡新档案客家研究数位分析系统又进一步提取重要标签词汇,标记于档案全文,并在标记处提供权威参照,有效避免了使用者在阅读时容易忽视一些线索的弊端。如古联数字传媒与中国人民大学联合建立的龙泉司法档案选编数据库http://longquan.ancientbooks.cn),该数据库界面左侧设有案件主题”“案件信息导引栏,可通过输入相关主题词进行检索。界面首页设有案件总览选项,而案件总览页面又进行了案件类型”“案件主题内含文书类型三类。又如高校与地方档案馆合作的中国司法档案数据库·江津卷,按照档案原始保存状态进行整理。目下数据库已完成第二期建设,分12类导引:债务纠纷、租佃纠纷、买卖纠纷、财产纠纷、婚姻纠纷、违反税法、盗窃、诈骗案、吸食烟毒案、妨害家庭、其他刑事、其他民事,亦可进行关键词检索。与淡新档案资料库相比,龙泉司法档案选编数据库、中国司法档案数据库·江津卷在元数据处理技术上仍不成熟,检索条目相对简单。当然,我国已数字化的传统司法档案不只上述三种,还包括巴县档案、南部档案、冕宁档案、会理档案、叙永档案等。

(三)2019—2023年间与法史相关的传统数据库类型研究情况

那我国学者对传统数据库类型研究如何?以2019年至2023年国家社科基金重大项目立项名单为例,依据五年间传统数据库类型研究数据,将法史学界与其他人文学科进行对比,分析当前法史学界对传统数据库类型研究处于何种境况。

2019—2023年度,我国国家社科基金重大项目立项1724项,其中与大数据相关项目201945个,202042个,202148个,202248个,202339个。至于20192023年度法史学与大数据相融合的情况,可见表1

从表1我们可以看到2019年可能与法律史内容相关并与大数据相结合的立项3个,分别涉及新中国成立以来农村建制、清代时期国家对外建交情况和明代至民国时期的契约文书整理。同时期与大数据相关的历史学8个,文学、伦理学与哲学8个,法学4个。其中历史学立项内容涵盖传统色彩、满族民间档案、清明黄河治理、近代科学社团、方言、回鹘蒙文;文学、伦理学与哲学涵盖了易学古籍、《康德辞典》翻译、生物样本哲学、韵学、民族文学、明代少数民族诗文、四大名著译本、《格萨尔》文献;法学则涵盖了地方治理现代化、国家安全、知识产权、公安法治。2020年可能与法律史内容相关并与大数据结合的立项4项,涉及山西票号、建党百年农村妇女参政议政、非洲国家和地区法律文本翻译以及甲、金、简牍法制史料。同时段的历史学4项,涉及当代重大传染病防治史、中国佛教方志、商代甲骨文非文字资料、世界汉学家口述中文与中华文化国际传播史;文学、伦理学与哲学4项,涉及当代新兴增强技术前沿的人文主义哲学、明代文学、徽人别集、中国文艺副刊文献;法学5项,涉及法律治理体系与立法变革、网络空间政策法规、互联网交易制度和民事权利保护、社会治理与刑法体系的理论创新、网络空间国际规则博弈的中国主张和话语权。

2021年度法史与大数据相关的国家社科基金重大项目仅为1项,即刘晓林主持的秦汉至唐律令礼法语言分类整理、谱系建构与数据库建设。历史学与之相关的立项5项,文学、伦理学与哲学相关立项8项,法学立项7项。2022年度,与数据库建设相关立项,可能涉及的法史研究领域2个,即中国共产党土地政策法规资料整理与数据库建设、民国时期农村调查资料数据库建构与深度利用研究。历史学领域4个,文学、伦理学与哲学领域5个,法学领域4个。时至2023年,这一年度可能与之相关的法史立项2个:海内外藏中国西南民族图志收集、整理与研究暨数据库建设;海外藏中国科举文献整理与数据库建设。历史学立项4个,文学、伦理学与哲学2个,法学3个。


二、传统司法数据库构建的方法

从学界对法史未来出路的分歧点分析传统司法数据库以何种形式构建最为恰当,结合上述业已建成的传统司法数据库与学者对传统数据库类型研究的现实案例,依据其优与劣,推导构建传统司法数据库的通用方法。

(一)形式抉择:人工智能or数字人文

1.“人工智能进路

余成峰从法律不学习在人类演化史视角推演,明确表示法律学习有可能会导致法律的最终死亡。这一推测早有先例可循,譬如文明社会巫术的消失、现代公共领域宗教的全面退出、当代社会道德的无力。机器学习的后果,也可能会导致前面所言当代法律的消亡。余氏对于人工智能时代的法律发展持消极态度,但不得不说,这一预测,也为法学、法律史发展敲响警钟,即在运用新时代科学技术、运用机器学习之时,不能让法学或法史完全被代码/算法所取代。与余成峰较为消极的态度不同,刘顺峰认为人工智能时代避无可避,揆诸历史,无论当下还是未来,以大数据、区块链、算法等为表现形式的人工智能必然会继续深切地影响人们的生活。是以,作为社会生活史的法律史也定会受到影响,唯一不同在于从何种视角融合法律史与人工智能。这些视角包括人工智能时代的法律史研究”“在人工智能时代借用人工智能技术研究法律史以及以人为主体”“以人与机器同时为主题”“以机器人为主体的三种研究进路。

2.“数字人文进路

数字人文派,是指以社会信息为基,以大数据、人工智能等技术赋能,现实物理社会与虚拟数字社会高度融合的社会形态,其核心因子是反映实体社会具体情况的海量数据。数字派指的是基于数字人文、数字视野、数字社会或数字时代视野观探寻法律史发展的学者。那这些学者是如何在数字视野下寻求法律史发展的呢?以清代档案建设为例,张蓓基于数字人文视角,认为数字人文发展过程正好分别对应典藏检索”“量化分析”“数字人文研究平台三种类型数据库建设,并将文本挖掘”“数据管理”“GIS”“VR”等技术运用于徽州档案资源的开发与运用;赵彦昌、姜珊赞成数字人文为清代档案管理与建设提供基于数据研究或数据驱动型研究的所有设施:资源、平台、工具、方法这一说法,并详细解释借助GIS技术,人们能实现数据库资源可视化,如对清代具体时期地形地貌、行政区划、交通网络的立体呈现,从而更深入了解案件背景和当时的历史背景;靳文君也认为系统的、有深度的、精准的、可互动的历史档案资源开发展示方式更能引起社会公众的关注。陈必佳、康文林则结合参与清代缙绅录量化数据库建设的亲身经历,提出数据库建设是要走向以系统性的历史数据库为核心的数字人文时代,在史料整理中要注重系统性与结构化,也要注重对量化数据之分析,从而追求问题发掘、推论验证,最终实现对历史问题更深层次地发现、描述与解释。括而言之,人工智能派从法理角度观察法律、法律史与科技结合方式也好,数字人文派从历史学角度思考法史与清代档案融合方式也罢,都客观提出了一条新的法史研究路径,也都在探索法律史与科技融合的可能性与方式。只是在范围上,后者数字人文”“数字时代数字社会囊括了大数据与人工智能技术。数字人文派具体总结出三种数据库模型,引入文本挖掘”“数据管理”“GIS”“VR”等技术,这与目下已经建立的传统司法数据库现实案例、学者传统数据库类型研究不谋而合,更准确地说,未来传统司法数据库的构建必然走向数字人文时代。

(二)可视化、联合互动与跨学科合作的方法

1.数据分析与可视化呈现

从淡新档案资料库、龙泉司法档案选编数据库、江津卷的建设历程来看,我国当前关于传统司法数据库建设可分为三个阶段:第一阶段是对原始档案资料电子化的过程。要求数据库建设过程中严格以原始档案资料为基础,进行资料汇总;第二阶段是对汇总后的资料进行针对性资料提取处理与数据分析。如淡新档案资料库对人名注解”“印记类型”“标题”“日期”“摘要所做的元数据处理,龙泉司法档案选编数据库对案件信息”“案件主题”“案件类型”“关键词等专设的导引栏,江津卷初步完成的12类导引。通过对这些资料针对性提取,再进一步进行数据具体分析,实现检索时相关联的档案一键弹出,对档案中重要标签词汇进行标记,并提供权威参照,便于使用者查询;第三阶段运用GISVR等技术对数据进行空间分析,并转化为一种可视化形式,从而直观展示事件、理论、人物间的因果关系。然而,就当前我国传统司法数据库已有建设及学者对传统数据库类型研究情况来看,传统司法数据库的构建还未完成与完善。在技术上,龙泉司法档案与江津卷可通过数据设计的架构进行很多信息的检索,如禀状、原告与被告的信息、居住地的信息、涉案关键词等,也可通过关键词将不同案卷相关联,却不具备全文检索功能,还仅是高清图片形式;四川档案馆的巴县档案业只有文件级目录。与淡新档案资料库相比,这些档案检索过程中仅能提供非常简单的数据,不具备数据分析能力。

2.多样数据库类型的联合互动

就我国当前已建成的传统司法数据库:淡新档案、龙泉司法档案、江津卷、巴县档案、南部档案、冕宁档案、会理档案、叙永档案,不难看出这些档案属于地方案例类型,仅限于基层地方和传统司法案例。为突破这一局限,从2019年至2023年与法史相关的传统司法数据库类型研究情况表来看,法史学者进行了相应探索。王沛从甲、金、简牍法制史角度尝试建设数据库,该数据库将时间定在秦、汉,具体内容是将甲骨文、金文、简牍和法律相关的内容都数字化,预期做到具体对某一个字进行检索的目标。刘晓林从律令礼法语言分类”“谱系建构角度出发,以秦至唐为时间界限,尝试建设数据库。洪永红则突破国别界限,从非洲国家与地区的法律文本的翻译角度建立数据库。还有立足于土地政策法规资料、科举、妇女权益、对外关系、基层农村法治、契约文书中语言文字等角度建立数据库者。这些学者的尝试打破了地方与时间限制,使得传统法律数据库建设的类型区域多样化。因此,无论当下还是未来,中国传统司法数据库的构建不应仅限于地方或某一历史时期,而应突破时空局限,实现地方与地方的联合、地方到全国数据库的互动、历史时限的扩展和不同历史时期数据库之间的联动等。

3.跨学科合作、吸取不同学科人士的建议

数据库设计往往是在已有研究基础上进行,研究者带有何种问题,就会依照问题设计数据库架构。在档案建设过程中,构建者会做许多分类统计,设置专门指标来判断问题解决程度。如法史学者会根据传统司法档案数据库卷宗是否完整设计一个判断标准,而这一问题的背后是为了解决法史当中的一些问题。至于为什么要去判断哪些案件完整、哪些案件不完整,其背后的原因并未真正厘清。现在法史学者用问题意识去设计数据库的统计口径、统计问题与统计指标,只能解决原来设想的问题,实际上并没有发现法史研究中的新问题。因此,在数据库设计时就要特别留意,问题意识设计的前提是设计者必须立足宏大的学术视野,拥有开放的思想,而不是局限于原来法史已有的学术史生成的旧问题。这就要求法史数据库设计者多与其他学科人士交流,如历史学、社会学、人类学、经济学等,了解这些人在看到法史档案资料时想要研究的问题、生成的问题是什么,然后力争将数据库的设计内容覆盖到整个人文社科领域研究的兴趣与方向。在此种基础上,中国传统司法数据库也好;与法史相关的其他数据库类型也罢,才能在现实中拥有更好的运用前景,而不是将使用者局限于法律史研究人员。


三、三种未来构建可能路径的设想

中国传统司法数据库是否还有其他可行的拓展路径?传统司法一词内涵较广,除案例外,它至少还包括传统司法哲学、传统司法机构、传统司法官员,此处就这三种路径展开未来数据库构建的设想。

(一)中国传统司法哲学数据库

传统司法哲学属于中国传统法哲学范畴,对中国传统法哲学的认知,有学者觉得是当前法律史范式改革才开始进行法理法哲学范式的探索;有学者则基于中国有没有法哲学的争辩,提出中国法哲学中国人独特的法治观和方法论,是对西方法治和平演变论与中国法治捍卫江山论的理论超越;还有在此基础上,将传统中国法哲学理念与西方法哲学理念进行比较者。其实,纵观法史发展历史,直接以法哲学为题的作品早在20世纪90年代便出现了,后来随着研究深入,即使在命名上还存在法律思想”“法哲学”“法理学的争论,法史学者对中国传统法哲学的实际探索也从未停歇,只是系统化或范式化研究直至近年才开始兴起。

中国法哲学对中国传统法的特征、本体、法律关系、正义观、核心元素、争议性法哲学问题等已完成初步探索,如核心元素”“”“”“”“”“等。其中”“”“,经王人博考证这几个字在古文字解读中可以互训,且从井从水,可生成清澈宁静,可作镜鉴的意象,”“”“语义间的关联,是中国早期有关法思想的一个重要模型,也是中国古代文字家创设的一种法的平正意象。至于字,尤其在组成伸冤一词时,在中国传统上,就是一个很有意义的符号,有正当性,有号召力,可以产生社会影响,即使在今天,无论从工具论角度出发,还是追求意义的表达,它仍然很重要。而的创立在中国传统法文化中拥有着重要地位,它是中华民族认识史上由神本位过渡到人本位,由神道发展到了人道的标志。学界一致认可为中国传统法哲学内在逻辑演变的初始点。据张中秋推演,中国传统法之理,按时间顺序来说,其初步发展内在逻辑为仁义德礼情理法理法。关于仁与礼,俞荣根的看法则是仁先于礼,仁为质,为内在的精神,礼为用,为外在的节文;关于仁与法,俞荣根认为仁与法的关系,首先依据结构展现,在损益礼的过程中包含了法的损益,包含了对人格和人权的肯定以及对非人道法律和制度的批判。又如传统中国法哲学中极具争议的法律儒家化议题。汪雄涛从亲属争讼角度出发,发现我国当前所说的法律儒家化程度被夸大了。学者们对此议题的种种反思,使得该学说几乎处于抛弃的边缘。在前者反思基础上,朱腾则展开了对法律儒家化反思之反思,认为即使在今日,该议题仍具有合理性,适当补充和调整后依旧应被视为传统中国法研究的重要理论范畴之一。学界从一开始的接受、到反思、再到现在反思的反思,若将各学者的论证以关系分析、数据可视化等手段呈现,定能明显展现法律儒家化议题的演变历史,分析出该议题背后的因果关系及隐藏的根本影响因素。

综上可见,中国传统司法哲学数据库的建设必然离不开法史学者对传统法理体系、哲学理论的探索与提炼,在探索与提炼过程中,所结出的果实必然与研究者自身遭遇、情感、逻辑等紧密相连,这也是传统司法数据库建设中人文性的体现。当然,这一点将会是未来传统司法数据库系列中最难,也是最晚完成的项目,原因有二:一是传统法理、法哲学的概念、本质、特征、法律关系极难提炼。漫长的历史资源,既是财富,也是考量的难点。中华文明延续至今,各朝各代观点更迭,再加上当下治通史者寡,研专史者多,要提炼出一以贯之的传统法哲学理念十分困难,我国当前成熟的中国传统法哲学理论体系尚未形成。二是司法哲学理念的提炼还需建立在司法官员”“司法机构”“司法案例研究充分的基础上,但这些若要研究透彻,将是一个极为漫长的过程,至少要耗费十五至二十年的时间方可完成。

(二)中国传统司法机构数据库

历史观察纷繁复杂,我们在某个抽象层次上或具体机构中做出些许概括,比如中国传统法律传统的某些特征,有人举出3个,有人举出5个,以此类推,在此基础上进行数据可视化整理,各人言之有据,对于历史、法史的认识也许是有所帮助,中国传统司法机构数据库的建设就是如此。以夏商周为例,从上古开始,中国就有部落联盟,这些氏族部落联盟首领就包括了为世人知晓的尧舜禹,当遇到重大事件时,部落联盟会与四岳一同商议,这一商议形式就具有联盟议事会的性质,有学者称其为原始社会的民主制。由此推测,该时期最高司法机构,有可能就是这一部落联盟会议。随着氏族首领权力愈来愈大,大同世界逐渐走向天下,联盟部落首领开始具有擅杀权威,最高司法权渐渐握于一人之手。至夏朝,夏王成为全国最高司法官,握有生杀予夺大权。夏王之下的中央司法官称为大理,掌管全国性重大案件审判;士或理为地方司法官,其中士既理军政又理狱讼。到商朝,中央司法机关长官被称为司寇,下设”“等司法官吏辅佐,处理中央及地方部分复审案件,其受审程序依次是告于告于大司寇大司寇告于三公参之,三公再告于王;地方畿内司法机关由士掌管,称蒙士,畿外由诸侯掌管,诸侯再另行划分。西周时期,司法机关的划分与商大致相似,分为三部分:中央、乡遂和诸侯国。中央一级秋官司寇(或大司寇)为长官,管全国司法工作。大司寇下设小司寇,可直接审判案件;小司寇下设士师,为刑官,掌国都内禁令、狱讼、刑罚。秋官司寇下又设司刑、司刺、司约、司盟、司圜、司隶、掌囚、掌戮等职官。周王辖内范围称王畿,王畿分为”“”“三类,乡遂属王畿管辖,王畿内设士,上管政务,下理狱讼。国中与乡设乡士,遂设遂士,乡、遂所设之士,又分作上士、中士、下士三级,可以说是法官的等级划分,其下之属还有府、吏、胥、徒等,辅佐士官吏狱讼,这些下属主要负责记录供词和管理文档等。具体脉络走向,可参见图1

秦至清时期的司法机构大致走向则是秦汉时期设廷尉为中央审判机关,汉时尚书开始参与司法活动;三国两晋南北朝时期,中央审判机构北齐设大理寺,设秋官大司寇或大理寺或廷尉进行管理;隋唐则演变为大理寺、刑部与御史台三个中央司法机构;宋在上述三司基础上增加审刑院,以大理寺主管审判,刑部主管复核;元设大宗正府,刑部与大理寺职能互换;明清时期,明增设厂卫等特务司法机构,清代增设理藩院以处理少数民族事务和处理旗人官司的特殊司法机关,刑部主审判,大理寺主复核。

上述阐释由于篇幅原因较为简略,若针对每一朝代司法机构进行详细论证与填充,尤其是拥有大量审判案例的明清时期,从皇帝、中央到地方,其司法机构设置趋于繁杂与严谨,完善之后必然会成为极为庞大的数据库。各朝各代司法机关以一整个数据表罗列其中,打开数据库,点击每个朝代的方框时,便会弹出该朝代司法机构属性,便于人们查询与了解中国传统司法机构的发展脉络与划分特点。

(三)中国传统司法官员数据库

在中国五千多年历史中,官吏一直发挥着重要的社会维稳作用,司法官员正是维持社会秩序与坚守我国传统法之正义观的重要因素。法史学界对中国传统司法官员论述者不在少数,如俞荣根对拓跋宏以礼率法、耶律楚材以儒治国、包拯秉公执法,恤民为本、海瑞恪守礼义、以情断狱、抑强扶弱的论述;如黄云对宋慈追求个案公正、防范刑罚滥用的法理观的论述;如孙笑侠对史尚宽生平的考略等。可见若要建立传统司法官员数据库,代表性司法人物的抉择至关重要。当前能够初步进行的便是摘取出从皋陶时代至新中国成立后的今日具有代表性的中国司法官员,之所以延续至今,而不像上述仅罗列传统中国的司法情况,主要是历代司法官员间定然存在司法哲学智慧、司法实践经验方面的传承关系,从古至今结构的罗列与展现,勾勒出中国古代司法官员群像简图,必然会在蛛丝马迹中寻找出传承之线索。

整体言之,图2所列代表性司法官员只是历史长河中这一群体的冰山一角,具有一定代表性,并不能完全呈现全貌。明清之前的司法官员虽说有一定数量,但若言达到庞大数量数据记载,明清时期司法官吏司法人物关系是不可避开的一节。因此,传统司法官员数据库的建设在当前仅是对大致框架的描绘,整体蓝图,需要法史学者、法学学者共同努力,才能尽量完整地绘制中国司法官员之全貌。


四、未来融合过程的五重战

传统司法数据库兼顾纸质档案数字化和数字化文献可视化、归类化时,它的发展就面临着至少五方面阻力:其一,传统司法数据库始终依赖法史研究的主要方式展开,在数据建设过程中如何保持法史作为人文社会科学学科的人文性不变是我们必须面对的首要问题;其二,数据库的实际利用与建设经验的传授;其三,数据库分类与模型建构时要避免类型化中化约现象的产生;其四,数字化文献可视化的技术资源压力;其五,文献化、数字化过程中难免出现错漏。

(一)一重战:如何在数据建设过程中保持法史的人文性

正确的选择不能依靠科学来保证,它只能出自人类智慧或曰明智的洞见。无论未来法史研究走向何处,走到多远,法史学对历史、对法学、对人类本身的人文关怀本性应始终保持。即使未来法史研究与新兴数字结合,人文性的基本特征也不能舍弃。无论当下还是未来,中国传统司法数据库并不是简单的人工智能机器学习,它最终走向的是数字人文时代,如上述学者对秦至唐律令礼法语言的分析,对妇女权益、基层农村建制的关注。如三种可能拓展的司法数据库类型中司法哲学司法官员,也是人文性的集中体现。司法哲学的人文性体现在因为学者各自研究背景、喜好、成长方式不同,从各自角度提炼出的中国传统法学理念必然有所不同。以清末法史研究中较为经典的礼法之争为例,有学者认为这是道德与法律、托古改制伦理致用观念的冲突,然而剥开现象分析其背后的法哲学运行逻辑可知,礼教派内生法学观念是法律生于政体,政体生于礼教,礼教生于风俗,而风俗生于生计,究其根本,是对民本思想的坚持;法理派内生法学观念则是法律改变政体,政体改变礼教,礼教改变风俗,风俗改变生计,在此种观念下,改革自然便只能为自上而下的形式,其根源处观念在用法律达到目标。司法官员人文性的体现亦是如此。不同的观者便有不同的哈姆莱特,那不同的研究者就会有不同形象的传统司法官员。如对海瑞形象的看法,梁治平得出的观点就与俞荣根的有些出入,在梁治平的笔下海瑞孤忠与刚直简直到了不近人情的地步。除研究者看法不同外,若绘制一幅中国传统司法情境图,民间与政府绘制的具体情形亦存在不同,民间绘制图像大多与官吏现实活动不符,却寄托着群众最简朴的正义联想。

(二)二重战:数据库的实际利用与建设经验的传授

传统司法数据库资源的使用对象是整个人文社科领域的学者及兴趣爱好者,而不是专门的法史学者。这需要我们在数据库的设计内容上立足于宏观的人文社科问题,才能有较好的运用前景。电子数据库设计再完美、再有用,使用者不了解它的存在就无法发挥其价值与作用。仅以关键词检索为例,若检索者对所查资料库不了解详情,不知其局限与内容,此时数据库提供的就不是便利,而是困难了。如就拦词对不同地方档案进行检索,会理档案搜索结果会显示无,而叙永档案就能查出,原因在于叙永档案整理时,需要将拦词作为一种证据,才将此类民间文书保留在官方文件中。如果检索者未曾翻阅原始档案资料,仅以关键词为检索,很容易过滤掉一些重要信息,从而干扰我们的阅读与判断。如何传授使用传统司法数据的经验与方法成为关键所在。然而,我国法学院很多法律史学者暂时并不掌握大数据处理技术、对传统法律数据库的类型了解也不全面。他们大多数无法运用统计学方法对历史资料进行量化处理,对现有传统法律数据库的使用也没有更多经验传授。因此,无论传统司法资源数据库设计者,还是新时代法史学者,了解这些数据库并能进行经验传授成为了新时代的使命。

(三)三重战:避免数据建设类型化过程中化约现象

传统司法数据库作为一种用科技呈现法史研究内容的工具方法,有助于凸显中国传统法研究中隐藏的因果关系或人、事、物的关联性,也能通过可视化程序生动展示传统法哲学演进脉络、基本特征、本体论等。但该数据库本身会容纳吸收相对庞杂的传统司法内容,包括各个朝代各个地方的司法哲学智慧、司法机构、司法官员、司法案例文书等,几个涵盖内容间一定会存在相似的研究问题,这很容易导致学者与整理者将同一类型的内容或模型进行寻找公约数的操作,从而将相似问题符号化、化约。如现下南部档案、会理档案、叙永档案、冕宁档案与巴县档案电子数据库中就存在词汇化约后,查询不到相关内容的情况。以拦词为例,会理档案查询中未保存拦词一项,南部与叙永档案保存了契式拦词选项,冕宁电子查询为状式拦词,而巴县档案电子目录查询契式状式拦词皆有。此种现象很容易导致数据库收录内容、关系分析过程以及模型建立等不准确,且这种化约极具隐蔽性,若操作不善,后来的研究者就需要耗费大量的人力物力来论证化约的问题,这显然违背了建设传统司法数据库的初衷。学界对化约也多持否定态度,汪雄涛以传统法律儒家化”“家族化为例,认为在这两种类型化研究中进行化约提出儒家化”“家族化的理论是不精致的,对研究来说具有一定危险性。梁治平也指出,化约肯定是不可取的。可见在数据库建设过程中对化约问题要始终保持警惕与反思,避免此种现象的发生,同时也要避免简单化,对所研究的问题、录入的内容、可视化的图像等始终抱着存疑心态,不妄下论断,不轻易对展现内容简单符号化。

(四)四重战:如何完美运用新兴可视化技术的忧虑

法史学科研究人员的构成大多来自两部分:一部分为史学正统出身,后转向法史,挂靠于法学部门研究;一部分为法科出身,后结合史学资料,研究法史。在法学出身的研究者看来,他们虽然展现了良好的史学基础,但存在法学专业性不足的短板;而史学出身的学者觉得自己的法律史研究不正宗’”,在于他们的研究主题虽然与法律相关,但并非法学中的核心议题,不需要多少法学专业知识的支撑。其本身就存在诸多范式争议,若是要进行法史数据库的建立,尤其是传统司法数据库,作为未接触过专业高科技训练的法学或史学出身的法史学者来说,如何建构法史数字化平台在起始第一步便被难住。

那如何解决这一困境呢?方法之一便是与专业科技人才协作。传统司法数据库有着不同研究主体,每个主体都应创设一个协同合作的团队。此团队由三类群体组成:(1)研究传统领域的人文社科专家。法学、史学、档案学、法律史学者为主,英语、哲学、文学、人类学等多个领域学者为辅,共同致力于文献的收集、整理与校正任务,同时承担各自项目内容策划。(2)数字技术处理人员。专业可视化技术人员、多媒体设置人员、网站平台建设者、界面设计者、数据处理专家等,这类人员根据前者整理的纸质档文献与搜集到的国内外相关数据库文献进行数字化平台建设,承担开发任务的同时,为前者提供技术支援。这一任务的主要掌控者多为计算机信息学家、计算科学家、数字科技人才。

(五)五重战:文献化、数字化过程中难免出现错漏的愁苦

在数据库文献化与数字化期间,定然会出现诸多错漏,而导致错漏的原因有:

1.材料获取不易、时间成本过长以及人类自身缺陷。传统人文社科学者对国内外纸质档与其他数据库中已有材料收集与整理过程是较为漫长的。尽管历史学者们早就对海量的历史档案进行整理,但要从这海量数据中挖掘与传统司法相关的材料实属不易。学者们必须奔赴国内图书馆、档案馆、博物馆、纪念馆、文化馆等地方,还必须随时留意散落在民间的资源、流失在国外的资源等,这一过程耗费了大量时间成本、住宿成本和文献查阅时的人工成本。即使上述研究传统领域的人文社科专家尽最大所能,由于人类自身缺陷,点校时难免挂一漏万,存在错字、缺页的情况,甚至可能出现误读、错读。

2.何以获得其他数据库资源使用授权以及即使数据化也无法达到零误差的困扰。若脱离纸质档案收集,单论国内众多数据资源库的利用,总体来说与传统司法相关的数据材料分布相对分散,查询与阅读本身就需要耗费一定时间。再加上这些资料获取后,如何取得相关数据库的授权或使用许可,在法学上也是一个难题。即便获得这些数据资源使用权,这些材料在数字化平台上获取后,本身还是需要与原始资料进行比对,因为数字化并不代表着零误差、零错误。许多时候,一个解读标点的不正确,也会导致对历史原文献的误读,举例来说,就中国早期时期的文字,如甲骨文、隶书等,这些文字在数据录入时,偶会出现模糊不清、错录一页等情况,最终导致呈现的内容不完整或者使得资料阅读者产生阅读迷惑,甚至是错读历史原意。


结语

法史可研究领域本就宽泛,法学视角可从法理的原则、逻辑、要素到各个部门法下所有知识点;史学视角可从中国起源开始,一直到今天高速发展中的中国社会;社会学可从国际、国家、政府、基层、人物群体或个人着手;还可涉及人类学、科学等。若结合当下国内数据库建设相关知识与经验,继续中国传统司法数据库的构建之路,原本对诸多领域进行系统研究的法史学科,也许会在其辅助下走向纵深,使法史研究愈来愈精细化、细节化、重构化、种类多样化和复杂化。就性质而言,中国传统司法数据库建立属于工具论划分,是一种技术混合型方案,应侧重于形而下的实践技术运用、数据录入、可视化程序展现等问题。在此基础上,人文性的保持是该技术运行的要件。至于传统司法数据库建设的方法与拓展路径,参考部分已建成的中国传统司法数据库及2019—2023年间与法史学相关的传统数据库研究类型后,得出其构建的方法是采用数字人文的形式,严格遵循原始档案资料,对已汇总资料进行数据分析,并运用GISVR等技术进行空间处理,将数字化档案通过可视化方式呈现。同时,在数据设计时不能仅关注地方与案件,更应注重与不同地方数据库档案合作,尝试建设全国性传统司法档案,实现地方与地方联合、地方与全国的互动。为最大程度增加数据库使用率,数据设计之初的问题应与其他人文社科学者交流与讨论,将问题立足于整个人文社科领域。至于可能拓展路径,主要从传统司法哲学”“传统司法机构传统司法官员三者着手。不过,中国传统司法数据库构建的道路并不会一帆风顺,依据当前建设情况及未来发展趋势,该数据在未来必然面临人文性保持”“经验传授”“化约”“完美运用新兴可视化技术”“文献化、数字化过程中难免出现错漏的五重困境。此种路径与方法的设想也许不是最优解,但笔者坚信这一定是法史生命延展的一种新方式,能在一定程度上帮助法律史研究摆脱研究应用价值低、长期处于困境的情况,加强法史与其他学科的交流,并让其他学科人员实实在在地使用到法史学研究带来的智识成果。


致谢

本文的进一步完善主要得益于四川大学书人文工作坊与法律人类学云端读书会举办的量化中法史:地方档案与法律史料的大数据研讨会,使文章得到中国人民大学法学院尤陈俊教授、浙江大学人文学院历史系杜正贞教授的指导,以及同期工作坊刘沫寒、朱群杰、陈迁美三位博士生的建议,同时感谢甘肃政法大学韩宝教授提供的甘肃简牍博物馆资料,谨致谢忱!文中如有错误疏漏之处,责任由作者自己承担。


因篇幅限制,已省略注释及参考文献。原文详见《河北法学》2024年第10期。



地址:河北省石家庄市友谊北大街569号

Copyright© 2004-2005 All Rights Reserved 冀ICP备11009298号