字频视角的古文字“四书”分布发展研究 篇一
古文字作为人类文明的重要组成部分,在研究中扮演着重要的角色。其中,“四书”作为中国古代文化中的重要经典,一直以来都备受关注。在这篇文章中,我们将从字频的视角出发,对古文字“四书”的分布与发展进行研究。
首先,我们需要了解字频的概念。字频指的是某个字在一段文字中出现的频率。通过对字频的研究,我们可以了解到某个字的使用频率及其在文本中的重要性。因此,通过对古文字“四书”的字频分析,我们可以探讨其在古代文化中的地位和影响力。
接下来,我们将对“四书”进行字频分析。首先,我们选取《大学》作为研究对象。通过对《大学》的文字进行统计,我们可以得到每个字在该文本中的出现频率。然后,我们将对比不同字的出现频率,从而了解到不同字的重要性。通过这样的分析,我们可以看到在《大学》中哪些字出现的频率较高,哪些字相对较低。这些结果将有助于我们对《大学》的理解和研究。
除此之外,我们还可以将字频分析应用于《论语》、《孟子》和《中庸》等古代经典中。通过对这些经典的字频分析,我们可以比较不同经典之间的字频差异,并进一步探讨其在古代文化中的地位和影响力。同时,我们还可以通过分析不同经典中相同字的出现频率,来了解不同经典之间的关联性和共同之处。这些研究结果将有助于我们对古代经典的整体认识和理解。
最后,我们可以将字频分析应用于不同时期的“四书”文本中,以研究其发展变化。通过对不同时期的“四书”进行字频分析,我们可以观察到不同时期的“四书”中字的使用频率的变化趋势。这些变化趋势反映了古代文化的演变和发展,对于我们了解古代文化的发展历程具有重要意义。
综上所述,通过字频视角的古文字“四书”分布发展研究,我们可以进一步了解古代经典的内涵和影响力。字频分析为我们提供了一种新的研究方法和视角,可以帮助我们更好地理解和解读古代文化。这一研究领域的深入发展将有助于推动古代文化研究的进一步发展,并为我们认识和传承古代文化做出更多贡献。
字频视角的古文字“四书”分布发展研究 篇二
古代文字作为人类文明的重要遗产之一,一直以来都备受学者们的关注。其中,“四书”作为中国古代文化中的重要经典,不仅在古代时期具有重要地位,也在后世影响深远。在这篇文章中,我们将从字频的视角出发,对古文字“四书”的分布与发展进行研究。
首先,我们需要了解字频的概念。字频指的是某个字在一段文字中出现的频率。通过对字频的研究,我们可以了解到某个字的使用频率及其在文本中的重要性。因此,通过对古文字“四书”的字频分析,我们可以探讨其在古代文化中的地位和影响力。
接下来,我们将对“四书”进行字频分析。首先,我们选取《大学》作为研究对象。通过对《大学》的文字进行统计,我们可以得到每个字在该文本中的出现频率。然后,我们将对比不同字的出现频率,从而了解到不同字的重要性。通过这样的分析,我们可以看到在《大学》中哪些字出现的频率较高,哪些字相对较低。这些结果将有助于我们对《大学》的理解和研究。
除此之外,我们还可以将字频分析应用于《论语》、《孟子》和《中庸》等古代经典中。通过对这些经典的字频分析,我们可以比较不同经典之间的字频差异,并进一步探讨其在古代文化中的地位和影响力。同时,我们还可以通过分析不同经典中相同字的出现频率,来了解不同经典之间的关联性和共同之处。这些研究结果将有助于我们对古代经典的整体认识和理解。
最后,我们可以将字频分析应用于不同时期的“四书”文本中,以研究其发展变化。通过对不同时期的“四书”进行字频分析,我们可以观察到不同时期的“四书”中字的使用频率的变化趋势。这些变化趋势反映了古代文化的演变和发展,对于我们了解古代文化的发展历程具有重要意义。
综上所述,通过字频视角的古文字“四书”分布发展研究,我们可以进一步了解古代经典的内涵和影响力。字频分析为我们提供了一种新的研究方法和视角,可以帮助我们更好地理解和解读古代文化。这一研究领域的深入发展将有助于推动古代文化研究的进一步发展,并为我们认识和传承古代文化做出更多贡献。
字频视角的古文字“四书”分布发展研究 篇三
刘志基(华东师范大学中国文字研究与应用中心,上海200062)
[摘要]就整个文字系统的历时演变来说,四书中呈直线变化且变化程度较为显著的是象形和形声,前者历时减量,后者历时增量,最终互换了在总字形数和总字频中的主体位置,其字频统计远低于字形统计的增减幅度,更加真实地显示了文字结构的发展速度。会意自西周金文较甲骨文有较大增长后即在字形系统中占据相对稳定的比重,同样体现了正常发展轨迹。只有指事的比重发展缺乏规律,表现了结构发展的某种复杂性.
[关键词]字频;古文字;四书[中图分类号]H122[文献标识码]A[文章编号]1001-5442(2009)04-0054-10
字形表达文字本义的构成方式,一直是文字学研究的基本问题。自许慎首创“六书”体系以来,历代学者多有相关论说。大体来说,古代学者多恪守“六书”总体框架,发展也就是在这个总框架的基础上加以细化、完善而已。而现代学者每每试图颠覆“六书”这个基础,总体来说,目前学界对结构理论框架的新探讨还没有形成一个得到普遍赞同的定论,而许慎首创的“六书”理论虽然每每受到古今学者批评,但明清学者在其基础上形成的“四体二用”之说迄今仍然得到较多的认同。①值得注意的是,近年来,人们开始把汉字结构研究落实到某一具体断代的汉字中,注重各结构类型字形的数量统计,进而揭示其总体结构状况。在这种研究中,先秦时段的出土古文字因其时代较早而得到了更多关注(具体述评详见后文)。这无疑是一种更加务实的研究,基于这种研究的积累,汉字结构理论框架的科学构建或许可以获得比较坚实的基础。然而,此类既有研究显然还有进一步的发展空间.
作为结构研究对象的字形,可以有两种存在形式,一种是静态储存性的,如字典所收的字目,其特征是所有字形一律只有一次露脸的机会;一种是动态使用性的,如文章、书籍用字,其特征为字形是按其出现次数重复计算的。既有相关古文字结构的研究都是以前者为对象的(以下简称为“字形角度研究”),而以后者为对象的探索(以下简称为“字频角度研究”②)迄今尚未有问津者。毫无疑问,字形的上述两种存在形式是有差别的:前者是经人工整理才得以呈现的状态,后者则保留着文字原始的存在状态。所以,至少对于揭示文字系统原生的结构状态而言,字频角度的研究能够呈现更加真实的信息。鉴此,本文将从字频的角度,通过殷商、西周、战国三个时段汉字的“四书”分布状况的调查统计及相互比较,来描述先秦汉字结构的发展,进而尝试揭示其中内在规律.
在进入正题的讨论之前,有必要就如下几个问题作简要说明:首先,仅仅调查分析“四书”,理由固然可见前文相关研究的评述。但在另一方面,作此种选择,并不意味着我们认为“四书”可以完全概括汉字结构类型。事实上,无法纳入“四书”框架的结构类型已多被人们揭示,本文将视线的直接落点锁定于“四书”,只是为了将研究限定在目前更具可行性的有限范围内。至于古文字其他结构问题的探讨,并不视为本文的任务.
其次,字频视角的“四书”研究是需要一定条件的,这种大致上可以概括为技术的和学术的两个方面。就技术而言,相关古文字材料必须得到数字化的处理,否则,以人工计数为基础来完成字频研究,仅仅存在理论上的可行性。就学术而言,则是被统计文本的用字正确和统一,能够反映最新研究水平。客观来说由于字频研究需要以巨大字量的文本为对象,而古文字材料一方面至今尚未得到电脑通用字符集的支持进而导致数字化处理的诸多盲区,另一方面又在考释研究方面存在不少分歧甚至盲点,要满足这两方面的条件绝非易事,凭借个人力量去完成相关工作更无可能。这也就是字频角度结构研究迄今尚为空白的重要原因所在。本世纪以来,笔者先后主持了多个以古文字数字化为内容的研究课题,经课题组近10年的不懈努力,才营造了可以支持字频研究的基础平台。作为该基础平台组成部分及本文数据来源的各古文字数据库均经过如下几个方面的加工处理:依据最新资料公布完成材料汇集;根据考释研究的最新进展完成释文校订;对释文用字进行符合数字化处理要求的统一整理,并对集外字逐个造字形成字体支持,进而将经过整理的释文输入数据库,实现其全文检索功能;逐字进行“四书”的标注。因此本文的研究,得益于课题组团队的`集体努力的支持,特此说明.
第三,具体字形的“四书”判定是本文讨论的基础,而“四书”类型判定的标准学界尚未取得完全一致,故有必要择其容易形成分歧的若干问题简单说明如下:1,关于“象形”,本文依从象形均为独体的观点,所谓“合体象形”,如段注所言“箕”者,本文视为形声;“眉”者,其中之“目”视为依附性构件,与眉的形象组成一个不可分割之独体。2,关于“指事”,只认定有抽象指示符号者,或单纯由抽象指示符号组成,或由象形符号与抽象指示符号合成,抽象指示符号可以表示种种抽象意义,也可以标志区别性,且两种指事字均视为独体。“乏”、“屰”之类借助象形符号变化表示本义者则视为象形。3,关于“会意”与“形声”:前者为两个或两个以上单纯表义或表形字符组合者;后者为两个或两个以上组合字符中有标音功能者.
第四,字频的研究,难免涉及海量的材料及验证数据,由此而引发如下两个问题:其一,相对其他材料,古文字材料有着较多考释未定或未有考释者,故大范围地引用材料,便也加大了引证失误的几率。我们的应对方略是,在全面吸收学界最新研究成果的基础上认真审核材料,对尚无确释的材料加以排除。事实上,在整个研究过程中,这项工作要占工作总量的绝大部分比重。即便如此也不能确保避免所有问题,但对于系统材料提供的巨量数据而言,个别问题不至于影响大局。其二,以传统论文形式的纸张载体,一般是难以胜任承载验证研究结果的海量数据的,本文的应对方略是,论文本身一般只给出最核心的材料数据,而将相关验证材料挂在网上,作为本文的网络附录,供读者查验。后文凡标明“网络附录”者,均属此类。①
一、殷商甲骨文“四书”分布及其初步分析
鉴于可行性要求,我们首先根据统计学的抽样原则,限定了材料范围,确定《小屯南地甲骨》[1](下文简称《屯南》)和《花园庄东地甲骨》[2](下文简称《花东》)卜辞为字频统计的资料.
抽样首先是为了限制材料的量,以便在目前条件下确保材料学术和技术加工的完成。当然,这种数量限制是被控制在实现字频研究目标的可允许范围内的。根据统计学原理,在一个总体为250的例子中,“只要样本量不是太小——通常为10或20就够了,统计学理论表明这个分布近似于正态分布。”[3][p9]这也就是说,这两种材料的58544的总字量,可以满足100万以上字量文本的抽样要求,而这个数字,已大大超过迄今所见已经公布的卜辞材料中的字量。①其次,因为需要涉及不同时段文字相关数据的比较,而甲骨文总字数相对偏大,抽样也是比较的对应性所要求的.
当然,由于材料存在残泐模糊、属于习刻,以及释读尚存在盲点的原因,我们并不能将所确定范围内所有文字毫无遗漏地进行结构分析。在确定的可作结构分析字为范围进行统计,得到如下数据:被分析用字总数为43897,其中象形380个字形,总频次31527;指事54个字形,字频数合计5385;会意319个字形,字频合计4516;形声120字形,字频合计2469。(甲骨文四书分布的字形及其出现频次、各频次具体出处详见网络附录《小屯、花东用字结构分析》)以上数据按字频统计,象形占总字频数的71.82%,指事占总字频数的12.27%,会意10.29%,形声占总字频数的5.62%.
字频视角的“四书”分布观察,虽然是一种全新的研究途径,但其真正的认识价值,却是在与字形统计的同类研究结果相比较中才能得以实现的,而后一种统计并不乏既有研究.
2006年郑振峰遵循王宁“汉字构形学”理论,将甲骨文的构形模式分为10种,[4][p41-44]这10种构形模式实际可与“四书”对应,对应后可以得到郑书中关于甲骨文结构的“四书”数据:象形字为271个,占字形总数27.51%,指事字46个,占字形总数4.67%,会意字311个,占字形总数31.57%,形声字357个,占字形总数36.17%。[5][p166]2007年陈婷珠以《新编甲骨文字形总表》为基础,增补《花园庄东地甲骨》等新材料,并注重吸取学界考释研究最新成果,确定“甲骨文能进行表词结构分析的单字字形总数共2134个,占甲骨文单字的字形总数的35.84%。其中,象形字字形数为821个,占甲骨文字能进行表词分析的部分的38.47%;指事字字形数为108个,占5.06%;会意字字形数为875个,占41%;形声字字形数为330个,占15.46%。”[5][p171]当然,前文完成的甲骨文“四书”分布的频率统计,也同时完成了不重复字形层面的这种统计,而其相关数据为:象形380字,占总字形数43.53%;指示54字,占总字形数6.19%;会意319字,占总字形数36.54%;形声120字,占总字形数13.75%.
纵观以上三种统计结果,不难发现本文的调查数据与陈书的统计结果比较接近,而与郑书的统计结果距离稍大,这或许与郑书的统计主要依据《甲骨文字典》这一相对陈旧的材料有关。而这种差距,如果相对字频角度的“四书”分布统计结果来看,似乎也可忽略不计了.
从比较的对应性考虑,我们就以同一种材料的两种数据加以对比,而它们的差异之大颇为出人意表:象形和指事的比重有较大幅度的上升——前者从43.53%上升到71.82%,后者从6.19%上升到12.27%;而会意和形声则有较大幅度的下降——前者从36.54%下降到10.29
%,后者从13.75%下降到5.62%.
上述数据的变化,除了更加准确地呈现了甲骨文各“书”文字投入使用后的真实比重外,还折射了一个极具认识价值的汉字发展史信息:象形、指事字在甲骨文献的动态统计中的比重上升,意味着这两种结构的独体字在甲骨文的常用字集中比其他两书的合体字占据更高的比重,而文字单位之所以取得相对常用的地位是因为它是和语言中相对基本、常用的单位相对应的。一个文字系统中较早产生的文字单位总是和语言中相对基本、常用的单位相对应的,所以象形、指事字也就被证明为甲