基于词频统计的风雅颂用词特点

Posted by 阳光和鱼 on October 13, 2020

利用网上文本,对风、雅、颂各部分的文本进行汇总,统计出用词频率,再将之与全诗经的词频进行对比,查看各部分用词偏好。

1、起源

学习诗经的初衷是对诗词感兴趣,想提高姿势水平。但数月以来,注意到毛诗原文经常被后世所引用,作为一些内容的最早出处,逐渐意识到诗经及毛诗在古典文学中的地位,更加觉得庆幸,从“头”开始学。

作为先秦早期重要经典(诗经、尚书、礼记、乐),最早的诗歌总集,《诗经》对后世的文学作品,诗词风格产生了极深的影响。“风雅”后世成了端庄或高雅之意;赋、比、兴三种手法也为后世文学所榜,赋也是汉赋的来源之一;诗经中的众多篇目开创了诗歌的婚恋诗,离别诗,田园诗,亡国诗,闺怨诗等的先河。

诗经分为风、雅、颂三部分,对于这种分类,一种解释是音乐的分类,”风土之音曰风,朝廷之音曰雅,宗庙之音曰颂”,而第一部分的十五国风更为人所熟知,喜爱,一来是因为多为抒情诗,内容涉及婚姻、爱情、战争、农业生活、动植物等等,相比宫廷表演(雅)和宗庙祭祀(颂)更加接地气,同时用词和现在相比也更接近。

诗经文本中涵盖了众多的名物(动植物,祭祀等器物等),并对这些名物赋予了一定的情感,如“关雎”的恩爱之情,“柳”的惜别之意,“硕鼠”的贪婪/剥削的意向。

由诗经产生的成语多达300个(平均每首出一个成语),人们根据诗经文本起名更是不胜枚举,也可以看出诗经的流传之深、之广。

2、诗经篇目与字数统计

现存诗经共计305首(另有小雅6首仅存篇名),其中风160篇,雅105篇,颂40篇,总字数36940字,涉及字共计2827个。

  篇数 字数 字数占比 平均每篇字数
160 13280 36% 83
105 19928 54% 190
40 3732 10% 93
共计 305 36940 100%

“风”为地方曲调。“颂”为宗庙祭祀、歌颂所用。“雅”为“正音雅乐”,可用于表演场合等。可能雅的演唱、表演的需要,使得雅的篇均字数(190字/篇)是其他两种(分别为83字/篇,93字/篇)的两倍以上。

3、诗经用词特点

  常用词(选取规则如下) 各部分的用词特点
可,美,謂,誰,知,遠,一,裳,雨,能,風,淇,寐,素,佩,他,寤,葛,兩,死,離,焉,羔,手,裘,門,夭,七,逝,蒼,得,鼠,五,送,望,宛 更加日常的词
爾,天,四,王,事,酒,師,寧,用,令,作,召,式,京,嘉,卒,甫,具,翼,哀,友,酌,或,威,俾,喪,民,戎,謀,罔,曾,醉,聞,亂,度,安,宗,尸,先,覆,申,殽,原,昊,攸,祿,賓,神,迺,咨,罪,胥,湛,祀,韓,聽,共,營,業,章 小雅中很多“怨诽之词”
公,馬,薄,侯,夜,於,右,敢,孫,多,武,命,濟,稷,明,邦,考,徂,成,小,烈,福,壽,降,夷,受,辟,俾,錫,克,烝,皇,高,帝,聲,保,時,文,疆,厥,祖,率,顯,胥,孝,旅,敬,祀,商,昭 祭祀、政治、社稷、祈告相关

注:主要集中在某部分占比较高,且字使用数量大于10个的字。

从类型上看,”风土之音曰风,朝廷之音曰雅,宗庙之音曰颂”,“风”的语言用词更接近大众;

从时间上看,“颂”,“雅”时间较早,主要创作时期为西周,“风”的诗创作时间较晚,从西周延续到春秋中前期,用词也更加日常化,更接近一般人生活。

4、风雅颂对数字的使用偏好

雅颂比较一致,前两位均为“百”、“四”。如

  • “誰謂爾無羊?三百維羣。”(祈父之什・無羊)
  • “無思百憂,不出于熲。”(北山之什・無將大車)
  • “無思百憂,祇自疧兮。”(北山之什・無將大車)
  • “大姒嗣徽音,則百斯男。”(文王之什・思齊)
  • “四牡騑騑,周道倭遲。”(鹿鳴之什・四牡)
  • “桓桓武王,保有厥士,于以四方,克定厥家。”(閔予小子之什・桓)。

国风“百”字使用也较多,但更偏好“三”这个字,如

  • “摽有梅,其實三兮。”
  • “嘒彼小星,三五在東。”
  • “一日不見,如三秋兮。”
  • “不稼不穡,胡取禾三百廛兮!”
  • “三歲貫女,莫我肯顧。”

5、不足之处

  1. 文本来源来自网络,未进行精细校对,因而统计结果可能存在偏差;

  2. 学识所限,分析较为浅薄;

  3. 后续可以对风雅颂三部分用词的词性、名物等进一步分析对比,从而查看各部分的差异。

参考文献

  1. 《十三经注疏之毛诗正义》中华书局 [汉] 毛亨 传 [汉] 郑玄 笺 [唐] 孔颖达 疏

  2. 台大邱丽娟《中国文学史》公开课之诗经部分:https://v.qq.com/x/page/h083820f2yv.html

  3. 数据来源:https://github.com/myemptynest/Classic-of-Poetry