当前位置:首页 > 大知书院 > 古代文学 > 红楼夜话

大数据证明:宝玉笑道《红楼梦》(转载)

来源:书话红楼 作者:皇极梅ABC 2020-03-18

  大数据证明:宝玉笑道《红楼梦
  皇极梅 转

  大数据统计结果说:贾府的人很爱“笑”。而词频统计《红楼梦》出现最多的两个词为“宝玉”与“笑道”;宝玉是主人公也是作者,贾府人很爱“笑”,其实是作者也爱“笑;据此可以推断作者是”笑写红楼“,即宝玉笑道《红楼梦》。

  完成分词以后,词频统计就非常简单了。我们只需要根据分词结果把片段切分开,去掉长度为一的片段(也就是单字),然后数一下每一种片段的个数就可以了。

  这是出现次数排名前 20 的单词:

  宝玉(3940)、笑道(2314)、凤姐(1521)、什么(1432)、贾母(1308)、袭人(1144)、一个(1111)、黛玉(1102)、我们(1068)、王夫人(1059)、如今(1016)、宝钗(1014)、听了(938)、出来(934)、老太太(908)、你们(890)、去了(879)、怎么(867)、太太(856)、姑娘(856)

  通过分词后的词频,我们发现《红楼梦》中的人物戏份由多到少依次是宝玉、凤姐、贾母、袭人、黛玉、王夫人和宝钗。然而,这个排名是有问题的,因为”林黛玉”这个词的出现次数还有 267 次,需要加到黛玉的戏份里,所以其实黛玉的戏份比袭人多。同理,“老太太”一般是指贾母,所以贾母的戏份加起来应该比凤姐多。正确的排名应该是宝玉、贾母、凤姐、黛玉、袭人、王夫人和宝钗。

  此外,我们还发现《红楼梦》中的人物很爱笑,因为除了人名以外出现次数最多的单词就是“笑道” : )

相关栏目:
猜你喜欢
点击查看更多