语料库语言学兴起于20世纪80年代,是一门新兴学科,它致力于文本的检索、取样、分析以及统计。语料库的工具如Word Smith, AntConc等都可以为文本,尤其是具有情节性的文学文本的分析提供重要的理性依据。本文将通过语料库语言学的研究方法,主要运用AntConc软件中Word List, Concordance, Concordance Plot, Keyword List以及File View等工具来分析杰克·伦敦的《荒野的呼唤》的文本内容和主题,语言特点和情节发展等几个方面。
论文关键词:语料库检索,语言特点,情节发展
随着自然科技突飞猛进的发展, 计算机技术也正逐渐被应用于语言类人文学科的领域。语料库语言学作为一门新兴的边缘学科, 很好地结合了自然科学与文学, 近年来语料库语言学正以其独特的优势得以迅猛发展。语料库工具可以对任何一篇文学著作进行分析无论其长短难易。无论是否看过文本内容,语料库语言学可通过强大的加工、分析以及统计功能, 就文本的主题、人物以及情节发展进行趋理性地分析, 剔肉取骨,使在短时间内把握文本的核心骨架成为可能,甚至通过语料库的加工分析可以发现直观情况下所不能发现的某些规律。
本文通过使用AntConc工具对文本进行提纲挈领式的分析研究,如Word List通过词频进行排序,词频由高到低一目了然;通过类符型符比type/token可以判断出文本词汇量的丰富程度,类符型符比高说明文本的词汇量大;检索功能concordance可以将所有包含被检索词的句子片断罗列出来,方便对被检索词所处情景进行分析;检索情节concordance plot可以直观地再现被检索词在整个文本中的位置及疏密程度。总之,语料库强大的检索工具可以通过各种功能分析统计出文本中词语的出现频率,文本中词汇量的大小以及在全文本的各个章节关键词( 人物, 事物等) 出现的疏密程度等。另外一个文本还可以通过与另一个文本的对比分析其主题词表展示一个文本区别于其他文本的独特之处。
以往的文学鉴赏家对于著作本身的研究,仅仅局限于对原文斟词酌句的研究, 分析言外意, 得出对文学作品中的情节转化与人物塑造的理解与阐述。这种传统的鉴赏方法秉承了文学研究的精髓, 为我们鉴赏佳作提供了很好的土壤。然而, 不容忽视的是, 其带有很强的主观性, 不免会出现一些偏颇。因此, 引进理性主导的语料库检索研究, 能够很好地从客观的视角对文进行分析和加工, 从而提供更加令人信服的鉴赏成果, 再结合传统的主观鉴赏, 无异于为文学鉴赏锦上添花的同时, 更输入了新鲜的血液。[5]
本文用杰克•伦敦的《荒野的呼唤》作为文本, 主要运用AntConc中的wordlist, Concordance等工具来分析小说的大体内容,语言特色, 情节发展, 以及人物塑造等几个方面, 达到对原著更加理性化的分析, 从而为文学名著的研究开辟一个更新、更深入的途径。
二、运用语料库软件AntConc从三个角度对小说《荒野的呼唤》进行直观而深入的分析
表1《荒野的呼唤》中出现频率在前54位的单词
名次
频率
单词
名次
频率
单词
名次
频率
单词
1
2111
the
19
215
were
37
103
up
2
1469
and
20
214
they
38
101
Thornton
3
861
of
21
196
He
39
100
one
4
698
was
22
181
not
40
99
or
5
664
to
23
176
at
41
96
did
6
637
a
24
170
s
42
93
man
7
620
he
25
157
The
43
91
when
8
523
his
26
155
them
44
84
back
9
507
in
27
152
by
45
83
no
10
359
Buck
28
143
out
46
81
It
11
302
him
29
139
from
47
80
could
12
299
that
30
132
but
48
78
an
13
296
it
31
129
into
49
77
upon
14
294
with
32
124
which
50
76
They
15
273
had
33
118
dogs
51
75
dog
16
228
as
34
113
down
52
75
so
17
218
on
35
111
their
53
74
day
18
217
for
36
105
all
54
73
time
通过AntConc中Word List, Concordance Plot等工具分析主题及文本内容
通过对表1频率前54名的人称代词的观察 “he” 出现620次, “his” 523次, “him” 302次, “it” 296次, “they” 214次, “He” 196次, “them” 155次,“their”111次, “It” 81次, “They” 76次,发现出现的人称代词全部是男性而前54名中没有女性人称代词的出现,说明文本涉及的主要角色是男性,而且有很多男性, 否则作者不会如此频繁使用男性代词主格、宾格和物主代词以及复数形式。再通过对名词的观察分析 “Buck” 出现359次第10名也是第一个名词, “dogs” 出现118次, “Thornton” 出现101次, “man” 出现93次, “dog”出现75,用Concordance Plot工具可以很清楚的看到Buck贯穿整个文本始终是文本的最主要角色,从File View搜索出关于Buck的描述知道Buck是一只狗,所以文本的主题是围绕着这条狗的一系列事件。
1/3 1 2 3 下一页 尾页 |