基于语料库的英语学习者语料研究简介 许家金教授著作读书笔记之一
1.英语学习者各语料库数量比
书面语:口语=3:1
(数据来自比利时鲁汶天主教大学“全球学习者语料库一览Learner corpora around the world”),181个学习者语料库中,61个口语学习者语料库。
2.大型英语学习者语料库
在国内,6个公开发布的英语学习者语料库,只有3个有英语学习者口语语料库,语料采集自考试环境下的朗读、复述、口头叙述、看图说话、口头论说、口译、考生之间的会话、考官和考生之间的会话、多人讨论。
1)“中国学习者英语语料库”(Chinese Learner English Corpus, CLEC)by桂诗春、杨慧中;
2)“大学英语学习者英语口语语料库”(College Learners’ Spoken English Corpus, COLSEC)by杨慧中、卫乃兴,2005;
3)“中国学生英语口笔语语料库”(Spoken and Written English Corpus of Chinese Learners, SWECCL)by文秋芳;
4)“中国大学生英汉汉英口笔译语料库”(Parallel Corpus of Chinese EFL Learners, PACCEL)by文秋芳,2005;
5)“中国高校外语专业多语种语料库---之子库-英语专业学生的作文和翻译”(Corpus for English Majors, CEM)by上海外国语大学2005;
6)“中国学生万篇英语作文语料库”(Ten-thousand English Compositions of Chinese Learners, TECCL)by许家金2016。
在国外,LINDSEI包含11个国家的学习者的英语口语语料,350万词次;Trinity Lancaster Corpus包含9个国家的学习者的英语口语语料,100万词次。
1)“鲁汶国际英语口语中介语数据库”(Louvain International Database of Spoken English Interlanguage, LINDSEI)by比利时鲁汶天主教大学;
2)“三一学院兰卡斯特语料库”(Trinity Lancaster Corpus)by英国兰卡斯特大学。
3.口语语料采集来自音频转写,口语特征研究较少研究,例如,语音/韵律特征、话语交际策略、副语言特征。
中国学习者英语口语语言产出,研究课题包括:词汇、短语、句法和话语特征等的习得研究。语料库语言学的研究方法与转换生成语言学所坚持的语言的先天论和内在论不同,主张语言和语法构造产生于频繁往复的互动交流。当前的语言具有动态特征。与以语境论为核心的伦敦学派系统功能语言学、语用学、话语研究相吻合。
4.语言用法观
语言用法观(usage-basedapproach to language)理念和功能语言学相吻合。5条核心理念:
1)语言的首要目的是交际,语言形成于交流互动中
2)自然语言发生于语境。语言使用者的言语选择受限于一系列语境因素
3)语言是学得的。频率信息中的词语共现、语法共现是语言系统学得的关键
4)语义不单储存于词项,还有语法构型。
5)语言可以通过单一层面的机制得到准确解释,所有句法构造都无需通过深层和表层结构去解释。主动语态和被动语态是两个独立的语义构造。
5.语言特征
有了语料库研究方法,把二语习得研究从原来的小范围的小规模的案例研究推广到大规模,利用“中介语英语口语语料库”“本族语者英语口语语料库”和“汉语口语语料库”的综合对比,探究中国学生英语口语中相关语言特征的习得情况。语言特征有:互动话语词块、动词体、及物性、述补行为(接to do/doing)动词方位构式、复合运动事件、人物指称、话语评价和情境惯用语等。
6.研究方法
语料库统计分析的量化方法和语言学理论的定性分析相结合,相互印证,事项多重验证。
7.语料采集
采集的叙述性口语中介语。会话体和叙述体所占比重不相上下。传统研究侧重会话体的收集去解释如何完成交际策略(寒暄、问路、点餐、感谢、道歉)。但是交际策略完成后,深入沟通、阐述观点、讲个人故事、有条理地阐发观点,这些都需要细节描述,所以叙述体语料的收集同样重要。
围绕语言迁移研究,对英语母语、英语中介语和汉语母语进行对比分析,探讨母语迁移在中国学习者英语口语产出中的影响。
8.分析方法
中介语与本族语语料进行对比分析,诊断学习者语言与本族语之间的差异。
不同母语中介语之间进行对比分析,观察中介语与本族语之间的差异到底是由母语引起,还是中介语的共性特征,例如,用词匮乏、句式表达单一、整体语体风格呈现主观性强、书面语口语化特征。
中介语综合对比分析法包含,中介语英语和本族语英语对比、英汉双语对比、英语中介语与其汉语母语对比。
9.分析理论
语义学、认知语义学、心理语义学的行为实验手段
10.语料量化分析
频数统计、显著性和多因素分析法(多元回归分析法探究影响中国学习者选择动词述补结构的各种因素的权重)