语料库汇总
2019-07-25 本文已影响0人
_2c_
1.BCC语料库
北京语言大学的BCC汉语语料库,总字数约 150 亿字,包括:报刊(20 亿)、文学(30 亿)、微博(30 亿)、科技(30 亿)、综合(10 亿)和古汉语(20 亿)等多领域语料。
网址:http://bcc.blcu.edu.cn/
网站页面如下图:

2.CCL语料库
北京大学中国语言学研究中心的CCL语料库,包括现代汉语语料库、古代汉语语料库、汉英双语语料库(仅限北大校内用户使用)。
网址:http://ccl.pku.edu.cn:8080/ccl_corpus/index.jsp
网站页面如下图:

3.语料库在线
功能强大,除了可以实现语料库检索功能以外,还可分析处理语料。语料库检索包括现代汉语语料库、古代汉语语料库、语料库字词索引。语料分析处理包括:分词和词性标注、汉语拼音标注、字词频率统计。
网址:http://corpus.zhonghuayuwen.org/index.aspx
网址页面如下:

4.澜科语言科技
澜科语言科技语料库包括汉语教材语料库、全球华语语料库、中小学作文语料库、网页分类新闻语料库。
网址:http://www.languagetech.cn/corpus/
网站页面如下:

小rainbow
2019.7.25