自然语言处理——1.引言
2018-09-26 本文已影响25人
SpareNoEfforts
课程概要
- 课程概要图
基本概念
-
语言 VS 自然语言
语言:人类特有的,用来表达意思、交流思想的工具,是一种社会现象。
自然语言:更明确说明是人类历史发展过程中产生的,而不是机器语言。 -
语言学 VS 语音学
语言学:对语言的科学研究。语言的两个属性:文字、语音。
语音学:专门研究人类发声的科学。 -
自然语言理解 VS 自然语言处理 计算语言学 中文信息处理
自然语言理解:人工智能早期的一个领域。从微观上讲,语言理解是指从自然语言到机器内部的一个映射。从宏观上讲,指机器能够执行人类所期望的某些语言功能。eg.问答系统
自然语言处理:为了研究人与人交际中以及人与计算机交际中的语言问题的一门学科。
计算语言学:利用电子计算机进行的语言分析。用计算机技术来解决语言和语音等问题。
中文信息处理:中文信息处理是指用计算机对中文的音、形、义等信息进行处理和加工。中文信息处理是自然语言信息处理的一个分支,是一门与计算机科学、语言学、数学、信息学、声学等多种学科相关联的综合性学科。
自然语言处理的研究
- 机器翻译
- 信息检索
- 问答系统
- 信息抽取
- 文档分类
- 语言教学和文字识别
- 语音合成
- 说话人识别
- 语音学问题
- 知识图谱
NLP发展的主要难题
- 大量歧义
- 单词的边界界定
- 句法的模糊性
- 有瑕疵的或不规范的输入