自然语言处理与教育
无论是人工智能和大数据,还是细化到自然语言处理,教育似乎都与之没什么关联。自然语言处理一直以来都是比较抽象的,都是直接用词汇和符号来表达概念。但是使用符号存在一个问题,比如两个词,它们的词性相近但词形不匹配,计算机内部就会认为它们是两个词。举个例子,荷兰和苏格兰这两个国家名,如果我们在一个语义的空间里,用词汇与词汇组合的方法,把它表示为连续、低维、稠密的向量的话,就可以计算不同层次的语言单元之间的相似度。这种方法同时也可以被神经网络直接使用,是这个领域的一个重要的变化。
从词汇间的组合,到短语、句子,一直到篇章,现在有很多人在做这个事,这和以前的思路是完全不一样的。
有了这种方法之后,再用深度学习,就带来了一个很大的转变。原来我们认为自然语言处理要分成几个层次,但是就句法分析来说,它是人为定义的层次,那它是不是一定必要的?这里应该打一个问号
自然语言处理研究的目标是让计 算机学会理解 和 运用人类的自然语 言汉语,英语等 ,是 计 算机科 研领域 暨 人 工 智 能 领域 中的重要研 究 方 向 . 教育 是人工智能 研究 的 一 个 重 要 试验 田 和 应用 领域 , 自 然语 言 处 理技 术 与 教 育 的 结 合 ,不仅为 自 然 语 言处 理 开 拓 了 新 的 应 用 领域 同 时 为 教育 领 域所 面 临 的 困 难和 问 题 提供解决 思 路 与 方案 . 介 绍 自 然语 言 处理 的 一 些 基本概 念, 并 着 重 讨论 自 然语 言处 理技术在教 育 领域 的应 用 。
从历史渊源上看, 教育一 直是人工智能研究的重要试验田和应用领域. 自 然语言处理作 为人工智能的 一个重要分支, 和教育有着不解之缘 . 早期的 自 然语言处理技术应用于教育领域就是进行语法错误检测 , 随着技术的发展和教育环境的变化,教育领域对 自 然语言处理技术的需求日益增加,越来越多的技术应用于实际的教育环境 . 例如, 在写作方面 , 作文评分是个复杂的课题 , 属于高风险测验, 自 动作文评价系统 目 前已经实现商业化, 正在用于评价上百万测试者的作文 ? 系统的成功得益于相对成熟的 自 然语言处理技术和资源积累 , 同 时这样的系统也可用于英语作文教学, 我国 已 经有了3个在线英文教学系 统 : 冰果 、 句酷 、 iWr it e3。 在 语音方面, 智 能 教学系统已 经可以实现与学习者进行语音交互,基于语音的应答方式也被用于低风险测试和 一些练 习 系统。
随 着网络技术的发展, MOOC 成为 一 种重要的现代教育 技术手段和创新平台 .保证在线教育在 “大规模” 的条件下仍然得以有效进行需要多方面的技术手段, 自 然语言处理技术在 M OOC 平 台 上大有用武之地 . 例如 , 传统课堂学 习 者为在校学生, 一般规模在数十人 、 上百人 , 而 M OOC 课程的学习者是社会上的海量人群, 数量猛增 到上万或数十万。 对于这样大规模的学生作业 , 一般很难像校 内 课堂一 样安排助教对学生作业及时批改. 基于机器 自 动评判和打分的交互式练习 即 时反馈技术在 MOO C 教学过程中起到 了举足轻重的作 用 .