如何写好一篇NLP论文(笔记)
原作:清华大学刘知远老师
原文:知乎回答
1. 论文在NLP领域的意义
学术研究的整体过程如下:
而论文的作用是:向学术界同行清晰准确地描述成果的创新点、技术思路、算法细节和验证结果。
2. 一篇 NLP 论文的典型结构
- 摘要:用 100-200 词简介研究任务与挑战、解决思路与方法、实验效果与结论。
- 介绍:用 1 页左右篇幅,比摘要更详细地介绍研究任务、已有方法、主要挑战、解决思路、具体方法、实验结果。
- 相关工作:用 0.5-1 页左右篇幅介绍研究任务的相关工作,说明本文工作与已有工作的异同。
- 方法:用 2-3 页篇幅介绍本文提出的方法模型细节。
- 实验:用 2-3 页篇幅介绍验证本文方法有效性的实验设置、数据集合、实验结果、分析讨论等。
- 结论:简单总结本文主要工作,展望未来研究方向。
结构虽然死板,但这样更能清晰向学术同行展示论文成果。
为了更清晰的表达,在论文写作还需要注意:
- 学会换位思考:这并不仅仅是写论文,而是所有写作中都需要注意的一点,就是防止将自己脑中的背景信息略过,这样对读者来说无疑是灾难。
- 注意逻辑严谨:
- 章节层面:Introduciton 提到已有方法面临的几个挑战,就要对应本文提出的几个创新思路,对应 Method 中的几个具体算法,对应 Experiment 中的几个实验验证。
- 段落和句子层面,段间要注意照应,是并列、递进、转折还是总分关系,需要谋划妥当,要有相应句子或副词衔接。段内各句,有总有分,中心思想句和围绕论述句分工协作。
3. Abstract 和 Introduction 怎么写
3.1 Introduction
- 起手介绍研究任务和意义;
- 随后简介面向这个任务的已有方法;
- 接着说明已有方法面临的关键挑战;
- 针对这些挑战,本文提出什么创新思路和具体方法;
- 最后介绍实验结果证明本文提出方法的有效性。
然后对这五部分分别详细介绍:
研究任务和意义:介绍本文的研究任务及其在该研究领域的重要价值和意义。如果是老任务不用详细写,如果是新任务,则需要详细介绍。
已有方法:从研究任务递进一步介绍已有方法,需要注意必须是最好的,最具有代表性的,也是本文工作准备改进的。
面临挑战:面对已有方法的不足和挑战,需要注意这个不足写的一定要客观,因为很可能评审的人就是已有方法的作者。
创新思路:此处呼应上面的面临挑战。
在面临挑战和创新思路中一般还可添加图片,更直观的展示。
实验结论:合理的实验验证自己的思路,一般要有提升才可。
3.2 Abstract
对于 Abstract,可以看做对 Introduction 的简介,最简单的做法是,以上每部分都精简为 1-2 句话组成 Abstract 皆可。
4 method
按照总分结构来介绍:总的部分介绍框架组成、符号定义等,分别介绍各个模块/步骤。
而在分的部分又可以继续采用总分结构进行定义。
还有需要注意:
1)Introduction 中对创新思路与方法的介绍,不要在 Method 中简单重复,否则会让认真通读全文的审稿人颇感厌烦。要做到前后照应,有所递进,前略后详,
2)Method 部分往往包含大量公式,需要保证公式风格和符号使用前后统一,新符号使用均需显式解释。
5 experiment
首先是介绍实验数据、评测标准和比较方法等基本信息。实验比较的已有代表方法(4.2 Baselines)、实验方法的参数设置(4.3 Experimental Settings)。
在介绍完实验基本信息后,主要开展两种实验:
1)主实验
目的是证明本文方法与已有方法相比的有效性。一般需要选取业界公认的数据集合或已有工作采用的实验验证方式,提升实验的可信性。对于学术论文而言,并不需要比该任务上最好的方法相比,只要证明采用本文创新方法与不采用本文方法相比更有效即可,也就是说,实验中尽量控制其他变量,只聚焦于本文关注的挑战问题即可。当然,如果能够因为本文创新思路,得到该任务上的最好效果,会更有吸引力,但不必总是强求。
一般实验结果用图表展示,然后在正文进行观察分析。例如,论文 [2] 的主实验部分先介绍不同 Selector 和 Reader 对实验效果的影响(4.4 Effect of Different Paragraph Selectors、4.5 Effect of Different Paragraph Readers),接着介绍主实验结果和观察分析(4.6 Overall Results)。其中表格中会把最好效果加粗显示,一般应大部分位于本文提出的方法;为了更加清晰明了,观察分析结论可用(1)(2)(3)列出,其中第 1 条一般要得出主要结论,即本文方法要显著优于已有方法。
2)辅助实验
目的是展示本文创新方法的优势和特点。例如,不同超参数对本文方法的影响(Hyper-Parameter Effect),不同模块对本文方法效果的贡献(Ablation Test),不同数据划分对本文方法的影响(如 Few-shot Learning 相关工作比较常见),本文方法的主要错误类型(Error Analysis),本文方法能够改进效果的典型样例(Case Study)等。这些实验需要根据论文创新工作特点而有针对性的设计,一切要为体现本文的创新价值而服务。
Experiment 部分的特点是要图文并茂,注重通过多个表格和图示来呈现本文方法的优势和特点,需要注意图表风格统一。初学者特别注意,要做到仅凭图表下方的说明文字就可以理解每张图表内容,不要让读者还要到跑到正文寻找相关说明。因为,很多有经验的审稿人在看完 Introduction 后,会直接跳到 Experiment 图表中寻找对比效果。
6 Related Work
这部分主要是介绍本文任务和方法的相关工作,目标是通过对已有工作的梳理,凸显本文工作的创新价值。对已有工作的梳理,不应是对每个工作的简单介绍,而应当注意汇总、分类、分析,或者按照时间发展顺序,或者按照技术路线划分。
在对相关工作的介绍中,要注意暗合本文创新思路要解决的挑战,不应是单纯的介绍,而是夹叙夹议,时刻注意与本文工作的照应。在 Related Work 的最后,应该落脚到本文工作与已有工作相比,有什么新的思路,解决了什么挑战问题。
初学者特别注意,Introduction 和 Related Work 部分是特别需要导师或其他有经验学者帮助把关的。一是,不能遗漏重要相关工作,这点需要论文作者对相关领域工作保持跟踪;二是,与 Introduction 要求类似,对已有工作的评述务必精准客观。
Related Work 一般放在 Introduction 之后,或者 Conclusion 之前,这一般取决于论文工作的特点。对于那些与已有工作联系紧密、创新精微的工作,一般建议放在 Introduction 之后,方便读者全面了解本文工作与已有工作的关系,然后开始在 Method 介绍本文方法。而对于有些框架性创新工作,如果主要是对已有方法的组合,一般建议 Related Work 放在 Method、Experiment 之后即可。这点并无成法,完全根据行文方便来定。
7 Conclusion
在论文最后会有总结展望,一般用一段来再次总结和强调本文的创新思路和实验结果,然后说明未来建议的研究方向和开放问题。这部分相对来讲比较固定。稍微留意的是,在准备论文最后阶段,如果发现论文有哪些应当做还没来得及做的,可以写作本文的未来工作。至少可以向审稿人表明你也想到这个问题了,赢得一点同情分。