AI论文写作指南01
2022-03-10 本文已影响0人
Nefelibatas
科学研究的基本流程
1.科学研究的定义
- 目的
- 扩展或提升目前的知识或技术
- 为创造发明新产品和新技术提供理论依据
- 手段
- 数据采集
- 数据组织
- 数据分析
- 实验验证
人工智能与机器学习:
- 机器学习:技术手段
- 监督学习
- 无监督学习
- 自监督学习
- RNN
- 实例应用
- 计算机视觉
- 自然语言处理
- 机器人技术
- 人际交互
完整流程
- 了解行业背景
- 基础知识
- 阅读相关文献
- 谷歌学术、知网、IEEE Xplore
- ACM 、EIsevier、Springer
- 找到研究方向
- 应用方向(NLP、CV、HCI)
- 找到研究痛点
- 技术方向(预处理算法、特征提取算法、分类器)
- 提出研究方向
- 理论调研和公式推导
- 技术实现可行性分析
- 实验数据库
- 实现设想系统和验证系统
- 开源代码调研
- 编程和调试
- 实验设计
步骤
- 数据清晰和预处理
- 环境、数据交互和可视化模块搭建
- 机器学习模型搭建
- 训练和验证代码编写
- 测试代码编写
- 撰写论文
- Title (题目)
- Authors (作者)
- Abstract (摘要)
- Introduction (引言)
- Related Work (相关工作)
- Proposed approach (提出的方法)
- Experiments (实验)
- Conclusions(结论)
- References(参考文献)
- 总结回顾
- 是否有相似论文最近发表
- 论文的理论和公式是否代码一致
- 实验结果复现
- 代码、数据库开源
科学的寻找和总结文献
科学文献
通过一定的方法和手段、运用一定的意义表达和记录体系,记录在一定载体的有历史价值和研究价值的知识。科学文献不仅仅只有学术论文!
期刊、会议和学位论文
维基百科、专业书籍
确定研究关键字:
- 所用的具体技术
- 应用场景
- 发表时间和作者
什么论文值得读?
- 顶级期刊会议
- 高引用
- 著名学者、研究组
- CCF
- 中科院分区
- IEEE、CVPR
科学的总结文献
阅读摘要
- 了解论文研究目的:是否与我的研究方向一致
- 了解论文所用方法:是否改方法可以改进或应用到我的任务中
- 了解论文方法的效果:该方法是否值得更深一步的探究
阅读论文
-
论文研究领域
-
论文所用方法:具体流程、核心技术、创新点、局限性
-
论文实验结果:应用场景、数据库、实验设计、实验结果
-
论文的结论
记录阅读过的论文
-
题目
-
研究领域的痛点以及现状
-
方法、重要细节、创新点
-
实验结果以及结论
寻找研究痛点和研究方向
研究痛点的类别
- 研究领域内无人应用过机器学习方法,而传统方法存在机器学习可以解决的问题。
- 最常见:研究领域内目前已有主流方法所存在的缺陷。
- 研究领域内缺少开源数据库或常用工具。
- 开发方便使用,稳定且效果尚可的研究工具。
- 采集并建立可开源且符合行业标准的数据库。
- 研究领域内缺少对比性或综述性论文。
- 将本行业的主流算法复现,并在多个数据库上进行测试对比。
- 撰写综述性论文。
调研研究痛点
- 存在该痛点的原因
- 该痛点对于研究领域的影响
- 解决该痛点的可行性
- 解决该痛点的收益
寻找研究方向
研究领域内无人应用过机器学习方法,而传统方法存在机器学习可以解决的问题。
-
若可以用机器学习方法解决该痛点,基于目前已有模型提出一种能解决该痛点的方法。
-
若不可以,研究不能解决的原因,并通过多种方式验证这些原因。
eg_1:
- 在精神健康(自闭症)方向未有直接利用CV或ML的方法对面部表情进行分析来检测的研究。
- 传统方法(看心理医生)速度慢,价格高,医生水平参差不齐。
- 机器学习方法速度快,价格便宜,客观。
eg_2:
- 在汽车轮胎生产领域未有直接利用CV或ML的方法来检测其某几种质量问题。
- 传统方法(人工检测)速度慢、价格高,检测准确度低。
- 机器学习方法速度快,价格便宜,准确度高。
研究领域内目前已有主流方法所存在的缺陷。
-
很多方法都只在特定条件下效果好。
-
针对该缺陷提出解决方案:预处理、学习算法、数据扩增、引入多模态数据等。
-
针对该缺陷对比多种解决方案。
eg_3:
-
理想数据库中训练出来的人脸识别模型在光照变化大的地方检测准确度不佳。
-
提出一个预处理方法:数据扩增,在训练时加入光照不一的图像。
-
提出一个新的CNN模型,加一个支干专门用于去除光照影响。
常用的机器学习研究平台
MATLAB
优点:
库函数丰富、不同OS上可以使用。
缺点:
深度学习库运行慢。
PyTorch
优点:
使用方便、参考文档丰富、适合研究使用。
缺点:无成熟的可视化接口,导出的模型较难移植。
TF:
优点:可视化程度高,说明文档高。
劣势:运行速度一般。