pandoc实现文本格式转换

2020-04-18  本文已影响0人  rx_rx

Pandoc 是一款免费的开源文档转换器,通过命令操作实现各种文本格式文件间的转换。它是由加州大学伯克利分校的 John MacFarlane 教授创造。

其支持的文本格式特别广泛,与我相关的主要包括:

官网Pandoc

下载地址GitHub - jgm/pandoc

tex -> docx

参考自How to Convert from Latex to MS Word with ‘Pandoc’

最简单命令

pandoc main.tex -o main.docx

其中,main.tex 为源码文件名称,参数-o后面连接输出文件名称main.docx

注意,对于main.tex中的数学模式内容,即公式,直接转化为office word可编辑公式

文献引用

当存在引用文献,并使用了.bib文件时,可以添加参数--bibliography来指定.bib文件的路径和名称

pandoc main.tex --bibliography=ref.bib -o main.docx

文档格式

对于不同的期刊,会有不同的文档格式要求。如果期刊给定了doc模板的话,可通过参数--reference-docx进行套用

pandoc main.tex --bibliography=ref.bib --reference-docx=template.doc -o main.docx

需要说明的是,根据模板质量和tex的复杂程度,这个套用过程不一定成功。

docx -> tex

参考自Converting from docx to tex · grattan/grattex Wiki · GitHub

pandoc main.docx --wrap=none -o test.tex

其中,参数--wrap=none可去除段落内部的换行。当为书籍时,可添加参数--chapters,从而指定section的最高级为\chapter,而非\section。

经过上述转换,再对tex文件指定cls,以及相应的公式、图表、文献索引的编辑。

更多类型的文档格式转换见Pandoc - Demos

上一篇 下一篇

猜你喜欢

热点阅读