pdf提取字符

2022-03-11  本文已影响0人  价值投机168

需要安装:iTextSharp

static void Main(string[] args)
{
//创建阅读器,是文件路径
PdfReader pdfReader = new PdfReader(@"e:\mypdf.pdf");
//获取文档内容
string strContent = string.Empty;
//对每一页内容进行提取
for (int page = 1; page <= pdfReader.NumberOfPages; page++)
{
ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();
string pageContent = PdfTextExtractor.GetTextFromPage(pdfReader,page, strategy);
//将每一页内容放入字符串中
strContent += pageContent;
}

        //关闭读取工具
        pdfReader.Close();
    }
上一篇 下一篇

猜你喜欢

热点阅读