qzgx.net
当前位置:首页 >> 怎么用jAvA读取pDF中的表格 >>

怎么用jAvA读取pDF中的表格

ITEXT插件方法 /** * @param pdf PDF文件路径 * @param txt 输出文本文件路径 * @throws IOException */ public void parsePdf(String pdf, String txt) throws IOException { PdfReader reader = new PdfReader(pdf); PrintWriter out = new Pr...

不通过的原因我觉得是和jar包的版本有关。另外的话由于看不到底层封装的逻辑,我没办法进行底层了解。还有就是pdfbox这个jar主要处理的是文字和图像信息,针对于表格这块,貌似并不给力

可以用PDFBox坐标读取的方法,相当给力

用PDFBox坐标读取相给力 -

是用itext读取的么,用itext我写过表格读取没试过,楼主可以看一看有没有帮助

用Java简单的读取pdf文件中的数据: 第一步:下载PDFBox-0.7.2.jar。提供一个下载地址: http://pdfhome.hope.com.cn/Resource.aspx?CID=63844604-5253-4ae1-b023-258c9e324061&RID=20cd8f94-1cee-40b6-a3df-0ef024f8e0d2解压后,把lib文件下的P...

最近在帮公司做工具,需要读取PDF中表格的数据。网上查了,大部分PDFBox读取的代码都大致相同,一行一行从头读到尾。尝试读取PDF表格的人可能会遇到表格有空数据时,列与列就会对不齐,这样就不能很好地进行数据的处理了。网上看到一个例子,用i...

用Java简单的读取pdf文件中的数据: 第一步:下载PDFBox-0.7.2.jar。提供一个下载地址:http://pdfhome.hope.com.cn/Resource.aspx?CID=63844604-5253-4ae1-b023-258c9e324061&RID=20cd8f94-1cee-40b6-a3df-0ef024f8e0d2解压后,把lib文件下的PD...

你需要用到PDFbox api https://pdfbox.apache.org/1.8/cookbook/textextraction.html 例子如下 import java.io.File; import java.io.IOException; import org.apache.pdfbox.pdmodel.PDDocument; import org.apache.pdfbox.text.PDFTextStrippe...

加水印看看可以吗 参考: java使用itext的showTextAligned方法给pdf添加文字水印(watermark) http://www.360sdn.com/java/2013/0722/588.html

网站首页 | 网站地图
All rights reserved Powered by www.qzgx.net
copyright ©right 2010-2021。
内容来自网络,如有侵犯请联系客服。zhit325@qq.com