itextpdf读取pdf宽高问题

原创于 2024-12-05 11:42:40 发布 · 1k 阅读

CC 4.0 BY-SA版权

文章标签：

在使用itextpdf读取文档宽高的时候，大多数代码都是这样的：

Rectangle page = reader.getPageSize(pageNum);
float width = page.getWidth();
float height = page.getHeight();
int rotation = page.getRotation();

这样读取的，对于标准pdf如A4等，数据是正确的，但如果pdf中存在裁剪框等，pdf尺寸将会发生变化，根据 reader = new PdfReader(input);的reader提供属性
在这里插入图片描述
可以看到cropbox和mediabox两个属性值不同，采用如下代码

Rectangle cropBox = reader.getCropBox(1);
float width = cropBox.getWidth();
float height = cropBox.getHeight();
int rotation = reader.getPageRotation(1);

其中1代表当前页面，通过该参数打印的将是pdf的正常尺寸，这在与前端读取尺寸获取坐标的时候，将会是一致的，此外，pdf会有旋转的隐藏属性rotation，需要根据该旋转角度，修正pdf的宽高

	if (rotation == 270 || rotation == 90) {
		log.debug("当前pdf：{} 页码：{} 已被旋转：{}", signFileDto.getFileId(), pageNum, rotation);
	} else {
	}

具体可以参考pdf的属性：

MediaBox用来描述页面的高度和宽度。对于普通用户，这个大小很可能等同于实际的页面大小。对于用于印前处理，就不太适合，因为我们更希望将页面定义得稍微大一点以便让我们看到页面的bleed（bleed是什么？下面有解释，国外的一个网站介绍的）、裁剪标记和有用的信息比如文件名或者文件创建的时间日期。这就意味着用于图形印刷品的PDF通常其MediaBox比裁剪页面大小稍大。MediaBox是一个页面中最大的box。其他的box可以和它一样大，但绝不可以比它大。
CropBox 定义了页面内容的裁剪到区域.Adobe Acrobat软件使用这个来显示和打印页面.
如果用于印前处理，这个box就太不着调了. GWG工业协会建议完全不要使用CropBox。 BleedBox
定义了当用于生产环境时页面内容将被裁剪到的区域。通常BleedBox比TrimBox大3到5毫米。知道BleedBox的大小是很有必要的，但是在图形产品中这个box不是很重要。多数印前处理系统允许你设定bleed的大小从而忽略BleedBox。默认情况下，BleedBox与CropBox相等。
TrimBox
定义了最终页面想要的尺寸。与CropBox相反，TrimBox非常重要，因为它定义了页面的实际大小。我所知道的所有的装版和工作流都使用TrimBox作为压印机上的页面定位基准。默认情况下，TrimBox与CropBox相等。当创建PDF/X-1a
或者 PDF/X-3兼容PDF文件时，系统要求MediaBox, TrimBox 和 BleedBox必须被正确地定义。 ArtBox
有点特殊。它定义了某些特殊用途的页面中的区域。它很少被程序用到。有一种情况会使用到它是在控制页面广告。如果一个页面有广告，那么ArtBox定义了广告区域的大小。

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA
版权协议，转载请附上原文出处链接和本声明。原文链接：https://blog.csdn.net/fghler/article/details/107456819