pymupdf 合成pdf

张映发表于 2018-08-08

fpdf是一个基于php的pdf处理工具，但是有一个很严重的缺点，就是无法识别annots。pymupdf是基本mupdf的，基于python开发，功能比较强大，能识别annots

1，下载pymupdf

https://github.com/rk700/PyMuPDF

2，安装pymupdf

下载完成后，pymupdf/installation/centos，有安装方法

# wget https://mupdf.com/downloads/mupdf-1.13.0-source.tar.gz
# tar -zxvf mupdf-1.13.0-source.tar.gz

# cd mupdf-1.13.0-source
# export CFLAGS="-fPIC -std=gnu99"

# make HAVE_X11=no HAVE_GLFW=no HAVE_GLUT=no prefix=/usr/local
# sudo make HAVE_X11=no HAVE_GLFW=no HAVE_GLUT=no prefix=/usr/local install

# cd ..

# rm -rf PyMuPDF
# git clone https://github.com/rk700/PyMuPDF.git
# cd PyMuPDF

# sudo python setup.py build
# sudo python setup.py install

3，测试代码

# cat /root/mergePdf.py
#! python
'''
@author: tank
@blog: blog.51yip.com

v1.0 Created on Feb 25, 2018
'''
# coding:utf-8

from __future__ import print_function

import os, sys,fitz, json

data = json.loads(sys.argv[1])

doc = fitz.open(data['pdf'])
pageCount = doc.pageCount

for index in range(pageCount):
	str_index = str(index)
	# if data['images'].has_key("'" + str(index) + "'"):
	if str_index in data['images'].keys():

		page = doc[index]
		pix = fitz.Pixmap(data['images'][str_index])
		page.insertImage(page.rect, pixmap=pix, overlay=True)

doc.save(sys.argv[2])

传参数如下：

argv[1]对应参数如下：

{
 "pdf": "绝对径/1.pdf",
 "images": {
 "0": "绝对径/2.png",
 "2": "绝对径/3.png"
 }
}

argv[2]对应参数如下：

绝对径/2.pdf

调用方法：

# python mergePdf.py argv[1] argv[2]

上面的这个例子，是将二张图片，合成到pdf的第一页和第三页，并且生成新的pdf

转载请注明
作者:海底苍鹰
地址:http://blog.51yip.com/other/1944.html

丸子留言 (2019年5月4日 13:33 ):

具体的安装步骤可以再说明白一点嘛......下载了作者给的两个链接的文件，安装步骤实在没明白

留下评论

抱歉，发表回复评论您必须登录。

分类目录
- apache/nginx (36)
- cache (21)
- clickhouse (14)
- drupal (7)
- eclipse (8)
- elasticsearch (18)
- google (3)
- hadoop/spark/scala (96)
- html/css (12)
- java/android (14)
- linux (87)
- mariadb (2)
- mysql (74)
- nodejs/vue/js/jquery (72)
- nosql (39)
- oracle (9)
- pgsql (8)
- php (107)
- seo (16)
- shell (11)
- smarty (5)
- tidb (21)
- wordpress (13)
- 云计算 (22)
- 双眼看社会 (13)
- 技术其他 (41)
- 服务器相关 (136)
- 系统安全 (7)
最近文章
最近评论和留言
- banner 在 awk是命令还是编程语言上的评论
- lin 在 hadoop 查看 mr日志报错上的评论
- ccc 在 cdh hive 2.1.1 升级到 2.3.4 上的评论
- 简简单单在关于我上的评论
- www 在 clickhouse,tidb,mysql 读取速度对比上的评论
- zzq 在 mysql分表，分区的区别和联系上的评论
- Bill 在怎么在网上找到你要的信息上的评论
- 11 在留言板留言了
- Michael 在 canal 同步mysql数据到clickhouse 支持update delete truncate 上的评论
- 我兜里有糖在 linux postgresql 安装配置详解上的评论
登录
- 登录

海底苍鹰(tank)博客

－－一步，二步，三步，N步，二行脚印

赞助本站

关于我

留言板

开发手册

linux命令

首页

pymupdf 合成pdf

1 条评论

留下评论

分类目录

最近文章

最近评论和留言

登录

海底苍鹰(tank)博客

－－一步，二步，三步，N步，二行脚印

赞助本站 关于我 留言板 开发手册 linux命令 首页

pymupdf 合成pdf

1 条评论

留下评论

分类目录

最近文章

最近评论和留言

登录

赞助本站

关于我

留言板

开发手册

linux命令

首页