Quiero guardar cada página de un archivo PDF como una imagen separada, comprimirlas y volver a combinar como PDF.
Algunos archivos PDF que uso a menudo son de un tamaño extrañamente grande. Quiero decir, unas 100 páginas pero unos 200M. Sospecho que esto se debe a que algunos archivos PDF se guardan de una manera gráfica de una resolución demasiado alta o de una manera que no está comprimida correctamente. El hecho de que los archivos que tienen una condición similar, en términos de resolución y legibilidad, a menudo tengan un tamaño más pequeño, me hace pensar que todavía hay espacio de compresión. (No tengo conocimiento en el procesamiento de imágenes, por lo que este es solo mi sentimiento).
Mi plan es el siguiente. Le pido al 1 y al 3, y es deseable que pueda hacer todo esto en la línea de comandos, para que yo pueda escribir un script de envoltura, lo cual será fácil. La captura de pantalla hace 1, y la vista previa puede hacer 3, pero no está claro si se pueden hacer con CLI.
-
Guarda cada página del PDF como imagen.
-
Filtra cada imagen. No pido esta parte, ya que las herramientas de procesamiento de imágenes son abundantes. Puedo explorar los filtros apropiados yo mismo. En términos de legibilidad, encuentro que reduce el tamaño del archivo si la imagen se pone en blanco y negro.
-
Recombine estas imágenes
Si tiene formas totalmente diferentes de comprimir un PDF, también es bienvenido. Tal vez haya alguien que haya envuelto todo el proceso y no necesito reinventar la rueda.