¿Qué hace que el tamaño del archivo PDF aumente al guardar en Vista previa?

16

Parece que realizar ediciones, anotaciones, o incluso simplemente abrir y guardar un archivo PDF en Vista previa causará un aumento significativo en el tamaño del archivo. Me he dado cuenta de que, para algunos libros que he escaneado, esto también mejora el tiempo de reproducción de la página.

¿Puede alguien arrojar algo de luz sobre lo que está sucediendo para causar estos cambios? Estoy interesado en sincronizar las anotaciones de los libros electrónicos en PDF entre Preview y el iPad (quizás GoodReader) pero esto puede ser muy poco práctico con archivos PDF grandes.

    
pregunta Alex B 01.01.2013 - 18:48

4 respuestas

12

En su novela poco conocida, PDF Karenina , Leo Tolstoy escribió,

  

Los archivos PDF codificados de manera óptima son todos iguales; Cada archivo PDF codificado de forma subóptima se codifica de manera subóptima a su manera.

Es difícil para cualquiera responder por qué sus archivos PDF son más grandes después de que la Vista previa los modifique. Un archivo PDF consta de muchos tipos diferentes de datos: imágenes, flujos de contenido, fuentes, sobrecarga de documentos, espacios de color, estados de gráficos extendidos y una tabla de referencia cruzada. Al igual que una oración puede ser concisa y otra verbosa, pero ambas son válidas en inglés y dicen lo mismo, también un archivo PDF puede tener una forma más detallada de representar el mismo contenido que un archivo PDF más conciso. Tendríamos que mirar sus archivos PDF exactos. Es probable que hayan sido creados por una variedad de diferentes piezas de software, algunas consisas, otras menos.

También importa qué versión de Mac OS X y Vista previa está utilizando, porque eso determina el software que escribe el nuevo archivo PDF cuando hace un Guardar como en Vista previa.

Sin embargo, puedo decirte qué se hace más grande con respecto a algunos de los archivos PDF de mi . Esta historia se aplica a mi computadora, que ejecuta Mac OS X 10.5.8 y Apple Preview 4.2 (469.5).

Un archivo, Giulio.pdf , es un documento de 22 páginas con texto como texto, no como imágenes escaneadas. Tiene un tamaño de 461,092 bytes. Lo abrí en Vista previa, hice Archivo ... Guardar como ... y lo guardé con un nuevo nombre de archivo. El nuevo archivo es 724,421 bytes, o 57% más grande.

Abrí cada archivo con Adobe Acrobat Professional, versión 8.3.1 para Mac OS. Hice Avanzado ... Optimizador de PDF ... Uso del espacio de auditoría ... . Un pequeño cuadro de diálogo proporcionó un desglose de cuántos bytes se debían a cada categoría de uso, más el porcentaje del tamaño total del archivo para la categoría.

El Giulio.pdf original tiene 390,754 bytes (84.75%) dedicados a flujos de contenido, y cero bytes dedicados a las imágenes. Está en el formato PDF 1.4. El archivo guardado por Vista previa tiene 675,846 bytes (93.29%) dedicados a flujos de contenido, también cero bytes de imágenes, y está en el formato PDF 1.3. La vista previa hizo que los flujos de contenido fueran 285,092 bytes más grandes, y eso representa el 73% de la diferencia de tamaño de archivo entre los dos.

Me pregunté si el formato de archivo PDF 1.3 era intrínsecamente menos eficiente para almacenar este tipo de archivo. Abrí el Giulio.pdf original en Adobe Acrobat Professional 8, e hice Avanzado ... Optimizador de PDF ... Haga compatible con: Acrobat 3.0 y versiones posteriores y presioné Aceptar. Guardé el archivo resultante con un nuevo nombre. El archivo resultante está en formato PDF 1.3 y tenía 452,356 bytes, o más pequeño que el original. Sus flujos de contenido son 375,171 bytes (82.94%), una proporción similar, pero más pequeña que los flujos de contenido del archivo original.

Por lo tanto, parece que podemos concluir que la aplicación Preview en Mac OS X 10.5.8 no es tan eficiente como la de otros creadores de PDF para crear flujos de contenido concisos en archivos PDF, y la diferencia es suficiente para explicar las tres cuartas partes de la diferencia de tamaño en un archivo PDF sin imágenes.

Hice un experimento similar en form k.pdf , un documento de 1 página escaneado en papel. El archivo original es de 303,730 bytes, de los cuales 298,197 bytes (98.18%) son imágenes. Una copia de este archivo creado por Vista previa usando Guardar como ... es 300,601 bytes, o 1% más pequeño. Esta diferencia de tamaño de archivo es más que explicada por una categoría más pequeña de bytes de "sobrecarga de documentos" en el archivo creado por Preview.

Por lo tanto, parece que también podemos concluir que la Vista previa no siempre hace que el tamaño de un archivo PDF aumente. Depende de la naturaleza del archivo PDF original y de lo conciso que sea para comenzar.

    
respondido por el Jim DeLaHunt 19.01.2013 - 23:12
3

Sé que es bastante tarde, pero he encontrado algo que parece funcionar, al menos si se usa inicialmente: he intentado usar el filtro de cuarzo para "Reducir el tamaño del archivo". Parece funcionar pero no está activado de forma predeterminada. Puedo elegirlo específicamente a través del menú Guardar como (mantener la opción), pero me preocupa que el método habitual sea el predeterminado en los guardados automáticos.

Esto es lo que me está pasando y cómo llegué a esta página en primer lugar: El PDF comienza como un libro de 91MB 900 páginas. Agrego una sola anotación, la guardo y el archivo salta hasta 2.29GB. Para colmo, se tarda una eternidad en guardar, especialmente porque estoy guardando en una unidad externa. ¡Gracias a Dios que la unidad es USB 3!

¿Hay alguna forma de extraer estas anotaciones? Puedo anotar y resaltar en Goodreader y PDF Expert en mi iPad. Si Preview no me permite hacer esto en mi computadora, ¿hay alguna otra aplicación que lo haga? ¿Por qué no puede simplemente guardar las anotaciones / resaltados, pero no intentar volver a comprimir todas las imágenes como que estoy guardando un JPEG cada vez? Gracias por la ayuda!

    
respondido por el Scott 27.05.2015 - 23:34
1

El problema sigue siendo grave. En Vista previa 7.0 (Mac Os 10.9.5.) Generé un pdf usando Acrobat 9.5.5. que dio lugar a un archivo de 5 MB. En Vista previa agregué exactamente 12 caracteres (usando las herramientas de edición). Después de guardar este archivo, se ha convertido en 14 MB.

Puede corregirlo abriendo y guardando nuevamente en Acrobat (puede que tenga que usar la opción "reducir el tamaño del archivo").

    
respondido por el Peter Uetz 08.02.2015 - 18:03
0

No se pueden agregar pistas a la solución. Puedo agregar un escenario similar (OS X 10.11.3): un pdf escaneado con un peso de ~ 800kb se abre en la vista previa, se eliminan un par de páginas escaneadas vacías, el pdf resultante de dos páginas más cortas es de ~ 2,2Mb. "Opción: guardar como" y seleccionar el filtro de cuarzo "reducir el tamaño del archivo" comprime el archivo hasta ... 1,9Mb.

El archivo original ha sido generado por una copiadora Xerox WC 7830, que según mi experiencia (en comparación con las máquinas multifunción / impresoras anteriores que teníamos) produce archivos PDF escaneados bastante bien optimizados.

No se puede ver ninguna diferencia en el archivo, visualmente; Supongo que supongo que las imágenes de la página se vuelven a comprimir en 24bpp, mientras que el archivo original es claramente con menos profundidad de color, probablemente de 6 bits (es un documento impreso y firmado, solo texto, el escáner hace un buen trabajo manteniendo el fondo blanco puro blanco). Lamentablemente, la vista previa no es lo suficientemente inteligente como para detectar y mantener esto, y parece que necesita volver a comprimir todo el archivo, aunque no se realizan cambios en las páginas restantes (una vez más, solo se han eliminado un par de páginas).

    
respondido por el Pimenta 26.02.2016 - 12:45

Lea otras preguntas en las etiquetas