Páginas arrastradas más grandes que el documento de origen

2

Tengo un documento académico de 35 páginas en foo.pdf creado usando LaTeX. El documento completo es de 950 KB.

Quiero extraer las figuras y tablas al final del documento en un archivo separado, así que abro el documento en Vista previa y arrastro las páginas que necesito al escritorio. Esto crea un nuevo archivo, foo (dragged).pdf que es de 2.2 MB.

¿Cómo pueden las últimas 10 páginas de un documento de 35 páginas ser 2.4 veces más grande que el documento original? ¿OSX está agregando muchos metadatos a estas páginas? Considero que esto es una curiosidad más que un problema, pero aún así ...

    
pregunta gregmacfarlane 13.06.2013 - 21:30

2 respuestas

2

El sistema operativo Mac no optimiza los archivos PDF de la forma en que Acrobat u otras aplicaciones de generación de PDF lo hacen normalmente. También es posible que cuando arrastre la página al escritorio, esté creando un PDF que sea realmente un contenedor para una imagen de mapa de bits.

Puedes intentar usar "Exportar como ..." haciendo clic con el botón derecho en una miniatura de una página y ver si eso genera archivos más pequeños. Otra opción sería eliminar todas las páginas que no desea conservar y luego guardar el archivo.

Aquí hay un hilo decente sobre la optimización del tamaño de los archivos PDF en Mac OS. enlace

    
respondido por el Dave Nelson 13.06.2013 - 23:22
2

Los archivos PDF son archivos de texto con algunos campos binarios, por lo que debería poder abrir los dos archivos en un editor de texto (o usar más / vi / grep) para inspeccionarlos. Una herramienta de comparación de archivos también podría ayudarlo a discernir si la Vista previa está recodificando los activos de una manera subóptima.

Automator también tiene algunas herramientas de procesamiento de PDF que incluyen compresión, compresión de imágenes y procesamiento de las páginas como imágenes. Intentaría exportar el PDF resultante de la Vista previa y seleccionaría el filtro de Cuarzo de "reducir el tamaño del archivo" para ver si quizás eso reduciría el tamaño.

Puede ver varias preguntas relacionadas donde otras personas han notado este efecto donde las configuraciones estándar aumentan el tamaño de algunos tipos de contenido.

Como posdata, un documento de 35 páginas en formato ascii con un peso de 950K es bastante eficiente, pero también es un orden de magnitud mayor que algunos textos básicos que están en el rango de 60 páginas, incluso con ilustraciones en cada página.

Tomemos, por ejemplo, este libro del Proyecto Gutenberg - El gato y el ratón de Hartwell James y John R. Neill

  • Las versiones de texto sin formato (UTF-8) y HTML están en el rango de 70 kB
  • La versión ePub es una elegante de 45 kB sin imágenes, pero aumenta a 2.8 MB con imágenes.

Si tomo la versión HTML y la inspecciono en Safari, está claro que 75 kB es solo el texto principal / archivo HTML y no todas las imágenes incluidas. Imprimiendo esa página en PDF utilizando Safari (que usa el mismo motor de renderizado que la Vista previa): obtengo un archivo de 3.7 MB que se puede comprimir con Quartz para reducir el filtro de tamaño de archivo a 2.2 MB.

Esperamos que estos ejemplos le ayuden a decidir si generar todas las versiones de sus archivos en LaTeX o vivir con las bibliotecas para la generación de PDF en OS X.

    
respondido por el bmike 14.06.2013 - 01:49

Lea otras preguntas en las etiquetas