Deshabilitar el manejo automático de "ligaduras" en PDF / Vista previa en El Capitán

4

Es posible que haya encontrado un error grave en EC ...

Como estudiante universitario, con frecuencia necesito copiar y pegar pasajes cortos de documentos PDF en otros documentos (por ejemplo, para citar). Anteriormente, en Yosemite, simplemente usaba Vista previa para hacer esto. La vista previa es impresionante porque sus algoritmos de AI casi siempre determinan correctamente dónde están los saltos de párrafo. Casi todos los demás visores de PDF que he usado simplemente ponen retornos duros en cada salto de línea visual en el PDF.

Sin embargo, en EC, ciertos caracteres comunes "ligados" (es decir, dos o más caracteres representados juntos, como "Th", "ffi", "ff", "fi", "ft" - estos son los que yo ' encontrado hasta ahora) terminan copiando como espacios en blanco. En otras palabras, si tengo un PDF que contiene texto que dice:

"This is different from those who can afford to pay for college first; such students may find it less difficult by at least fifty percent."

Obtendré esta salida cuando copie y pegue este texto:

" is is di erent from those who can a ord to pay for college  rst; such students may  nd it less di cult by at least   y percent."

¡Esto claramente no es el resultado deseado!

Cuando selecciono lentamente el carácter de texto por carácter, puedo ver claramente que la selección se está moviendo sobre todas las letras en la ligadura al mismo tiempo, en otras palabras, trata la ligadura como si fuera un carácter.

Probé el PDF en una máquina de laboratorio en la escuela que todavía está ejecutando Yosemite y no mostró este comportamiento, por lo que definitivamente es un error introducido en EC.

¿Hay una configuración tal vez a través de defaults que puedo usar para deshabilitar completamente este comportamiento?

(Como nota al margen, descubrí este error después de entregar un documento y pedirle a un profesor que me preguntara por qué mis citas parecían tan graciosas ... No revisé tan cuidadosamente como debería, pero aún así). / p>     

pregunta fdmillion 29.11.2015 - 09:42

1 respuesta

1

¿Está seguro de que no es un simple error de sustitución de fuente? ¿En qué fuente se representa el PDF? ¿Tienes esa fuente instalada? ¿La máquina de laboratorio la tiene instalada? ¿El documento que está pegando usa la misma fuente que el PDF de origen?

Hice una prueba simple usando su texto de ejemplo, colocado en un documento de Word (con ligaduras habilitadas), luego guardado como un PDF usando el PDF integrado de Acrobat o el software integrado de Apple.

El texto original, cortado y pegado desde Word:
“Esto es diferente de aquellos que pueden pagar primero la universidad; tales estudiantes pueden encontrarlo menos difícil al menos en un cincuenta por ciento ".

PDF de Apple, cortado y pegado desde la vista previa:
“Esto es diferente de aquellos que pueden pagar primero la universidad; a tales estudiantes les puede resultar menos difícil al menos por ciento, y por ciento ".

PDF de Adobe, cortado y pegado desde la vista previa:
“Esto es diferente de aquellos que pueden pagar primero la universidad; a tales estudiantes les puede resultar menos difícil al menos el 50% ”.

Adobe PDF, cortado y pegado desde Acrobat Pro:
“Esto es diferente de aquellos que pueden pagar primero la universidad; tales estudiantes pueden encontrarlo menos
difícil por lo menos por ciento y medio ".

Todos los intentos anteriores se pegaron correctamente, con la excepción de la ligadura "fty", que difería en la representación en función de los métodos de creación y reproducción de PDF utilizados. Es probable que este carácter no se traduzca correctamente en texto sin formato porque he habilitado más que simples ligaduras básicas en Word (opcional y discrecional, pero no histórico).

En general, me parece que no es más que un error de codificación o sustitución de fuente. Recuerde que un documento PDF tendrá todos los caracteres de fuente necesarios incrustados en el archivo, pero al pegar, la fuente de destino no necesariamente coincidirá con la fuente, especialmente si está utilizando un sistema con una instalación limpia (lo que significa menos fuentes).

    
respondido por el dr.nixon 30.11.2015 - 18:58

Lea otras preguntas en las etiquetas