¿Cuál es la diferencia y el uso de las codificaciones UTF-8 y UTF-8-MAC en iconv?

0

¿Cuál es la diferencia y el uso de las codificaciones UTF-8 y UTF-8-MAC en iconv?
Pensé que era la diferencia entre \ n y \ r (MAC OS 9) al principio.
Pero probé iconv -f UTF-8 -t UTF-8-MAC filename > filename2
El contenido del archivo no cambia en la vista hexadecimal.

    
pregunta maP1E bluE 22.12.2018 - 20:55

1 respuesta

2

Como se explica aquí , utf-8-mac es la versión utf 8 de un texto después de la aplicación de la normalización de Unicode NFD (por ejemplo, los caracteres acentuados están representados por el carácter base más un carácter de acento de combinación), con ciertos rangos de puntos de código excluidos de la operación de descomposición.

Por ejemplo, el carácter é se puede representar de dos maneras diferentes igualmente válidas en Unicode:

  • "\ x {00E9}" - punto de código único, LATINA PEQUEÑA LATINA CON CON AGUDA, utf-8 C3 A9, "compuesto".
  • "\ x {0065} \ x {0301}" - dos puntos de código, LATINA PEQUEÑA LETRA E y COMBINACIÓN DEL ACENTO AGUDO, utf-8 65 CC 81, "descompuesto"

UTF-8-MAC se asegurará de que siempre se use la segunda forma descompuesta.

    
respondido por el Tom Gewecke 22.12.2018 - 21:57

Lea otras preguntas en las etiquetas