En las páginas, intentando poner en negrita todo lo que está dentro de {corchetes}

1

Tengo un documento de origen que estoy tratando de limpiar, es esencialmente texto simple. Pero el autor tiene el texto en negrita indicado con paréntesis {}, y la cursiva se indica con < > corchetes.

Me gustaría poder convertirlos automáticamente al estilo adecuado. ¿Hay alguna manera de lograr esto? Son casi 200 páginas, y en algunas hay más de 30 instancias en una sola página. Estas serán semanas de trabajo a la velocidad a la que voy.

Tengo las últimas páginas (y no tengo una versión anterior a la que recurrir). ¿Hay alguna forma de hacer esto?

    
pregunta John O 20.09.2016 - 16:47

1 respuesta

1

Recomendaría simplemente editar el archivo en .rtf, ya que contiene soporte para negrita y cursiva, pero no es tan complejo como los archivos de Pages.

RTF utiliza un sistema basado en etiquetas que denota ciertas propiedades con la barra diagonal inversa "\" como palabra de control, que es algo legible por humanos. . . Eche un vistazo a estas dos piezas: una con formato .rtf y la otra con texto en claro (o código).

  

Este es una prueba

.
{\rtf1\ansi\ansicpg1252\cocoartf1404\cocoasubrtf470
{\fonttbl\f0\fswiss\fcharset0 Helvetica;}
{\colortbl;\red255\green255\blue255;}
\margl1440\margr1440\vieww10600\viewh10400\viewkind0
\pard\tx720\tx1440\tx2160\tx2880\tx3600\tx4320\tx5040\tx5760\tx6480\tx7200\tx7920\tx8640\pardirnatural\partightenfactor0

\f0\fs24 \cf0 This 
\b is
\b0  
\i a
\i0  test.}

Al eliminar los metadatos, todavía tenemos un archivo .rtf válido, solo que con menos formato (que de todos modos no necesitamos).

{This 
\b is
\b0
\i a
\i0  test.}

Ni siquiera necesitamos esas nuevas líneas.

{This \b is \b0 \i a \i0 test.}

Con esto, resulta bastante trivial convertir tu texto: todo lo que necesitamos es buscar y reemplazar. Primero, cree un .txt con todos los datos y ábralo en su editor de texto favorito, incluso con TextEdit. Simplemente busque y reemplace:

  • { con \b
  • } con \b0
  • < con \i
  • > con \i0

Tenga en cuenta el espacio en blanco (es posible que tenga que abrir el código de reducción para verlo).

Todo lo que tenemos que hacer ahora es agregar una llave al principio y al final, ¡y hemos terminado!

Lorem ipsum dolor sit amet, {consectetur adipiscing elit.} Donec placerat turpis in ligula ullamcorper, eget finibus ligula pretium. Etiam pellentesque {rutrum varius. Proin non} nunc quam. Pellentesque vestibulum quam enim, ac mollis metus venenatis eget. Vestibulum purus nulla, gravida quis erat ac, <luctus venenatis nunc. Pellentesque ac posuere dolor, sed tincidunt arcu.> Duis sodales magna justo, non porta turpis <aliquam eu. Etiam tempor, enim eget maximus tincidu{nt, orci justo} consequat erat, ac elementum justo enim ullamcorper ex. Nunc libero ex, efficitur eget neque commodo, tempus hendrerit ipsum. Ut id placerat> mauris, eu porta nulla. Donec ultrices lectus non elit condimentum sollicitudin. Mauris molestie felis eget hendrerit lobortis. Cras scelerisque et tellus nec ultricies. Nam nisi urna, vehicula eget posuere sed, interdum eu {sem.}

Lorem ipsum dolor sit amet, \b consectetur adipiscing elit. \b0 Donec placerat turpis in ligula ullamcorper, eget finibus ligula pretium. Etiam pellentesque \b rutrum varius. Proin non \b0 nunc quam. Pellentesque vestibulum quam enim, ac mollis metus venenatis eget. Vestibulum purus nulla, gravida quis erat ac, \i luctus venenatis nunc. Pellentesque ac posuere dolor, sed tincidunt arcu. \i0 Duis sodales magna justo, non porta turpis \i aliquam eu. Etiam tempor, enim eget maximus tincidu\b nt, orci justo \b0 consequat erat, ac elementum justo enim ullamcorper ex. Nunc libero ex, efficitur eget neque commodo, tempus hendrerit ipsum. Ut id placerat \i0 mauris, eu porta nulla. Donec ultrices lectus non elit condimentum sollicitudin. Mauris molestie felis eget hendrerit lobortis. Cras scelerisque et tellus nec ultricies. Nam nisi urna, vehicula eget posuere sed, interdum eu \b sem. \b0

Cosas a tener en cuenta: RTF no admite caracteres no ASCII de forma predeterminada. Si necesita / desea para usarlos, deberá ingresarlos especialmente utilizando el control \u .

    
respondido por el JMY1000 21.09.2016 - 17:58

Lea otras preguntas en las etiquetas