Abrir el archivo de texto en Números cuando está delimitado por espacios, pero algunos campos son cadenas entre comillas y espacios

0

Tengo un archivo de registro que me gustaría abrir en Números para facilitar mucho el análisis. El problema es que el formato no es CSV. Cada línea tiene aproximadamente una docena de campos, y los campos en sí están separados por espacios. Sin embargo, algunos de esos campos son cadenas, que contienen espacio, por lo que no puedo simplemente reemplazar los espacios y ubicar la coma. Un campo, la fecha, en realidad tiene el formato siguiente: [06/Feb/2018:03:27:37 +0000] . Este parece ser el único lugar donde se usan [] s, por lo que podría encontrar / reemplazar aquellos con "s, pero todavía tengo problemas para importar el documento. Coloca todas las filas en una sola columna.

Entonces, para resumir, mi objetivo es tomar un archivo de entrada y dividir cada fila para que el espacio sea el delimitador, pero ignora los espacios entre comillas.

    
pregunta Jake T. 06.02.2018 - 19:51

1 respuesta

2

si tiene un editor que puede usar expresiones regulares (por ejemplo, textwrangler o bbedit)
o está dispuesto a usar sed (en este caso, recuerde la marca -E)
o puede escribir un pequeño filtro en cualquier idioma que conozca (por ejemplo, perl o python),
Primero puede cambiar los corchetes a "sy luego usar la expresión regular:
    s / \ (? = (?: [^ "] " [^ "] ") [^ "] $) / \ t / g
para convertir cualquier espacio, no entre comillas, en tabulaciones, para que Números lo importe correctamente (no es que yo sea tan bueno con expresiones regulares, se explica aquí: regex101.com/r/sU3fA2/29)

    
respondido por el Gio Valerio 07.02.2018 - 19:09

Lea otras preguntas en las etiquetas