División del archivo de texto LexisNexis

1

Para mi investigación tengo varios archivos de texto (txt o doc). Estos tienen una gran cantidad de recortes de periódico en ellos.

Me gustaría dividir estos archivos de texto. Cada recorte comienza con

  

documento X de Y

Sé de la herramienta de línea de comando split : ¿hay alguna forma de usar división para dividir el archivo de texto grande en el número Y de archivos como se indica en el archivo único más grande (doc o txt) generado por LexisNexis?

    
pregunta wierts 19.11.2013 - 17:15

1 respuesta

1

La división permite una coincidencia de patrón de expresión regular de manera tan simple:

split -p pattern longfile.doc

Comenzaría cada nuevo archivo cuando se encontrara un patrón. Determinar qué regexp coincide con su archivo específico podría ser más adecuado para enlace pero quizás sepa cómo elaborar regexp y no se dio cuenta de que la división coincidiría con un patrón .

    
respondido por el bmike 19.11.2013 - 18:11

Lea otras preguntas en las etiquetas