¿Cómo obtener texto de una página web desde la línea de comandos?

3

Estoy buscando una línea de comando equivalente a la opción Get text from webpage en /Applications/Automator.app . La opción Get text from webpage es bastante autoexplicativa, solo obtiene el texto, sin etiquetas HTML, CSS, JavaScript, etc. de una página web. Sé que puedo usar wget o curl pero eso me dará todas las etiquetas HTML, CSS, JavaScript, etc., no la única versión de texto de la página web.

    
pregunta JBis 12.04.2018 - 01:25

1 respuesta

0

Su mejor opción es el comando textutil . Lee la página del manual, pero algo como:

textutil -convert txt webpage.html

debería funcionar.

    
respondido por el benwiggy 16.12.2018 - 16:00

Lea otras preguntas en las etiquetas