duplicado posible:
Can you provide an example of parsing HTML with your favorite parser?
How can I extract content from HTML files using Perl?¿Cómo puedo extraer datos de tablas HTML en Perl?
Estoy tratando de utilizar expresiones regulares en Perl para analizar una tabla con la siguiente estructura. La primera línea es la siguiente:
<tr class="Highlight"><td>Time Played</a></td><td></td><td>Artist</td><td width="1%"></td><td>Title</td><td>Label</td></tr>
Aquí deseo de sacar "Tiempo jugado", "Artista", "Título" y "Etiqueta", e imprimirlos a un archivo de salida.
¡Cualquier ayuda sería muy apreciada!
Ok lo siento ... He intentado muchas expresiones regulares tales como:
$lines =~/(<td>)/
OR
$lines =~/<td>(.*)</
OR
$lines =~/>(.*)</
Mi programa actual se ve así:
#!perl -w
open INPUT_FILE, "<", "FIRST_LINE_OF_OUTPUT.txt" or die $!;
open OUTPUT_FILE, ">>", "PLAYLIST_TABLE.txt" or die $!;
my $lines = join '', <INPUT_FILE>;
print "Hello 2\n";
if ($lines =~/(\S.*\S) /) {
print "this is 1: \n";
print $1;
if ($lines =~/<td>(.*)< /) {
print "this is the 2nd 1: \n";
print $1;
print "the word was: $1.\n";
$Time = $1;
print $Time;
print OUTPUT_FILE $Time;
} else {
print "2ND IF FAILED\n";
}
} else {
print "THIS FAILED\n";
}
close(INPUT_FILE);
close(OUTPUT_FILE);
Duplicado de http://stackoverflow.com/questions/1406891/how-can-i-extract-content-from-html-files-using-perl –
No es realmente un duplicado de esa pregunta. –
@Kinopiko: lo suficientemente cerca. ¿Cuál es la diferencia entre querer extraer porciones entre etiquetas td y etiquetas li? –