Con PHP, ¿cómo puedo aislar el contenido del atributo src de $ foo? El resultado final Busco me daría sólo "http://example.com/img/image.jpg"Regex y PHP - aislar el atributo src de la etiqueta de img

$foo = '<img class="foo bar test" title="test image" src="http://example.com/img/image.jpg" alt="test image" width="100" height="100" />';

2010-01-22 Jeff

In before rage about using regex para analizar HTML. – meagar

@meagar - El uso de expresiones regulares es válido (aunque no necesariamente la ruta más eficiente) en este ámbito limitado. –

@middaparka/sarcasmo: p – meagar

Si no desea utilizar expresiones regulares (o cualquiera de los componentes de PHP no estándar), una solución razonable utilizando el incorporado en DOMDocument class sería la siguiente:

<?php 
    $doc = new DOMDocument(); 
    $doc->loadHTML('<img src="http://example.com/img/image.jpg" ... />'); 
    $imageTags = $doc->getElementsByTagName('img'); 

    foreach($imageTags as $tag) { 
     echo $tag->getAttribute('src'); 
    } 
?>

Fuente

2010-01-22 22:14:05

¡Agradable! Esto es muy parecido a lo que terminé haciendo. No estaba al tanto de DOMDocument, pero lo intentaré. – Jeff

tratar este patrón:

'/< \s* img [^\>]* src \s* = \s* [\""\']? ([^\""\'\s>]*)/'

Fuente

2010-01-22 21:53:24 user256058

Esto no funcionará si img está en mayúscula o si el título contiene un '>'. Sería más robusto usar un analizador HTML. –

Código

<?php 
    $foo = '<img class="foo bar test" title="test image" src="http://example.com/img/image.jpg" alt="test image" width="100" height="100" />'; 
    $array = array(); 
    preg_match('/src="([^"]*)"/i', $foo, $array) ; 
    print_r($array[1]) ;

salida

http://example.com/img/image.jpg

Fuente

2010-01-22 21:54:36

¡Tenga cuidado con las referencias de entidad '&' y las referencias de caracteres numéricos en los resultados! – bobince

¡Como quieras! =) Aquí hay una sintaxis alternativa: '/ src =" (. *?) "/ I'. –

Lo haría de esta manera también. – Alex

// Create DOM from string 
$html = str_get_html('<img class="foo bar test" title="test image" src="http://example.com/img/image.jpg" alt="test image" width="100" height="100" />'); 

// echo the src attribute 
echo $html->find('img', 0)->src;

http://simplehtmldom.sourceforge.net/

Fuente

2010-01-22 22:11:19 karim79

Esto es lo que terminé haciendo, aunque no estoy seguro acerca de la efectividad de este es:

$imgsplit = explode('"',$data); 
foreach ($imgsplit as $item) { 
    if (strpos($item, 'http') !== FALSE) { 
     $image = $item; 
     break; 
    } 
}

Fuente

2010-01-22 22:51:47 Jeff

este enfoque tendrá problemas si la URL de la imagen es relativa al documento, p. "../../img/something.jpg" – tomfumb

se puede ir en torno a este problema al utilizar esta función:

 

function getTextBetween($start, $end, $text) 
{ 
$start_from = strpos($text, $start); 
$start_pos = $start_from + strlen($start); 
$end_pos = strpos($text, $end, $start_pos + 1); 
$subtext = substr($text, $start_pos, $end_pos); 
return $subtext; 
}
 
$foo = '<img class="foo bar test" title="test image" 
src="http://example.com/img/image.jpg" alt="test image" 
width="100" height="100" />';
 
$img_src = getTextBetween('src="', '"', $foo);

Fuente

2010-01-22 23:37:03

Tengo este código:

$dom = new DOMDocument(); 
$dom->loadHTML($img); 
echo $dom->getElementsByTagName('img')->item(0)->getAttribute('src');

Suponiendo que sólo hay una img: P

Fuente

2010-01-23 01:44:41 AntonioCS

preg_match resuelve este problema muy bien.

Véase mi respuesta aquí: How to extract img src, title and alt from html using php?

Fuente

2010-09-28 17:05:27 Jazzerus

Estoy muy tarde para esto, pero tengo una solución simple, pero no se menciona. Cárguelo con simplexml_load_string (si tiene habilitado el modo simplexml) y luego inviértalo en json_encode y json_decode.

$foo = '<img class="foo bar test" title="test image" src="http://example.com/img/image.jpg" alt="test image" width="100" height="100" />'; 

$parsedFoo = json_decode(json_encode(simplexml_load_string($foo)), true); 
var_dump($parsedFoo['@attributes']['src']); // output: "http://example.com/img/image.jpg"

$parsedFoo viene a través de como

array(1) { 
    ["@attributes"]=> 
    array(6) { 
    ["class"]=> 
    string(12) "foo bar test" 
    ["title"]=> 
    string(10) "test image" 
    ["src"]=> 
    string(32) "http://example.com/img/image.jpg" 
    ["alt"]=> 
    string(10) "test image" 
    ["width"]=> 
    string(3) "100" 
    ["height"]=> 
    string(3) "100" 
    } 
}

He estado usando esto para analizar XML y HTML para unos pocos meses y funciona bastante bien. Todavía no he tenido problemas, aunque no he tenido que analizar un archivo grande con él (me imagino que usando json_encode y json_decode de esa manera se volverá más lento cuanto más grande sea la entrada). Es intrincado, pero es de lejos la forma más fácil de leer las propiedades de HTML.

Fuente

2015-07-10 22:01:19

Encontré un pequeño problema con esto la semana pasada. Si un nodo XML tiene atributos y un valor, solo se puede acceder al valor con este método. Terminé teniendo que escribir un analizador simple que transformará el simplexml en una matriz, manteniendo todos los datos. –

-1

supongamos que yo uso

$text ='<img src="blabla.jpg" alt="blabla" />';

getTextBetween('src="','"',$text);

los códigos volverán:

blabla.jpg" alt="blabla"

que está mal, queremos que los códigos para devolver el texto entre el atributo cotizaciones de valor, es decir, attr = "valor".

por lo

function getTextBetween($start, $end, $text) 
      { 
       // explode the start string 
       $first_strip= end(explode($start,$text,2)); 

       // explode the end string 
       $final_strip = explode($end,$first_strip)[0]; 
       return $final_strip; 
      }

hace el truco !.

Trate

getTextBetween('src="','"',$text);

volverá:

blabla.jpg

Gracias a todos lo mismo, porque su solución me dio una visión de la solución final.

Fuente

2016-08-01 12:24:50 user3721605

Realmente no quiero decir que su enfoque sea malo, pero creo que usar domdocument sería una solución mucho mejor a esta pregunta. ref este por ejemplo: http://stackoverflow.com/questions/6441448/how-do-i-get-the-src-attribute-of-img-tags – Abela

La biblioteca domdocument es demasiado pesada para una tarea tan simple. eso es como usar una excavadora para aplastar a una serpiente cuando tienes una alternativa de machete. – user3721605

Respuesta

Código

salida

Cuestiones relacionadas