Tipps und Tricks » kleine webmaster FAQ

ID #1811

wie kann man Bild-URLs aus einer HTML-Seite auslesen ?

Hallo,

mit PHP 5 und DOM ist das relativ einfach:

Source file
01 <?php
02  $seembefore=array();
03  
04  getmyimg('index.html','bilder.txt',$seembefore);
05  # powered by minipipes
06  # usage
07  # find images in HTML
08 
09     function getmyimg($hml_file,$output_file,$seembefore){
10         echo "..laden.. bitte warten"; $texturl="";   $meldung="<br>das hat leider nicht geklappt";
11         $hml_file=@file_get_contents($hml_file);
12         if($hml_file!="") {
13 
14 
15         $xmlurls=array();  $texturl="";  $aus=0;
16         $mydom=new DOMDocument;
17         @$mydom->loadhtml($hml_file);
18         $hmlurls=$mydom->getelementsbytagname('img');
19 
20 
21         foreach($hmlurls as $myt) {
22           $maus=$myt->getattribute('src');
23           if((stristr($maus,".jpg")||stristr($maus,".jpeg"))&&!isset($seembefore[$maus])) {
24 
25            $texturl.=$maus."\r\n";
26            $seembefore[$maus]=1; }
27 
28          }
29          echo "<br>HTML erfolgreich geladen";
30 
31       $mytest=@file_put_contents($output_file,$texturl);
32       @chmod($output_file,0777);
33 
34       if($mytest>0){
35 
36       $meldung= "<br>Erfolgreich gespeichert";}
37         }    else{
38             $meldung.=": HTML konnte nicht geladen werden";
39         }
40       echo $meldung;
41     }
42 
43 
44 
45 ?>

Das Array seemBefore enthält alle URLs, die zuvor geprüft wurden.

Die Größe des Arrays hängt von der PHP-Einstellung memory_limit ab.

.
.
 

Tags: Bild, DOM, PHP, Programmieren, webmaster

Verwandte Artikel:

Letzte Änderung des Tests: 2015-08-15 15:36
Autor: pipe

Leser: 2575 (1.76 pro Tag )


Revision: 1.0

Artikel bewerten

bisher bewertet
3.61 (59 ×)

1 2 3 4 5

Kommentar schreiben


Spam Schutz

..