Themabewertung:
- 0 Bewertung(en) - 0 im Durchschnitt
- 1
- 2
- 3
- 4
- 5
chiaki
Die Pommesfee
Beiträge: 12.534
Registriert seit: Jul 2008
|
Reguläre Ausdrücke :(
Ich packs einfach nicht, dass er folgendes macht:
Aus einer htmldatei die URLs ausgibt
(kleiner Auszug)
Code:
<td><a href="http://www.korou.de/Biete_Suche,Handy_Telefon_Fax-16.html">Handy/Telefon/Fax</a> </td>
</tr>
<tr>
<td><a href="http://www.korou.de/Veranstaltungen_Events,Karten_Tickets-18.html">Karten/Tickets</a> </td>
</tr>
<tr>
<td><a href="http://www.korou.de/Biete_Suche,Kleidung_Accessoires-19.html">Kleidung/Accessoires</a> </td>
</tr>
<tr>
<td><a href="http://www.korou.de/Kontaktanzeigen-20.html">Kontaktanzeigen</a> </td>
</tr>
<tr>
<td><a href="http://www.korou.de/Biete_Suche,Kostenlos_Tausche-21.html">Kostenlos/Tausche</a> </td>
Aus <a href="http://www.korou.de/Biete_Suche,Kleidung_Accessoires-19.html">Kleidung/Accessoires</a>
Sollte dann also: http://www.korou.de/Biete_Suche,Kleidung...es-19.html werden
und auch soll er nach
http://www.korou.de/*irgendwas*-*zahlen*.html
suchen.
(Dieser Beitrag wurde zuletzt bearbeitet: 25.01.2009 17:27 von chiaki.)
|
|
25.01.2009 17:25 |
|
Benedikt
this is serious!
Beiträge: 1.673
Registriert seit: Jul 2008
|
Reguläre Ausdrücke :(
Wie wärs mit
Code:
http://www\.korou\.de/[^.]*\.html
b1
|
|
25.01.2009 21:30 |
|
klemmi
Erfahrener Benutzer
Beiträge: 901
Registriert seit: Jul 2008
|
Reguläre Ausdrücke :(
mal so auf die Schnelle
(ungetestet...)
die Daten liegen in text.txt
Code:
#!/bin/bash
while read line
do
text=${line/*"<a href="/"<a href="};
text=${text/<\/a>*/"</a>"};
echo $text | grep html
done < text.txt
probiert...
müsste eig gehen...
PS: suchen, anch was du willst, das würde ich persönlich wieder per grep machen...
(Dieser Beitrag wurde zuletzt bearbeitet: 25.01.2009 22:03 von klemmi.)
|
|
25.01.2009 21:55 |
|
Benedikt
this is serious!
Beiträge: 1.673
Registriert seit: Jul 2008
|
Reguläre Ausdrücke :(
PHP-Code:
<?
$string = 'siehe anfangspost';
preg_match_all("%http://www\.korou\.de/[^.-]*\-[0-9]*\.html%",$string,$array); var_dump($array);
?>
Code:
array(1) {
[0]=>
array(5) {
[0]=>
string(57) "http://www.korou.de/Biete_Suche,Handy_Telefon_Fax-16.html"
[1]=>
string(65) "http://www.korou.de/Veranstaltungen_Events,Karten_Tickets-18.html"
[2]=>
string(60) "http://www.korou.de/Biete_Suche,Kleidung_Accessoires-19.html"
[3]=>
string(43) "http://www.korou.de/Kontaktanzeigen-20.html"
[4]=>
string(57) "http://www.korou.de/Biete_Suche,Kostenlos_Tausche-21.html"
}
}
so gehts bei mir
b1
(Dieser Beitrag wurde zuletzt bearbeitet: 25.01.2009 22:07 von Benedikt.)
|
|
25.01.2009 21:57 |
|
Dirk
Software Archäologe
Beiträge: 14.935
Registriert seit: Jul 2008
|
Reguläre Ausdrücke :(
ich würde alle zeichen zwischen
<a href="und
">
hab sowas mal mit ruby gemacht und da sah meine lösung so aus:
scan.(/href="(.*?[.]html?)/i)
also anfanden mit href=" danach alle zeichen gierig suchen. am ende muss .htm oder .html stehen. der punkt ist maskiert. .*? steht für mindestens ein zeichen oder mehr. der parameter i war für großkleinschreibung.
wenn du meine roogle suchmaschine haben willst, sag bescheid. baut aus ner domain die links raus und geht denen nach und wirft nen suchergebnis ala google raus
|
|
25.01.2009 22:01 |
|
Benutzer, die gerade dieses Thema anschauen: 1 Gast/Gäste