Reguläre Ausdrücke :(

  • Ich packs einfach nicht, dass er folgendes macht:
    Aus einer htmldatei die URLs ausgibt
    (kleiner Auszug)

    Aus <a href="http://www.korou.de/Biete_Suche,Kleidung_Accessoires-19.html">Kleidung/Accessoires</a>

    Sollte dann also: http://www.korou.de/Biete_Suche,Kleidung_Accessoires-19.html werden

    und auch soll er nach
    http://www.korou.de/%2Airgendwas%2A-%2Azahlen%2A.html
    suchen.

    Einmal editiert, zuletzt von chiaki (25. Januar 2009 um 17:27)

  • mal so auf die Schnelle;)
    (ungetestet...)

    die Daten liegen in text.txt

    probiert...

    müsste eig gehen...

    PS: suchen, anch was du willst, das würde ich persönlich wieder per grep machen...

    Einmal editiert, zuletzt von klemmi (25. Januar 2009 um 22:03)

  • so gehts bei mir

    Einmal editiert, zuletzt von Benedikt (25. Januar 2009 um 22:07)

  • ich würde alle zeichen zwischen
    <a href="und
    ">

    hab sowas mal mit ruby gemacht und da sah meine lösung so aus:
    scan.(/href="(.*?[.]html?)/i)
    also anfanden mit href=" danach alle zeichen gierig suchen. am ende muss .htm oder .html stehen. der punkt ist maskiert. .*? steht für mindestens ein zeichen oder mehr. der parameter i war für großkleinschreibung.

    wenn du meine roogle suchmaschine haben willst, sag bescheid. baut aus ner domain die links raus und geht denen nach und wirft nen suchergebnis ala google raus

Jetzt mitmachen!

Du hast noch kein Benutzerkonto auf unserer Seite? Registriere dich kostenlos und nimm an unserer Community teil!