web archiv abspeichern und web archive verlinken regelt dirk
[geteilt] Internet-Archivierung
-
-
web archiv abspeichern und web archive verlinken regelt dirkWie Web Archiv arbeitet oder so würde ich gerne mal wissen.
Lagern die von selber Seiten ein, oder muss das der eigentliche Eigentümer das selber machen?
Je nach Vorgehensweise wird es auch entsprechend vollständig sein.
Kann mir nicht vorstellen das dort alles gelagert ist. -
Haben die nicht nen schlechten Crawler? Ich tue da nichts. Woher sollten die auch wissen, das whmeine Seite ist?
-
Wie Web Archiv arbeitet oder so würde ich gerne mal wissen.
Lagern die von selber Seiten ein, oder muss das der eigentliche Eigentümer das selber machen?
Je nach Vorgehensweise wird es auch entsprechend vollständig sein.
Kann mir nicht vorstellen das dort alles gelagert ist.http://web.archive.org
rechts unten hast du "save page now". da kannst manuell jede url speichern lassen.
davon abgesehen arbeitet der archive.org crawler wie jener von google. er legt auf einer seite los und klappert alle links ab und speichert sie dann. je haeufiger eine website verlinkt wird, desto oefter speichert archive.org eine kopie. wie das google ranking fuer websites.. -
Ist aber darauf angewiesen das einer es in Auftrag gibt.
Daher gehe ich mal davon aus das die seite nicht wirklich zu 100% vollständig ist.
Alleine weil schon die kosten für den Speicher immens werden dürften. -
Haben die nicht nen schlechten Crawler? Ich tue da nichts. Woher sollten die auch wissen, das whmeine Seite ist?Leider einen wirklich nicht so guten, wenn du nämlich Quellcode nicht explizit immer auf deine Seite linkst, sondern Dinge wie "unterverzeichnis/Datei.html" machst, crawlt der das auch absolut genauso. Für mich als Seitenersteller ist das zwar einfacher, weil ich den Code dann Blitzschnell auf einen neuen Server umziehen kann und das funzt direkt, nur leider für archive.org unbrauchbar.
Weswegen die Kopien von http://nt4.dancle.de da auch alle sehr nutzlos sind.
Edit: Oh, sie haben es scheinbar gefixt, geht jetzt wieder.
-
Hab mal draufgeschaut. scheint die Seite regelmäßig zu crawlen. Funktioniert auch, nur lädt die so mäßig schnell...
Jetzt mitmachen!
Du hast noch kein Benutzerkonto auf unserer Seite? Registriere dich kostenlos und nimm an unserer Community teil!