Vorheriges Thema anzeigen :: Nächstes Thema anzeigen |
Autor |
Nachricht |
Marky

Anmeldungsdatum: 02.09.2004 Beiträge: 1173
|
Verfasst am: 04.04.2007, 22:52 Titel: Archive.org spiegeln |
|
|
Hi,
ich muss eine komplette Domain von Archive.org auf meine Festplatte spiegeln. Sind etwa 10.000 Files.
Hat jemand Erfahrung in dieser Hinsicht (bei Archive.org erhält man ja mehr Fehlermeldungen als archivierte Seiten...) und kann evtl. Tipps geben oder Programme empfehlen? HTTrack ist hier schon mal unbrauchbar, das lädt manche Dateien einfach nicht herunter (nicht nur bei Archive.org). Warum weiß ich nicht.  |
|
Nach oben |
|
 |
ThePuppetMaster

Anmeldungsdatum: 18.02.2007 Beiträge: 1839 Wohnort: [JN58JR]
|
Verfasst am: 04.04.2007, 23:37 Titel: |
|
|
Willst du allen ernstes 2 Billionen Webseiten bei dir Saven?!? ...
MfG
TPM _________________ [ WebFBC ][ OPS ][ ToOFlo ][ Wiemann.TV ] |
|
Nach oben |
|
 |
Jojo alter Rang

Anmeldungsdatum: 12.02.2005 Beiträge: 9736 Wohnort: Neben der Festplatte
|
Verfasst am: 04.04.2007, 23:42 Titel: Re: Archive.org spiegeln |
|
|
Marky hat Folgendes geschrieben: | ich muss eine komplette Domain von Archive.org auf meine Festplatte spiegeln. Sind etwa 10.000 Files. |
schonmal versucht, zu lesen?  _________________ » Die Mathematik wurde geschaffen, um Probleme zu lösen, die es nicht gäbe, wenn die Mathematik nicht erschaffen worden wäre.
 |
|
Nach oben |
|
 |
ThePuppetMaster

Anmeldungsdatum: 18.02.2007 Beiträge: 1839 Wohnort: [JN58JR]
|
Verfasst am: 05.04.2007, 01:45 Titel: |
|
|
Hab ich ... ja .. udn da Archivs.org rund 2 Billionen seiten gesaft hat, und diese folglich zur Domain gehören, ist das ne nicht sonderlich gute idee
wobeis schon vorteile hat, wenn man das INet Lokal hat
MfG
TPM _________________ [ WebFBC ][ OPS ][ ToOFlo ][ Wiemann.TV ] |
|
Nach oben |
|
 |
Michael712 aka anfänger, programmierer
Anmeldungsdatum: 26.03.2005 Beiträge: 1593
|
Verfasst am: 05.04.2007, 02:08 Titel: |
|
|
ich glaube Marky meint, er will eine domain, die man bei archive.org angucken kann, spiegeln. Also zum Beispiel ein archiveintrag von freebasic.net oder so  _________________
Code: | #include "signatur.bi" |
|
|
Nach oben |
|
 |
ThePuppetMaster

Anmeldungsdatum: 18.02.2007 Beiträge: 1839 Wohnort: [JN58JR]
|
Verfasst am: 05.04.2007, 02:40 Titel: |
|
|
aaaaaaaa ... naja .. mit HTTrack geht das schon, man muss da nur ein paar dinge konfigurieren.
z.B. den Timeout, und das Redirection.
MfG
TPM _________________ [ WebFBC ][ OPS ][ ToOFlo ][ Wiemann.TV ] |
|
Nach oben |
|
 |
progon aka bitbender

Anmeldungsdatum: 16.07.2006 Beiträge: 168 Wohnort: Kassel
|
Verfasst am: 05.04.2007, 09:55 Titel: |
|
|
Also ich hab noch das Programm Webspider im Angebot
Damit kann man eigentlich sehr leicht komplette Websites runterladen. Könntest es ja mal ausprobieren. Hat bei mir bisher immer funktioniert.
EDIT: Hier ist der Link:
http://www.xaldon.de/products_webspider.html _________________ MfG progon
 |
|
Nach oben |
|
 |
Mao
Anmeldungsdatum: 25.09.2005 Beiträge: 4409 Wohnort: /dev/hda1
|
Verfasst am: 05.04.2007, 11:24 Titel: |
|
|
HTTrack hat (nach entsprechender Config) bei mir eigentlich auch immer das gezogen, was ich wollte.  _________________ Eine handvoll Glück reicht nie für zwei.
--
 |
|
Nach oben |
|
 |
Marky

Anmeldungsdatum: 02.09.2004 Beiträge: 1173
|
Verfasst am: 05.04.2007, 14:53 Titel: |
|
|
Danke für den Link, progon! Den kannte ich noch nicht.
Nach einiger Konfiguration zieht HTTrack bei mir auch fleißig, das Problem ist nur, dass die meisten Binärdateien (ZIP, RAR, EXE usw.) nicht vollständig vom Archive übertragen werden. Der Server beendet die Verbindung 1 Byte vor Dateiende, d. h. die entsprechenden Dateien werden korrupt! Wiederaufnahme wird nicht untersützt (rückschrittlicher gehts auch nicht...) Das Problem ist mir aber bekannt, und es ist nicht nur bei mir so. Eine Lösung gibt es anscheinend nicht. Mit ReGet kann man die fehlerhaften Downloads pausieren und dann aus der Downloadliste rauslöschen. Danach sind sie kurioserweise intakt. Nur muss das alles manuell gemacht werden.  |
|
Nach oben |
|
 |
|