Escludere l'elenco di file specifici in wget

Sto provando a scaricare un sacco di pagine da un sito web su dial-up e può essere brutalmente lento. Ho quasi ottenuto il command perfetto wget , ma poiché sto scaricando pagine dallo stesso sito, wget spreca i tempi di download delle stesse immagini standard per each pagina.

Se conosco il nome delle immagini di pagina predefinite, c'è un modo per ignorare wget e quindi evitare di scaricare quelli per each pagina?

Ecco un esempio di uno dei comandi wget che il mio script di shell genera in un altro script di shell per scaricare tutte le pagine:

 mkdir candy-canes-on-the-flannel-board-in-preschool cd candy-canes-on-the-flannel-board-in-preschool wget -p -nd -A jpg,html -k http://www.teachpreschool.org/2011/12/candy-canes-on-the-flannel-board-in-preschool/ wget -c --random-wait --timeout=30 --user-agent="Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.3) Gecko/2008092416 Firefox/3.0.3" http://www.teachpreschool.org/2011/12/candy-canes-on-the-flannel-board-in-preschool/ -O "candy-canes-on-the-flannel-board-in-preschool" rm Baby-and-Toddler.jpg Childrens-Books.jpg Creative-Art.jpg Felt-Fun.jpg Happy_Rainbow-e1338766526528.jpg index.html Language-and-Literacy.jpg Light-table-Button.jpg Math.jpg Outdoor-Play.jpg outer-jacket1-300x153.jpg preschoolspot-button-small.jpg robots.txt Science-and-Nature.jpg Signature-2.jpg Story-Telling.jpg Tags-on-Preschool.jpg Teaching-Two-and-Three-Year-olds.jpg cd ../ 

Ora mi rendo conto che lo script non è probabile che possa essere esperto ma che sta facendo quello che ho bisogno al momento tranne che puoi vedere dal command rm che vorrei solo impedire a wget di scaricare i file in primo luogo se ansible.

Ho quasi dimenticato di citare due comandi wget e questo è perché il primo scarica la pagina come index.html e per qualche motivo non si apre nel mio browser, tuttavia, quando lo apro e lo guardo in vim all del contenuto della pagina è lì, quindi non so perché non si apra. Ma se emetto il secondo command wget come è, allora quella pagina, lo stesso file con un nome alternativo, si apre bene. Qualcosa che, se potessi risolvere, contribuirebbe anche a semplificare il process.

Wget possiede un'opzione per l' --reject rejlist che puoi utilizzare. L'elenco di rifiuto è un elenco di pattern di nome di file.

ha anche un'opzione -nc per evitare di scaricare e sovrascrivere i file esistenti.