日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

隨心所欲下載—構(gòu)造你自己的Linux網(wǎng)絡(luò)螞蟻( 二 )


bash$ wget --header="Referer: http://coming.from.this/page" http://surfing.to.this/page
一些非凡的非公眾的web站點(diǎn)只能將內(nèi)容發(fā)送到一些非凡的類(lèi)型的瀏覽器中 。可以使用“User-Agent:”頭信息發(fā)送:

bash$ wget --header="User-Agent: Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)" http://msie.only.url/here
(注重:以上提供的技巧是被使用在滿足內(nèi)容許可機(jī)制的情況下使用 。否則 , 將是違法的行為 。)
指定下載的時(shí)間
假如你想在你辦公室的與你的同事共用一根線路的電腦里下載大型文件 , 想象一下他們因?yàn)樵鞠駮晨斓男∠粯拥木€路忽然便得像爬蟲(chóng)一樣慢而發(fā)怒的樣子 , 你就會(huì)考慮將你的文件傳送時(shí)候改在非高峰使用期了 。你不必在等到每個(gè)人都離開(kāi)后還呆在辦公室里 , 也不必在飯后在家中遠(yuǎn)程登錄 。你只要在工作日程安排程序中做以下設(shè)置:
bash$ at 2300
warning: commands will be executed using /bin/sh
at> wget http://place.your.url/here
at> press Ctrl-D
我們?cè)O(shè)定在晚上23點(diǎn)的時(shí)候開(kāi)始下載 。我們要做的就是確信atd這個(gè)日程安排守護(hù)進(jìn)程還在工作^&^ 。
下載要花好幾天?
當(dāng)你下載的一個(gè)或多個(gè)文件包含許多數(shù)據(jù) , 而機(jī)器的帶寬使得它的傳送速度可以和信鴿相比的時(shí)候 , 你會(huì)發(fā)現(xiàn)當(dāng)你在第二天早上到了公司 , 預(yù)定的下載還沒(méi)有完成 。你終止這個(gè)工作而且提交另外一個(gè)at工作 , 這次你使用了“wget -c” , 只要下載沒(méi)有完成 , 就天天都重復(fù)這個(gè)工作 。這時(shí)候最好是使用“crontab.txt”自動(dòng)執(zhí)行它 。建立一個(gè)名為 “crontab.txt”的純文本文件 , 內(nèi)容如下:
0 23 * * 1-5 wget -c -N http://place.your.url/here
0 6 * * 1-5 killall wget
這將是crontab文件 , 它指定周期性的執(zhí)行什么工作 。前面的五欄指定什么時(shí)候開(kāi)始執(zhí)行命令 , 每行的后面部分指定執(zhí)行什么 。前兩欄指定時(shí)間——晚上23點(diǎn)整開(kāi)始wget , 早晨6點(diǎn)整就killall wget 。位于第三第四的* 表示每個(gè)月的每一天都可以進(jìn)行這樣的工作 。第五欄表示每個(gè)星期的哪些天安排了工作時(shí)間進(jìn)程——“1-5”表示星期一到星期五 。
每個(gè)工作日的晚上23點(diǎn)下載工作開(kāi)始 , 早6點(diǎn)整下載工作停止 。為使這個(gè)crontab工作時(shí)間表發(fā)揮作用 , 你需要鍵入以下命令:
bash$ crontab crontab.txt
“-N”參數(shù)將檢查目標(biāo)文件的時(shí)間郵戳 , 當(dāng)它找到了匹配的時(shí)間戳 , 它就會(huì)終止下載 , 因?yàn)樗砻髡麄€(gè)這個(gè)文件已經(jīng)被傳送 ?!癱rontab -r”可以取消這個(gè)日程時(shí)間安排 。我使用這種方法來(lái)通過(guò)撥號(hào)上網(wǎng)下載了許多ISO文件 。
下載動(dòng)態(tài)網(wǎng)頁(yè)
一些動(dòng)態(tài)的網(wǎng)頁(yè)需根據(jù)需要產(chǎn)生 , 經(jīng)常頻繁的變動(dòng) 。既然目標(biāo)文件從技術(shù)角度上講不能算是一個(gè)文件 , 那么也就無(wú)所謂什么文件長(zhǎng)度 , 繼續(xù)下載也就變得毫無(wú)意義——“-c” 選項(xiàng)難以工作 。例如:在Linux Weekend News中生成PHP頁(yè):
bash$ wget http://lwn.net/bigpage.php3
假如你中斷了下載 , 然后又想繼續(xù) , 它將從頭開(kāi)始下載 。我辦公室的Net線路有時(shí)候慢得讓人受不了 , 所以我寫(xiě)了一個(gè)簡(jiǎn)單的腳本用來(lái)決定什么時(shí)候中斷傳遞動(dòng)態(tài)的Html頁(yè):
#!/bin/bash
#create it if absent
toUCh bigpage.php3
#check if we got the whole thing
while ! grep -qi "" bigpage.php3
do
rm -f bigpage.php3
#download LWN in one big page
wget http://lwn.net/bigpage.php3
done
這個(gè)bash腳本在找到“”之前會(huì)一直下載文檔 , “”標(biāo)志著文件的結(jié)束 。
SSL和Cookies
用“https://”開(kāi)頭可以通過(guò)SSL(Secure Sockets Layer , 安全套接口層)訪問(wèn)遠(yuǎn)程文件 。你會(huì)發(fā)現(xiàn)另外一個(gè)名為curl的下載軟件, 在有些情況下使用它會(huì)相當(dāng)便利 。

推薦閱讀