日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

谷歌為什么要開源,安卓既然是開源的( 二 )


谷歌為何開源robots.txt?這家搜索巨頭有怎樣的打算?
【谷歌為什么要開源,安卓既然是開源的】外媒VentureBeat報(bào)道稱 , 谷歌希望將發(fā)展數(shù)十年的robots.txt解析器開源 , 以推動(dòng)REP成為搜索引擎爬蟲的行業(yè)標(biāo)準(zhǔn) , 機(jī)器人排除協(xié)議(REP)是荷蘭軟件工程師MartijnKoster于1994年提出的一個(gè)標(biāo)準(zhǔn) , 幾乎已經(jīng)成為了網(wǎng)站不希望被搜索引擎收錄的注釋的事實(shí)標(biāo)準(zhǔn) 。(截圖viaVentureBeat)比如谷歌爬蟲(Googlebot)就會(huì)在索引某個(gè)網(wǎng)站時(shí)掃描robots.txt文件 , 以確定其應(yīng)該忽略掉哪些部分 , 
如果文件不在根目錄下 , 搜索引擎默認(rèn)會(huì)對(duì)整個(gè)網(wǎng)站的內(nèi)容進(jìn)行索引 。值得一提的是 , 這個(gè)文件不僅可以用來提供直接的爬蟲索引 , 還可以用來填充一些關(guān)鍵詞 , 實(shí)現(xiàn)“搜索引擎優(yōu)化”(SEO) 。另外 , 并不是所有的抓取工具都會(huì)嚴(yán)格遵循robots.txt文件 。比如幾年前 , 互聯(lián)網(wǎng)檔案館只選擇支持其“WaybackMachine”存檔工具 , 其他惡意抓取工具也有意忽略了REP 。

推薦閱讀