&

首頁(yè) > 產(chǎn)品更新 > robots.txt寫法大全及語(yǔ)法的靈活運(yùn)用

robots.txt寫法大全及語(yǔ)法的靈活運(yùn)用

運(yùn)營(yíng)專員丨 2016-04-07 | 閱讀量 991

robots在英語(yǔ)之中的意思是機(jī)器人，Robots協(xié)議（也稱為爬蟲協(xié)議、機(jī)器人協(xié)議等）全稱是“網(wǎng)絡(luò)爬蟲排除標(biāo)準(zhǔn)”（Robots Exclusion Protocol），網(wǎng)站通過Robots協(xié)議告訴搜索引擎哪些頁(yè)面可以抓取，哪些頁(yè)面不能抓取。Robots協(xié)議的本質(zhì)是網(wǎng)站和搜索引擎爬蟲的溝通方式，用來指導(dǎo)搜索引擎更好地抓取網(wǎng)站內(nèi)容，而不是作為搜索引擎之間互相限制和不正當(dāng)競(jìng)爭(zhēng)的工具。

當(dāng)搜索引擎在訪問一個(gè)站點(diǎn)時(shí)，首先檢索的將是該站點(diǎn)根目錄下面的robots.txt文件（如果沒有我們可以建立一個(gè)空白的文本文檔，命名為robots.txt放在網(wǎng)站的根目錄下即可?。绻宋募嬖?，那么搜索引擎將率先訪問并識(shí)別此文件的規(guī)則，它會(huì)按照此文件里面的規(guī)則進(jìn)行爬取！下面詳細(xì)敘述一下相關(guān)語(yǔ)法：

1、允許所有搜索引擎訪問網(wǎng)站的所有部分：

User-agent：*

Disallow：

2、禁止所有搜索引擎訪問網(wǎng)站的所有部分:

User-agent：*

Disallow：/

3、如果不需要某一個(gè)搜索引擎抓取的話，比如百度，禁止百度索引我們的網(wǎng)站

User-agent：Baiduspider

Disallow：/

注：如果我們需要禁止Google索引我們的網(wǎng)站，就把User-agent：蜘蛛名字改成谷歌的Googlebot即可！

4、如果我們禁止除Google外的一切搜索引擎索引我們的網(wǎng)站

User-agent：Googlebot

Disallow：

User-agent：*

Disallow：/

5、如果我們需要禁止蜘蛛訪問某一個(gè)目錄，比如禁止login、newtravel等目錄被索引

User-agent：*

Disallow：/login/

Disallow：/newtravel/

6、如果我們?cè)试S蜘蛛訪問網(wǎng)站某個(gè)目錄中的某些特定網(wǎng)址

User-agent：*

Allow：/login/my

Allow：/newtravel/html

Disallow：/login/

Disallow：/newtravel/

7、很多網(wǎng)站的robots.txt里的Disallow或者Allow里面會(huì)有很多的符號(hào)，比如星號(hào)、問號(hào)什么的，如果使用“*”號(hào)，主要是限制訪問某個(gè)后綴的域名，比如禁止訪問/html/ 目錄下的所有以“.htm”為后綴的URL（包含子目錄）

User-agent：*

Disallow：/html/*.htm

8、使用“$”符號(hào)是僅允許訪問某目錄下某個(gè)后綴的文件

User-agent：*

Allow：.asp$

Disallow：/

9、如果是禁止搜索引擎索引網(wǎng)站中所用動(dòng)態(tài)的頁(yè)面（這里演示的是以“?”號(hào)為域名，例如：index.asp?id=1）

User-agent:*

Disallow：/*?*

10、為了節(jié)省服務(wù)器資源，需要禁止各類蜘蛛來索引網(wǎng)站的圖片，除了使用常見的 “Disallow:/images/”這樣直接屏蔽圖片文件夾的方式以外，還可以采取直接屏蔽圖片后綴名的方式。如果我們禁止百度搜索引擎索引我們網(wǎng)站的圖片：

User-agent：Baiduspider

Disallow：.jpg$

Disallow：.jpeg$

Disallow：.gif$

Disallow：.png$

11、僅允許百度抓取網(wǎng)站上的“JPG”格式的文件

User-agent:baiduspider

Allow：.jpg$

Disallow:jpeg$

Disallow:gif$

Disallow:png$

12、僅僅禁止百度抓取網(wǎng)站上的“JPG”格式的文件

User-agent：Baiduspider

Disallow：.jpg$

更多詳細(xì)幫助，參考閱讀

robots 360百科

相關(guān)閱讀

贊 2

有一點(diǎn)幫助 0

沒有幫助

參與評(píng)論

積分獲取更多

會(huì)員注冊(cè) +50立即注冊(cè)
CMS授權(quán) +490立即前往
參與投票 +20立即前往
文章評(píng)論 +10立即前往

思途CMS系統(tǒng)更新動(dòng)態(tài)

大家都在看

產(chǎn)品更新免費(fèi)應(yīng)用上新 | 模塊化店鋪裝修功能發(fā)布，3分鐘打造你的DIY首頁(yè)
產(chǎn)品更新功能上新 | 保險(xiǎn)應(yīng)用
產(chǎn)品更新功能上新 | 多景區(qū)語(yǔ)音導(dǎo)覽
產(chǎn)品更新優(yōu)惠券包產(chǎn)品介紹
產(chǎn)品更新思途Deepeek AI售后助手——解鎖一站式智能售后服務(wù)體驗(yàn)
產(chǎn)品更新城市站點(diǎn)：旅游企業(yè)精準(zhǔn)營(yíng)銷的致勝法寶

掃一掃官方微信號(hào)

提點(diǎn)意見當(dāng)前用戶：游客

他們說...

掃一掃官方微信號(hào)

提點(diǎn)意見 當(dāng)前用戶：游客

他們說...

掃一掃官方微信號(hào)

提點(diǎn)意見當(dāng)前用戶：游客