国产成人综合视频-国产成人综合久久-国产成人综合精品-国产成人综合av-日韩一区二区三区在线视频-日韩一区二区三区在线播放

東莞網(wǎng)站優(yōu)化
聯(lián)系電話:0769-33896899      13412461466 宋先生

提高全棲運(yùn)營(yíng)網(wǎng)站的抓取率的方法有哪些

發(fā)布時(shí)間:2018-05-24 17:15    來(lái)源:http://m.yr287.cn/    作者:?jiǎn)⒃葱畔⒖萍?nbsp;   點(diǎn)擊次數(shù):

  對(duì)于搜索引擎而言,爬蟲效率的一個(gè)重要評(píng)價(jià)標(biāo)準(zhǔn)就是爬蟲開(kāi)銷。淺析提高全棲運(yùn)營(yíng)網(wǎng)站的抓取率的方法有哪些?

Dasgupta等人將爬蟲開(kāi)銷定義為:爬蟲開(kāi)銷=重復(fù)抓取的老頁(yè)面數(shù)/發(fā)掘的新頁(yè)面數(shù)。那么,爬蟲的抓取頻率以及效率該如何優(yōu)化呢?下面進(jìn)行具體介紹。

首先,以robots.txt命名的文本文件是個(gè)很強(qiáng)的利器,當(dāng)網(wǎng)站上擁有重復(fù)內(nèi)容、無(wú)內(nèi)容且無(wú)意義頁(yè)面等類似內(nèi)容的時(shí)候,就可以果斷地用robots.txt屏蔽掉。這里需要注意:robots.txt文件可以用通配符書寫,書寫是比較自由的。建議把xml格式的sitemap路徑放在robots.txt文件中,供搜索引擎尋找。

其次,當(dāng)需要合理地、有效率地下載一個(gè)網(wǎng)站時(shí),設(shè)置參數(shù)nofollow,可以讓百度搜索引擎不抓取頁(yè)面上的所有鏈接。在robots.txt文件中添加rel=“noindex”語(yǔ)句,不能阻止百度爬蟲抓取,因?yàn)閚oindex參數(shù)可以讓搜索引擎不把當(dāng)前網(wǎng)頁(yè)置入索引庫(kù),但是頁(yè)面上所有的鏈接,爬蟲都會(huì)去分析。若要屏蔽鏈接,要加上nofollow參數(shù)。

總之,提高爬蟲的抓取效率在SEO之中是一件比較重要的事情,尤其對(duì)于中大型網(wǎng)站而言,應(yīng)該將大部分精力放在讓爬蟲抓取更多更準(zhǔn)的頁(yè)面上,而不是讓它抓到無(wú)意義的頁(yè)面。

 
東莞網(wǎng)站優(yōu)化 東莞網(wǎng)站優(yōu)化 QQ咨詢
東莞網(wǎng)站優(yōu)化 東莞網(wǎng)站優(yōu)化 官方微信
東莞網(wǎng)站優(yōu)化 關(guān)注微信
東莞網(wǎng)站優(yōu)化 東莞網(wǎng)站優(yōu)化 聯(lián)系電話
0769-33896899
東莞網(wǎng)站優(yōu)化 東莞網(wǎng)站優(yōu)化 預(yù)約上門
主站蜘蛛池模板: 电影丑闻| 动漫秀场| 泰国av| 老牛家的战争电视剧全集免费观看| 春天的芭蕾歌词| 美女自尉视频| 七下语文第一单元作文| 哥哥回来了 电影| 我和我的父辈 电影| 老人头olderman中国| 猫电影| 45分钟见奶薄纱透明时装秀| 崛井美月| 我虽软弱了赞美诗歌| 三上悠亚在线免费观看| 轨迹地图| 金装维尔梅| 愚人节快乐的英文| 不扣纽的女孩| ,xx| 爱情买卖网站 电影| 铠甲勇士雷霆雅塔莱斯| 一类生字和二类生字图| 《高校教师》日本电影| 教学质量分析| 谭天谦| 露底| 澳门华侨报| 三级大片在线观看| 汤唯惊艳写真集| 巴霍巴利王3电影免费观看| 你从草原走来| 巴黎最后的探戈| 洪熙官演员表| 宁桓宇个人资料简介| 韩国电影《甜性涩爱》| 那年秋天| 杨颖电影| 志村大爆笑| 天与地越南版| 电视剧《老兵》|