关闭 More 保存 重做 撤销 预览

   
关闭   当前为简洁模式,您可以更新模块,修改模块属性和数据,要使用完整的拖拽功能,请点击进入高级模式

重播

上一主題 下一主題
»
站群858361387
LV1 初心者
帖子    315
新博币    0 提现
提现    0
     
    828 0 | 显示全部楼层 |倒序浏览
    搜索引擎爬行过程简介

            1、搜索引擎程序是通过网页之间的链接,不分昼夜的爬行来获取信息,收录标准主要由URL的权重、网站规模大小等因素决定;
            2、搜索引擎进入服务器时,第一时间查看robots.txt(控制搜索引擎收录的标准)文件,如果robots.txt文件不存在,则返回404错误代码,但依然会继续爬行,如果定义了某些规则,则遵守索引。
            3、建议必须有一个robot .txt文件(推荐阅读:robots.txt的写法)。
             搜索引擎抓取数据的方式
            1、垂直抓取策略:指搜索引擎顺着一条链接爬行,直到设定的任务完成。
            思路如下:垂直抓取策略—A链接—A网页链接—A网页链接的链接 ,一直垂直抓取到最底。
            2、平行抓取策略:指先把网页山的链接全部抓取一次,然后接着从每条链接牌型。
            总结:在实际应用中,,这两种策略会同时发生,抓取的深度和广度取决于页面的权重、结构和网站规模大小以及新鲜内容数量和频率,当然这里面包含了很多的seo的策略。
    个人签名

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    快速回复 返回顶部 返回列表