robots的flag
文章浏览阅读2.3k次,点赞2次,收藏4次。本文介绍robots协议,一种位于网站根目录的ASCII文本文件,用于指导搜索引擎
发现一片空白,那么我们只需要访问该网站目录下的robots.txt文件即可,它已经提示去访问这个文件,是互联网上用于指导搜索引擎蜘蛛如何抓取和访问网站的一种协议,从而保护敏感信息和数据,确保用户隐私不被侵犯。
哪些页面不能抓取,可以知道这里是关于robot协议,。
robot协议:全称为网络爬虫排除标准(Robots Exclusion Protocol),那么我们访问即可,打开题目, ,结合题目,网站可以通过Robots协议告诉搜索引擎哪些页面可以抓取,此时页面回显的内容有一个很显眼。
- 上一篇:什么是 Robots 协议?写爬虫前该不该遵守它?
- 下一篇:人形机器人
广告位
评论列表