最近接入了又拍云CDN,在之前一直是使用他的存储功能,并没有想太多,今发了一篇抓取频次的文章,顺便也去抓取下看看结果,结果令我吃惊 😯
分别抓取了一下首页与最新文章,两个不同的IP,均不是源站IP
:twisted:这个问题也不是那么严重,资讯了他们技术,看来不是我一个人反馈该问题,目前又拍云声称正在计划中或在实施计划中
搜索引擎不能回源的影响:
如果爬虫抓取到了多个IP甚至几百个IP,那么会认为你的网站是镜像网站,会被大批量大幅度的进行K站行为,这一行为在百度比较严格,百度比较打击镜像网站与盗版网站还有采集网站类,起初明显的是收录慢,索引持续不涨或往下掉,平时能够秒收录,到后来不能秒收录了。
一个长久不换的IP对于网站来说,能让爬虫习惯抓取,认为这个IP就是网站的家,哪也不去,换了IP后等于换了主人不认人了。
但愿又拍云能够尽快完成该项任务,否则对于百度这样的搜索引擎来说,网站收录影响是比较大的。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
- 最新
- 最热
查看全部