一个列表有4个列表页,点击下一页,1-4都可以正常采集,采集到第四页,然后点击就会回到第1页,然后就这样不断的进行循环采集。这样的问题怎么解决?
“下一页” 里面的ID 和名称没有任何变化。
关键不是只有一个列表页  还有其他的栏目的列表页,这样可以方便的采集。
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2017-2-23 17:45

沙发
coentene 初级会员 发表于 2017-2-23 17:44:33 | 只看该作者
第三页的
<div class="kown_page">
<a href="http://www.*.com/list-918.html">1</a>  
<a href="http://www.*.com/list-918-2.html">2</a>  
<strong>3</strong>  
<a href="http://www.*.com/list-918-4.html">4</a>  
<a href="http://www.*.com/list-918-4.html">下一页</a>
<input type="hidden" id="destoon_next" value="http://www.*.com/list-918-4.html"/>


第四页
<div class="kown_page">
<a href="http://www.*.com/list-918.html">1</a>  
<a href="http://www.*.com/list-918-2.html">2</a>  
<a href="http://www.*.com/list-918-3.html">3</a>  
<strong>4</strong>
<a href="http://www.*.com/list-918.html">下一页</a>
<input type="hidden" id="destoon_next" value="http://www.*.com/list-918.html"/>

就是这样的代码最后一页的下一页会直接跳到第一页   就是这样无限循环的
举报 使用道具
板凳
ym 版主 发表于 2017-2-23 17:44:41 | 只看该作者
改为用相对线索试试,就不用点击“下一页”这个按钮,而是直接点击1,2,...的页码,参考教程《解决只有数字页码的翻页:相对线索》
举报 使用道具
地板
coentene 初级会员 发表于 2017-2-23 17:45:54 | 只看该作者
嗯,好
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 10:05