主题:银行2


翻页的标记  和相对  我都试过都会报错
举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2017-1-5 11:48

沙发
xandy 论坛元老 发表于 2017-1-4 11:35:29 | 只看该作者
解决方式1:
该页面不同页码的网址不同,可以不用做翻页,通过线索的形式添加就行了,比如第一页和第二页的网址分别是
  1. http://www.yhwdt.com/4-110000-110101-1/
复制代码
  1. http://www.yhwdt.com/4-110000-110101-2/
复制代码
参看:《如何管理规则的线索》
举报 使用道具
板凳
xandy 论坛元老 发表于 2017-1-4 11:40:17 | 只看该作者
解决方式2:
正常做翻页,注意:“下一页”是IMG,所以做记号线索的时候,不要勾选“文本记号”,将IMG的@src映射给记号值,目标主题名是自身。参看教程:《设置翻页采集
测试翻页成功,如下:
举报 使用道具
地板
zhuohui1987 金牌会员 发表于 2017-1-5 09:57:19 | 只看该作者
主题:银行3  老是报错误帮我诊断一下
举报 使用道具
5#
wangyong 版主 发表于 2017-1-5 10:03:05 | 只看该作者
zhuohui1987 发表于 2017-1-5 09:57
主题:银行3  老是报错误帮我诊断一下


测试结果没问题,是添加线索后,抓其他网址时候报错?

举报 使用道具
6#
zhuohui1987 金牌会员 发表于 2017-1-5 11:19:57 | 只看该作者
主题:银行2   解决方式1:页码1获取不到会报错,是网址是js空的啊,假如我用解决方式1也要把全国地址获取,在进行添加通过线索的形式添加才行
举报 使用道具
7#
AnswerDSL 版主 发表于 2017-1-5 11:48:27 | 只看该作者
主题:银行2  规则:映射银行的链接,把href抓取下来,然后勾选下级线索
主题:银行3  规则:抓取详情内容即可
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 04:08