一、  使用下页翻页采集时,翻页区设置好,设置翻页记号时,定位编号有,但是记号值为空,(选择的是“下页”对应的text)

     二、 使用页码采集时,一共有600多页,只采集十几页就停止了。
请问这两个问题怎么解决??
   

举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2018-5-22 11:32

沙发
数据集 高级会员 发表于 2018-5-22 10:27:36 | 只看该作者
规则名是什么?
举报 使用道具
板凳
798596716 初级会员 发表于 2018-5-22 10:28:05 | 只看该作者

宜昌站
举报 使用道具
地板
数据集 高级会员 发表于 2018-5-22 10:46:00 | 只看该作者
本帖最后由 数据集 于 2018-5-22 10:47 编辑

规则没有问题,只采集十几页就停止了,因为这个网站比较卡,翻页很久才能加载出来,所以容易中断,可以用构造网址的方式采集

每一页都有独立的网址,网址PageNo后面的数字代表的就是页数,只需要修改这个数字就可以跳转的那一页。这样的话就可以在Excel中批量生成所有页的网址,然后直接添加到规则里,同时要删掉规则里的翻页设置,就可以单页采集,不用担心采漏某一页或者是翻页中断。




1.png (8.95 KB, 下载次数: 459)

1.png
举报 使用道具
5#
798596716 初级会员 发表于 2018-5-22 10:48:26 | 只看该作者
数据集 发表于 2018-5-22 10:46
规则没有问题,只采集十几页就停止了,因为这个网站比较卡,翻页很久才能加载出来,所以容易中断,可以用构 ...

那,下页采集的问题呢?为何没有text?


举报 使用道具
6#
shengchengx 金牌会员 发表于 2018-5-22 10:55:50 | 只看该作者
798596716 发表于 2018-5-22 10:48
那,下页采集的问题呢?为何没有text?

你不用去做翻页,你删除掉翻页然后自己构造网址,将网址直接在Excel构造好了之后把链接添加到规则1中去就好了
举报 使用道具
7#
798596716 初级会员 发表于 2018-5-22 11:00:27 | 只看该作者
798596716 发表于 2018-5-22 10:48
那,下页采集的问题呢?为何没有text?

好的 ,,谢谢!!

举报 使用道具
8#
798596716 初级会员 发表于 2018-5-22 11:32:09 | 只看该作者
shengchengx 发表于 2018-5-22 10:55
你不用去做翻页,你删除掉翻页然后自己构造网址,将网址直接在Excel构造好了之后把链接添加到规则1中去就 ...

问题已经解决,感谢您
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 10:37