本帖最后由 goGooSeeker 于 2016-9-5 15:13 编辑
我输入的采集线索eg.:
- http://baike.baidu.com/item/词条名
复制代码
如果在普通浏览器会正常跳转到:
- http://baike.baidu.com/item/词条名/ID
复制代码
因为ID是不固定的,但是会自动跳转,所以我输入的线索全部都是:
- http://baike.baidu.com/item/词条名
复制代码
但是在采集的时候,打数器并不会自己跳转采集,一直显示空白,请问这种情况应该怎么办?
PS:为什么知道没有跳转,因为有的词条不需要跳转就可以采集,需要跳转带ID的词条就会显示空白。
PS:为什么不自己输入ID,因为采集数据太多,ID不规律
PS:想到了先采集搜索当中的真实带ID网址,不过还没有测试,但是这种方法会多采集一遍,相当于多用了一倍的时间,如果可以直接跳转就不用多这一步了
|
|
|
|
|
共 7 个关于本帖的回复 最后回复于 2016-9-5 15:12