最后登录 1970-1-1
测试输出结果和抓取设置.PNG (183.46 KB, 下载次数: 744)
下载附件
2018-11-7 15:34 上传
测试输出结果数据规则.PNG (189.34 KB, 下载次数: 761)
最后登录 2024-4-19
Fuller 发表于 2018-11-7 16:42 我加载了这个规则,样本页面上没有这些class,你加载的网页不一样吗? 通常抓文章的话,不要分段落抓,段 ...
测试输出结果class.PNG (230.22 KB, 下载次数: 722)
2018-11-7 21:11 上传
dieter_zk 发表于 2018-11-7 21:23 感谢大神超速度的回复!! 是这个网页没错。我截了图,如下图所示,是有这样的class的:
Fuller 发表于 2018-11-8 09:16 这个需要自定义xpath,自动生成xpath是这样使用class的 .//*[@class='xxxxx'],但是可以变成这样 .//*[c ...
测试输出结果xpath.PNG (376.87 KB, 下载次数: 746)
2018-11-8 10:43 上传
dieter_zk 发表于 2018-11-8 10:47 老师,我又重新自定义了xpath, 内容是.//*[contains(@class,'TextParagraph')],但在抓取的时候只能抓到 ...
Fuller 发表于 2018-11-8 11:11 主题名是什么? 上次我加载后发现没有那些class值
dieter_zk 发表于 2018-11-8 11:28 主题名是:新闻抓取测试
内容映射20181108120106.png (196.26 KB, 下载次数: 758)
2018-11-8 12:03 上传
标志20181108120157.png (175.87 KB, 下载次数: 731)
2018-11-8 12:04 上传
测试20181108120253.png (154.31 KB, 下载次数: 717)
2018-11-8 12:06 上传
测试输出结果数据规则修改1.PNG (272.59 KB, 下载次数: 744)
2018-11-8 14:33 上传
测试输出结果数据规则修改2.PNG (370.47 KB, 下载次数: 754)
发表回复 回帖并转播 回帖后跳转到最后一页
GMT+8, 2024-4-20 14:20
共 16 个关于本帖的回复 最后回复于 2018-11-8 19:54