ym 发表于 2016-12-29 14:08
你的第二级规则和第三级规则可以合并到一个规则里,因为不用点击“更多信息”,就可以抓里面的“详情”链接 ...
ym 发表于 2016-12-29 14:08
你的第二级规则和第三级规则可以合并到一个规则里,因为不用点击“更多信息”,就可以抓里面的“详情”链接 ...
ym 发表于 2016-12-29 15:12
直接抓,你直接在第二级规则的样本页面,找到“详情”对应的网页节点映射到整理箱的新标签里就行
...
ym 发表于 2016-12-29 15:12
直接抓,你直接在第二级规则的样本页面,找到“详情”对应的网页节点映射到整理箱的新标签里就行
...
ym 发表于 2016-12-29 16:02
要选内容定位和专用定位,还有在定位标志表达式里填上点,另外建议对详情链接这些隐藏的信息做上定位标志映 ...
ym 发表于 2016-12-29 16:36
//*[contains(.,'营业时间')]/following-sibling::span
你还要把规则里的连续动作删掉,第三级都没有用了 ...
meicairen 发表于 2016-12-29 17:22
营业时间,我测试成功了。能帮我解释下,你这个xpath公式分为几个部分,分别是什么含义吗?我想其他字段 ...
meicairen 发表于 2016-12-29 17:22
营业时间,我测试成功了。能帮我解释下,你这个xpath公式分为几个部分,分别是什么含义吗?我想其他字段 ...
欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) | Powered by Discuz! X3.2 |