样本页面:http://navi.cnki.net/knavi/journ ... TQ1OTNWK21lOUZFRT0=$9A4hF_YAuvQ5obgVAqNKPCYcEjKensW4ggI8Fm4gTkoUKaID8j8gFw!!
针对于这样的页面,我的想法是:既然集搜客的动作能够实现自动循环的编排,那么是否做三级规则就够了呢? 1、点击栏目浏览 分别点击各栏目 2、抓取链接线索 3、抓取文章详情
目前我用了两个点击步骤 分别点击 【栏目浏览】和【依次点击不同栏目】然后 意图分栏目的 抓取 篇名 作者等 信息 ,在确认两个动作的xpath均能够对应到目标点击位置后,打数机依然只能够实现点击栏目浏览 。
请各位技术大神指点,应该如何解决该问题?
|
|
|
|
|
共 5 个关于本帖的回复 最后回复于 2016-8-5 21:07