11#
bowieD 金牌会员 发表于 2017-9-8 10:24:23 | 只看该作者
点开【展开全部口碑】,再点击测试可以看到抓取的内容,我运行你的规则是可以抓取到点开之后的内容,只是内容不全

424.jpg (340.31 KB, 下载次数: 408)

424.jpg
举报 使用道具
12#
Automobile86 中级会员 发表于 2017-9-8 10:40:11 | 只看该作者
bowieD 发表于 2017-9-8 10:24
点开【展开全部口碑】,再点击测试可以看到抓取的内容,我运行你的规则是可以抓取到点开之后的内容,只是内 ...

嗯嗯。感谢指点。我用Python试试看吧。


举报 使用道具
13#
Automobile86 中级会员 发表于 2017-9-8 10:55:56 | 只看该作者
bowieD 发表于 2017-9-8 10:24
点开【展开全部口碑】,再点击测试可以看到抓取的内容,我运行你的规则是可以抓取到点开之后的内容,只是内 ...

如果集搜客基于IE内核开发,应该可以抓取全部内容吧?
举报 使用道具
14#
bowieD 金牌会员 发表于 2017-9-8 11:18:12 | 只看该作者
所有的网站都可以抓取全部内容,只是对于某些专门做了反扒升级的网站,需要更高级的版本。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-18 12:55