最后登录 1970-1-1
最后登录 2024-4-20
Fuller 发表于 2018-12-22 12:23 请作这些检查: 1,连续动作的目标主题名填写以后,一定要为这个主题定义一个规则 2,抓取内容的整理箱中有 ...
saly123 发表于 2018-12-24 10:36 你说的那三点我都检查了一下 1.连续动作目标主题已经定义规则 2. 将所有的抓取内容都设为了关键内容
Fuller 发表于 2018-12-24 11:47 你是想抓取京东评论,但是你的网址是详情页,其实有点差别,要爬虫自动滚屏,滚动到评论那里才有内容显示 ...
saly123 发表于 2018-12-24 16:02 但是评论的前95页的内容按照我的那个规则都是可以抓下来的,从第96页开始就抓不下来了,显示FIN,这是为 ...
Fuller 发表于 2018-12-24 16:32 DS打数机窗口下边沿中部,按住往上拉,就能打开日志窗口,看看里面有没有错误提示? 如果没有下一页了, ...
saly123 发表于 2018-12-24 20:18 我手动的查看网页的时候发现96页往后也是有内容的,而且评论都是不一样的,但是日志里面显示出现重复内容 ...
Fuller 发表于 2018-12-24 20:50 看起来是爬虫点击以后,网页内容没有刷新,就判断为重复内容了。 需要观察爬虫运行过程,到了96页时,观 ...
saly123 发表于 2018-12-24 21:04 我看了,DS打数机在从第95页转到第96页的时候,确实是跳转到了第96页的内容,但是没有停留太长的时间,一 ...
发表回复 回帖并转播 回帖后跳转到最后一页
GMT+8, 2024-4-20 19:57
共 14 个关于本帖的回复 最后回复于 2018-12-25 20:59