提示: 作者被禁止或删除 内容自动屏蔽
举报 使用道具
| 回复

共 12 个关于本帖的回复 最后回复于 2021-11-2 14:17

沙发
gz51837844 管理员 发表于 2021-11-2 09:15:56 | 只看该作者
我们上午安排技术测试下你的任务
举报 使用道具
板凳
Fuller 管理员 发表于 2021-11-2 09:21:13 | 只看该作者
要在第二级所用的样本页面上定义输入动作。不然的话,输入完第一个关键词以后,网页就变成第二级那样的页面了,再想输入第二个关键词,就定位不到输入位置了
举报 使用道具
地板
z417566919 禁止发言 发表于 2021-11-2 09:29:48 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
举报 使用道具
5#
gz51837844 管理员 发表于 2021-11-2 09:56:22 | 只看该作者
z417566919 发表于 2021-11-2 09:29
麻烦再看一下“油气储运详情页面数据抓取”这个采集任务,设置周期采集后,并没有执行,是设置有问题么? ...

你看一下这个任务有没有“待抓取”状态的网址?
举报 使用道具
6#
z417566919 禁止发言 发表于 2021-11-2 10:12:40 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
举报 使用道具
7#
gz51837844 管理员 发表于 2021-11-2 10:20:14 | 只看该作者
z417566919 发表于 2021-11-2 10:12
有啊,可定是有的

调度里的那个定时时间设定,是指到时间后激活网址。 如果本身已经有“待抓取”网址并且开启了调度,只要你打开爬虫群窗口(用爬虫群采集数据),就会自动抓取。

举报 使用道具
8#
z417566919 禁止发言 发表于 2021-11-2 10:46:11 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
举报 使用道具
9#
gz51837844 管理员 发表于 2021-11-2 10:57:39 | 只看该作者
z417566919 发表于 2021-11-2 10:46
我设置完之后,还要点击“启动爬虫群”?这样的话,不就是立刻执行抓取了么?也不是按照我设置的时间自动 ...

举例来说:
你的任务A, 有网址100条, 状态是”已采集“
现在时间是10:53
如果你现在设置调度, 定时在今天”12:45”抓取, 然后启动爬虫群窗口。
1. 从现在到12:45 , 由于没有网址是”待采集“状态, 没有实际的爬取动作
2. 到了12:45, 100条网址状态会变成”待采集“, 爬虫群窗口开始爬取
举报 使用道具
10#
z417566919 禁止发言 发表于 2021-11-2 11:55:03 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-11-22 03:11