目录
集搜客交流群
2000人群:点击加入
爬虫群老是报错啊
每隔一段时间就出现 service is too busy 日志里面失败的很多很多啊 我看了一下规则没问题 也加了定时器 并没有改善 失败的网址是这个 http://guba.eastmoney.com/default_64743.html 麻烦帮我看看吧 我爬个数据遇到各种麻烦 真的很心累
怎样采集携程上要点击才能查看完整的电话号码?
这个要点击一下才能看到完整的号码信息,是要怎样设置才能抓到呢? 样本网页 http://you.ctrip.com/dangdiren/service/30073.html
页面结构的附件不一样怎么处理
规则是:科技政策汇项目详情 我要下载这个附件,每个页面的附件不一样,怎么处理? 我采集的网址你可以参考下这两个网址 http://gopolicy.las.ac.cn/service
集搜客网络爬虫是否会遇到网页上的脚本停止响应?
我用过别的网络爬虫产品,时不时就弹出一个框,说网页上的脚本停止响应:A script on this page may be busy, or it may have stopped
【网易股票数据api】#集搜客GooSeeker数据集开放目录#
,文件为CSV格式 http://quotes.money.163.com/service/chddata.html?code=0601398&start=20000720&end=20150508
不是针对谁 因为我觉得这个想建立规则几乎是不可能的 请大神告诉我你能!!!大声的!!!
话不多说,直接给链接。http://www.yto.net.cn/gw/service/branchsearch.html 目标:获取服务网点的位置信息 难点: 1.点开这个链接之后,需要连续