本帖最后由 潇潇莫离 于 2015-10-29 13:54 编辑

今天看文档教程,尝试做了天猫的数据抓取,成功了。然后去京东,试了试,一直不成功。因为期间抓取的数据只是第一个数据,后面的一直抓取不了。
当时的思路,也是,在京东主页直接搜索的手机,然后看到的主页显示
C:\Users\GodLoveQingyun\Desktop\QQ截图20151029133439
把链接复制到MS谋数台后,看到的是这个样子
C:\Users\GodLoveQingyun\Desktop\QQ截图20151029133604
大家仔细看可以发现,搜索的结果变了,就是这有问题,具体什么问题我不知道,反正因为这个我一上午都没有把整个页面的数据抓取出来,只是第一个数据可行。

后来,尝试在京东主页按照 全部商品分来-手机,数码,京东通信-手机,点进来,再复制手机页面的链接,粘贴过去,就好用了,就是这么搞。

为了验证具体原因,我分别尝试了输入,相机,网页显示和MS谋数台的显示不同,只是结果可以抓取
通过主页链接进去,MS谋数台的页面显示和网页一样,结果正常抓取。
由于实验的次数太少,还无法完全确定是否是这一原因,有待验证。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2015-10-30 12:32

沙发
ym 版主 发表于 2015-10-29 14:46:29 | 只看该作者
我的MS谋数台与浏览器显示的都是一致的,没遇到过你这种问题啊
举报 使用道具
板凳
流年似水 中级会员 发表于 2015-10-30 12:32:51 | 只看该作者
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的
  • 下载支持win7的集搜客网络爬虫软件
  • 遇到“无法识别的应用”告警怎么办?

热门用户

GMT+8, 2024-9-8 10:21