本帖最后由 潇潇莫离 于 2015-10-29 13:54 编辑

今天看文档教程,尝试做了天猫的数据抓取,成功了。然后去京东,试了试,一直不成功。因为期间抓取的数据只是第一个数据,后面的一直抓取不了。
当时的思路,也是,在京东主页直接搜索的手机,然后看到的主页显示
C:\Users\GodLoveQingyun\Desktop\QQ截图20151029133439
把链接复制到MS谋数台后,看到的是这个样子
C:\Users\GodLoveQingyun\Desktop\QQ截图20151029133604
大家仔细看可以发现,搜索的结果变了,就是这有问题,具体什么问题我不知道,反正因为这个我一上午都没有把整个页面的数据抓取出来,只是第一个数据可行。

后来,尝试在京东主页按照 全部商品分来-手机,数码,京东通信-手机,点进来,再复制手机页面的链接,粘贴过去,就好用了,就是这么搞。

为了验证具体原因,我分别尝试了输入,相机,网页显示和MS谋数台的显示不同,只是结果可以抓取
通过主页链接进去,MS谋数台的页面显示和网页一样,结果正常抓取。
由于实验的次数太少,还无法完全确定是否是这一原因,有待验证。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2015-10-30 12:32

沙发
ym 版主 发表于 2015-10-29 14:46:29 | 只看该作者
我的MS谋数台与浏览器显示的都是一致的,没遇到过你这种问题啊
举报 使用道具
板凳
流年似水 中级会员 发表于 2015-10-30 12:32:51 | 只看该作者
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文

热门用户

GMT+8, 2024-12-22 14:22