本帖最后由 潇潇莫离 于 2015-10-29 13:54 编辑

今天看文档教程,尝试做了天猫的数据抓取,成功了。然后去京东,试了试,一直不成功。因为期间抓取的数据只是第一个数据,后面的一直抓取不了。
当时的思路,也是,在京东主页直接搜索的手机,然后看到的主页显示
C:\Users\GodLoveQingyun\Desktop\QQ截图20151029133439
把链接复制到MS谋数台后,看到的是这个样子
C:\Users\GodLoveQingyun\Desktop\QQ截图20151029133604
大家仔细看可以发现,搜索的结果变了,就是这有问题,具体什么问题我不知道,反正因为这个我一上午都没有把整个页面的数据抓取出来,只是第一个数据可行。

后来,尝试在京东主页按照 全部商品分来-手机,数码,京东通信-手机,点进来,再复制手机页面的链接,粘贴过去,就好用了,就是这么搞。

为了验证具体原因,我分别尝试了输入,相机,网页显示和MS谋数台的显示不同,只是结果可以抓取
通过主页链接进去,MS谋数台的页面显示和网页一样,结果正常抓取。
由于实验的次数太少,还无法完全确定是否是这一原因,有待验证。

QQ截图20151029133604.png (293.54 KB, 下载次数: 661)

QQ截图20151029133604.png

QQ截图20151029133439.png (243.02 KB, 下载次数: 652)

QQ截图20151029133439.png
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2015-10-30 12:32

沙发
ym 版主 发表于 2015-10-29 14:46:29 | 只看该作者
我的MS谋数台与浏览器显示的都是一致的,没遇到过你这种问题啊
举报 使用道具
板凳
流年似水 中级会员 发表于 2015-10-30 12:32:51 | 只看该作者
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-26 17:56