本帖最后由 旺德饺子 于 2017-4-9 21:08 编辑

求大神帮我看看,我从教程里一步步照搬学的,不过用在汽车之家不知道为何不行了,每次跑数据只爬了一层,而且数据不知道存储到哪了,我点选了"存储路径"到桌面上,也没有显示,先感谢大神帮忙了。

11.png (42.13 KB, 下载次数: 659)

1

1

22.png (39.9 KB, 下载次数: 636)

2

2

33.png (27.95 KB, 下载次数: 699)

3

3

44.png (44.33 KB, 下载次数: 620)

44.png
举报 使用道具
| 回复

共 20 个关于本帖的回复 最后回复于 2017-4-10 15:54

沙发
maomao 论坛元老 发表于 2017-4-9 21:51:30 | 只看该作者
数据不能存到桌面上,没有写权限
举报 使用道具
板凳
maomao 论坛元老 发表于 2017-4-9 21:52:37 | 只看该作者
主题名是什么?
举报 使用道具
地板
旺德饺子 初级会员 发表于 2017-4-9 22:03:20 | 只看该作者
maomao 发表于 2017-4-9 21:51
数据不能存到桌面上,没有写权限

谢谢您的回复,主题名是 绅宝x3511
举报 使用道具
5#
maomao 论坛元老 发表于 2017-4-9 22:10:37 | 只看该作者
旺德饺子 发表于 2017-4-9 22:03
谢谢您的回复,主题名是 绅宝x3511

如果是为了翻页的话,目标主题名不应该变化,根据你的截图看,目标主题名变了
举报 使用道具
6#
旺德饺子 初级会员 发表于 2017-4-10 10:19:10 | 只看该作者
maomao 发表于 2017-4-9 22:10
如果是为了翻页的话,目标主题名不应该变化,根据你的截图看,目标主题名变了
...


我做了两次,都无法翻页。从爬虫路径上说,这里面的问题到底是啥啊,求大神看看
举报 使用道具
7#
旺德饺子 初级会员 发表于 2017-4-10 11:00:51 | 只看该作者
我用相同的方法爬取天猫上的评论是没有问题的,但是到了汽车之家就会显示“匹配失效”,请问这是为啥呢?
举报 使用道具
8#
quyixuan 金牌会员 发表于 2017-4-10 11:04:31 | 只看该作者
旺德饺子 发表于 2017-4-10 11:00
我用相同的方法爬取天猫上的评论是没有问题的,但是到了汽车之家就会显示“匹配失效”,请问这是为啥呢? ...

匹配失败就是网页结构不同,规则不适用

举报 使用道具
9#
旺德饺子 初级会员 发表于 2017-4-10 11:11:09 | 只看该作者
quyixuan 发表于 2017-4-10 11:04
匹配失败就是网页结构不同,规则不适用


那么该如何处理呢?该用什么法子来爬取汽车之家的口碑页面?求帮助,感谢!!
举报 使用道具
10#
旺德饺子 初级会员 发表于 2017-4-10 11:14:21 | 只看该作者

请问这个规则是否不适用爬取汽车之家的?请大神帮忙,小弟感激不尽
——————————————
<?xml version="1.0" encoding="UTF-8"?>
<spider-clue-extraction>
<theme>汽车之家博越口碑</theme>
<scope>
<from>HTML</from>
<path-type>a</path-type>
<path>
//*[@class='page']//a[.//text()="下一页"]

</path>
<clue-type>inthread</clue-type>
<target-theme>
<name>汽车之家博越口碑</name>
<prefix-position>hostname+pathname</prefix-position>
</target-theme>
</scope>
undefined
</spider-clue-extraction>
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-3 21:17