抓取途家网的图片，为什么出现异常

gooseeker_info

出现这个：“为整理箱生成结果时发生异常”，我都是按照教程做的，不知道什么原因

Fuller · 发表于 2016-10-13 15:53:30

我测试了，确实好怪异，仔细看了一下生成的XSLT抓取规则，发现网页上有个不合规范的@id=''tujia''，自身带了一个单引号，造成抓取规则失效。生成抓取规则时要避开这个@id，点击“定位”按钮，调成“偏好class”就避开它了。

看抓取规则的方法是
1）点击“测试”按钮
2）在输出窗口中选择“数据规则”页签，就能看到抓取规则
可以看到这么一行

<xsl:apply-templates select="//*[@id=''tujia'']/div[position()=4]/div[position()=1]/div[position()=2]/div[position()=1]/div/div[position()>=1 and count(.//*[@class='item']/img/@src)>0]" mode="列表"/>

复制代码

请注意看环绕tujia的引号，不是双引号，而是两个单引号，这样就破坏了这条XSLT语句，所以，这个@id要避开

抓取途家网的图片，为什么出现异常

本帖子中包含更多资源

共 1 个关于本帖的回复最后回复于 2016-10-13 15:53

本帖子中包含更多资源

推荐板块

精彩推荐

热门话题

热门用户

	B Color Image Link Quote Code Smilies 高级模式您需要登录后才可以回帖登录 \| 立即注册回帖并转播回帖后跳转到最后一页

抓取途家网的图片，为什么出现异常

本帖子中包含更多资源

共 1 个关于本帖的回复 最后回复于 2016-10-13 15:53

本帖子中包含更多资源

推荐板块

精彩推荐

热门话题

热门用户

共 1 个关于本帖的回复最后回复于 2016-10-13 15:53