https://search.jd.com/Search?keyword=python&enc=utf-8&wq=python&pvid=n3q5xkti.kfezph
这是我要爬的京东python书籍的链接
开始设置要爬的节点,图片的src,价格text,书名text
爬出的结果是:证明我第一步没错
<?xml version="1.0" encoding="UTF-8"?>
<python书籍>
<item>
<图片>//img13.360buyimg.com/n1/s200x200_g16/M00/06/0C/rBEbRlN0ePIIAAAAAATT-qwU0sgAABPxwGZPeAABNQS784.jpg</图片>
<价格> </价格>
<书名>Python</书名>
</item>
</python书籍>
然后设置样本复制,为了拿到和上述一样的本页全部数据,如图
刚刚设置了一下,自己的节点没写对,价格和书名没有设置一个层级
重新梳理一下包容关系就ok了,写出来避免和我一样的小白出现同样的错误
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|
|
|
|
共 1 个关于本帖的回复 最后回复于 2016-9-27 14:58