14 34511

采集多层级网页数据

ym 于 2015-10-23 09:47 发表 [复制链接]
wuyouu 新手上路 发表于 2018-6-14 01:04:04 | 显示全部楼层
抓取不到第二级别网页链接
没有找到@href
可以帮忙看看问题出在哪里么
https://www.cargurus.com/Cars/inventorylisting/viewDetailsFilterViewInventoryListing.action?sourceContext=&newSearchFromOverviewPage=true&inventorySearchWidgetType=AUTO&entitySelectingHelper.selectedEntity=c23512&entitySelectingHelper.selectedEntity2=c23970&zip=45203&distance=50000&searchChanged=true&modelChanged=false&filtersModified=true#resultsPage=1
以上是网站网站 要
2018-06-13 (1).png


2018-06-13.png
举报 使用道具
汽车论坛 中级会员 发表于 2018-6-14 09:10:35 | 显示全部楼层
wuyouu 发表于 2018-6-14 01:04
抓取不到第二级别网页链接
没有找到@href
可以帮忙看看问题出在哪里么

这个网站的下级页面没有@href,如果要采集下级链接需要用到连续动作的点击和回退,回退是旗舰版以上才有的功能
举报 使用道具
wuyouu 新手上路 发表于 2018-6-14 10:37:55 | 显示全部楼层
汽车论坛 发表于 2018-6-14 09:10
这个网站的下级页面没有@href,如果要采集下级链接需要用到连续动作的点击和回退,回退是旗舰版以上才有 ...

不大明白
举报 使用道具
Tillery 新手上路 发表于 2018-7-19 19:32:40 | 显示全部楼层
第一层级是豆瓣中国女性电影,第二层级是电影详细信息,第三层级是导演信息。链接都设置好了,第二层级采集信息一百多条,可是第三层只有一条,不知道是怎么回事?
举报 使用道具
Fuller 管理员 发表于 2018-7-19 19:51:58 | 显示全部楼层
Tillery 发表于 2018-7-19 19:32
第一层级是豆瓣中国女性电影,第二层级是电影详细信息,第三层级是导演信息。链接都设置好了,第二层级采集 ...

在专门讨论你的问题的帖子中讨论吧:https://www.gooseeker.com/doc/thread-11394-1-1.html
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 19:04