目录
- 快捷采集
- 初级教程(新版)
- 初级教程(老版)
- 数据转Excel处理
- 爬虫规则管理
- 高级教程(新版)
- 高级教程(老版)
- 用爬虫群分布式高效采集
- 爬虫关键知识拓展
- 问题集锦
- 实战演练案例
- 爬虫安装说明
- 关于集搜客
集搜客交流群
2000人群:点击加入
onclick抓取
本帖最后由 liulei03 于 2018-12-10 15:04 编辑 [/i] 当要爬取的详情页是在列表页通过点击onclick
onclick是什么意思
我看到网页上的超链接位置上是onclick,没有网址,onclick是什么意思?是否能深入采集详情网页数据?
翻页和层级(onclick)抓取
[i=s] 本帖最后由 mingliaoren1 于 2018-10-28 08:40 编辑 [/i] 求大神指点: 要采集很多页的列表内容(主题:找错01),同时还要采集每条记录里面的详细记录(主题:找错02)。 目前,能正常翻页采集列表字段内容,但一添加“连续动作—点击“,打数机就只能采集到第一页的列表内容。 规则放在这了: https://www.gooseeker.com/secure/me/mingliaoren1_preview.html 有点急,求指点。谢谢!:loveliness:
onclick网址链接获取问题
www.p2p178.com/invest/invest/list[/url] 页面表格中每项信息的下一层链接都写在onclicksubstring-before(substring-after(//*[@id='ulInvestList']/li[position()=1]/@onclick
Python 爬虫如何获取onclick(非url链接)之后网页?
Python 爬虫如何获取onclick里面内容,不需要用selenium 模拟点击,而是直接获得哦你click返回参数?The_Ivy_Inn_Restaurant-Charlottesville_Virginia.html#or5" class="nav next rndBtn ui_button primary taLnk" onclick
每项信息的下一层链接都写在onclick()里面
页面每项信息的下一层链接都写在onclick()里面,请问怎么获取网址
怎么抓取模拟点击脚本的onclick之后的数据
网址献上:http://bj.58.com/ershoufang/30568455333314x.shtml
请问怎么抓取属性中只有onclick,没有href的网址?
[attach]1958[/attach] 像图上面所示,属性里面只有onclick,没有href属性,怎么抓内层网址下来
图片url地址不是href,而是JavaScript或者onClick,能从采集吗?
每个图片是没有独立的url地址的,而是做了动作以后才显示的,集搜客网络爬虫能采集吗?
要层级采集,但是层级是用onclick实现的,集搜客能采集吗?
doc/article-343-1.html]采网址做层级采集——以大众点评为例[/url]》,但是我要采集的网页上,链接是onclick
分层中,在一级页面中点击“查看”按钮想获取二级页面的内容,但“查看”按钮是onclick事件,该如何抓取下一级页面?
分层中,在一级页面中点击“查看”按钮想获取二级页面的内容,但“查看”按钮是onclick事件,该如何抓取下一级页面?
xpath构造网址与附件下载问题
publish.stdno=&publish.name=&pageIndex=1[/url]由于需要下载附件,用@onclick构造网址 @onclick有两种值 prompt('作废') todownload('/standard/pdf/DB41_T 148-2000.pdf') 于是我根据onclick利用xpath构造网址 concat('http:////*[@class='preview']/@onclick,"'"),' '),'%20',substring-before//*[@class='preview']/@onclick,' '),"'")) 构造成两种网址
xpath构造网址与附件下载问题
.com/publish/index. ... h.name=&pageIndex=1[/url]由于需要下载附件,用@onclick构造网址 @onclick有两种值 prompt('作废') todownload('/standard/pdf/DB41_T 148-2000.pdf') 于是我根据onclick利用xpath构造网址 concat('http:////*[@class='preview']/@onclick,"'"),' '),'%20',substring-before//*[@class='preview']/@onclick,' '),"'")) 构造成两种网址 todownload
做了两级规则,运行了第一级,但是第二级不抓取
是onclick的
怎么自定义xpath拼接网址?
节点存储的不是网址 [attach]8143[/attach] [attach]8142[/attach] 网址后面的是@onclick