主题名:食药局-爬
我需要抓取二级域名,但是在访问的时候二级域名连接抓取不到。
用Xpath这个怎么抓取?求教

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2019-5-18 16:19

沙发
HITB123 新手上路 发表于 2019-5-18 12:29:58 | 只看该作者
爬到网址了呀,为什么说没抓到?
举报 使用道具
板凳
happy1314gao 初级会员 发表于 2019-5-18 13:10:00 | 只看该作者
网址用不了,访问不上二级连接
举报 使用道具
地板
HITB123 新手上路 发表于 2019-5-18 13:59:40 | 只看该作者
happy1314gao 发表于 2019-5-18 13:10
网址用不了,访问不上二级连接

测试爬到的网址,有转意字符,用打数机爬了后,再看看爬到的链接
举报 使用道具
5#
Fuller 管理员 发表于 2019-5-18 16:19:43 | 只看该作者

这样得到的网址是没有用的。要在公司名位置上做连续点击动作,点击以后会弹出一个新的窗口,所以,在第一级定义点击动作的时候要勾上飞掠模式,购买旗舰版才有飞掠模式。具体可以参看《追踪弹窗采集数据

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • UMAP的n_neighbors参数有什么作用?
  • HDBSCAN的min_samples和min_cluster_size参
  • 为什么BERTopic话题缩减后特征词出现大量没
  • GooSeeker分词扩展模块的安装方法
  • BERTopic做主题合并以后为什么得到的实际主

热门用户

GMT+8, 2026-6-17 20:51