https://ask.dxy.com/ama/index#/list/section
https://ask.dxy.com/ama/index#/list/section/56?is_purchase_drug=false
https://ask.dxy.com/ama/index#/explore/issue/54676667
这3个网址无法在集搜客的浏览器里打开,我在谷歌浏览器里能顺利打开。
https://ask.dxy.com/ama/index#/find/user/12709633/public-issue
这个网址在谷歌浏览器里是跳转到上面第三个网址的。它在集搜客里能打开,上面的就打不开。

举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2020-4-28 23:31

沙发
ym 版主 发表于 2020-4-27 16:25:15 | 只看该作者
下载集搜客的新版采摘浏览器可以打开,新版爬虫做规则的操作参看《采集京东拍卖上的信息,集搜客爬虫软件怎么用》
举报 使用道具
板凳
Fuller 管理员 发表于 2020-4-28 23:31:53 | 只看该作者
因为科室也不多,可以手工把每个科室的网址找出来,直接采集医生信息。从科室列表到科室详情,并没有静态的网址,要做点击动作,然后还要回退,有些麻烦,不如手工把每个科室详情页采集下来简单。

这个网站要用集搜客采摘浏览器,我测试过,可以采集。今天(2020年4月28日)在qq群里发布了一个最新的测试版本,比网站上的版本新,而且这个版本和配套的最新的集搜客爬虫浏览器一起发布的,配套使用可以提高性能。qq群是:481335253

这个版本很快就能测试好,就会正式发布到本网站上。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-4-22 06:55