本帖最后由 18829303412 于 2018-6-26 13:56 编辑

有没有大手子做过国家食品药品监督总局的药品信息的抓取,他那地方的混淆怎么解决的
4ULC2S$~83RCB]I@4ZMP340.png
[O5CD1I8A_~WWOT0NMU)$67.png
举报 使用道具
| 回复

共 9 个关于本帖的回复 最后回复于 2018-6-27 10:53

yusuan_8 新手上路 发表于 2018-6-25 19:44:02 | 显示全部楼层
你说的混淆是指什么?具体哪个网址?被混淆的内容是什么?能否截个图看看。

这个现成的规则是否符合你的需要?https://www.gooseeker.com/res/detail_95922.html
举报 使用道具
18829303412 新手上路 发表于 2018-6-26 14:11:49 | 显示全部楼层
yusuan_8 发表于 2018-6-25 19:44
你说的混淆是指什么?具体哪个网址?被混淆的内容是什么?能否截个图看看。

这个现成的规则是否符合你的需 ...

我想要知道加密是怎么破解的还有混淆的还原。。。现成的那一个是只有一个规则吗?
4ULC2S$~83RCB]I@4ZMP340.png
[O5CD1I8A_~WWOT0NMU)$67.png
举报 使用道具
Fuller 管理员 发表于 2018-6-26 16:51:48 | 显示全部楼层
18829303412 发表于 2018-6-26 14:11
我想要知道加密是怎么破解的还有混淆的还原。。。现成的那一个是只有一个规则吗? ...

集搜客网络爬虫采用所见即所得方式采集网页内容,不用破解混淆,如果你需要特别处理这段混淆,我们的爬虫产品解决不了这个问题
举报 使用道具
18829303412 新手上路 发表于 2018-6-26 17:06:20 | 显示全部楼层
好吧
举报 使用道具
18829303412 新手上路 发表于 2018-6-26 17:22:27 | 显示全部楼层
Fuller 发表于 2018-6-26 16:51
集搜客网络爬虫采用所见即所得方式采集网页内容,不用破解混淆,如果你需要特别处理这段混淆,我们的爬虫 ...

这个是因为什么啊
[MPPSJ1XSKCVP(2_2SCCLI9.png
举报 使用道具
Fuller 管理员 发表于 2018-6-26 17:27:35 | 显示全部楼层
18829303412 发表于 2018-6-26 17:22
这个是因为什么啊

如果这个规则是你自己定义的,说明存规则的时候失败了。我建议重新存一次规则,看看有没有失败提示
举报 使用道具
18829303412 新手上路 发表于 2018-6-26 17:31:56 | 显示全部楼层
Fuller 发表于 2018-6-26 17:27
如果这个规则是你自己定义的,说明存规则的时候失败了。我建议重新存一次规则,看看有没有失败提示
...

我这个时从https://www.gooseeker.com/res/detail_95922.html下载的
举报 使用道具
数据集 高级会员 发表于 2018-6-27 09:37:23 | 显示全部楼层
18829303412 发表于 2018-6-26 17:31
我这个时从https://www.gooseeker.com/res/detail_95922.html下载的

重新加载这个规则,保存一遍再运行
举报 使用道具
Fuller 管理员 发表于 2018-6-27 10:53:07 | 显示全部楼层
18829303412 发表于 2018-6-26 17:31
我这个时从https://www.gooseeker.com/res/detail_95922.html下载的

这个规则我在测试,稍等
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-18 23:12