酒店的网络点评 艺龙网和去哪儿网无法采集  总是已停止是什么原因
举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2018-4-6 09:18

沙发
Fuller 管理员 发表于 2018-4-5 12:08:35 | 只看该作者
你用现成的数据DIY采集工具?没有自己做规则?
举报 使用道具
板凳
Fuller 管理员 发表于 2018-4-5 12:12:00 | 只看该作者
如果使用数据DIY采集工具,选择好网站和页面以后,按照给出的样例网址的样子填写你要采集的网址,很有可能你填写的网址不对,比如,采评论的时候,需要填写详情页网址,你可能填了列表页网址
举报 使用道具
地板
lucun22 新手上路 发表于 2018-4-5 12:21:17 | 只看该作者
嗯  是的  我也注意到可能是我的网址不对 所以 我特别的按照示例填写的  可是还是不对

举报 使用道具
5#
Fuller 管理员 发表于 2018-4-5 12:30:43 | 只看该作者
lucun22 发表于 2018-4-5 12:21
嗯  是的  我也注意到可能是我的网址不对 所以 我特别的按照示例填写的  可是还是不对

...

我的同事正在检查问题原因,我测试了一下,这个工具对有些网址确实不适应
举报 使用道具
6#
wangyong 版主 发表于 2018-4-5 13:09:45 | 只看该作者
去哪和艺龙的抓取评论的工具修改好了,可以再添加链接试一下
举报 使用道具
7#
lucun22 新手上路 发表于 2018-4-5 21:20:37 | 只看该作者
我试了一下  还是有问题  尤其是去哪儿网
举报 使用道具
8#
Fuller 管理员 发表于 2018-4-6 09:18:40 | 只看该作者
lucun22 发表于 2018-4-5 21:20
我试了一下  还是有问题  尤其是去哪儿网

你采集的网址是什么?贴出来我们测试一下
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-8 08:06