501#
umsung 高级会员 发表于 2017-10-9 14:19:18 | 只看该作者
ld1425 发表于 2017-10-9 12:16
网页上可以显示,我截图了但是粘不过来。网页上有,打包数据里没有,只有“回复”二字 ...

是包涵“@某人”的评论采集不到还是都这样?
举报 使用道具
502#
ld1425 新手上路 发表于 2017-10-10 01:15:19 | 只看该作者
只要一条评论以“回复@某人”开头,这条评论内容(包括“@某人” 和 后面的任何内容)就采集不到,只有“回复”二字能出现在采集结果里。请问是什么问题呢?
举报 使用道具
503#
umsung 高级会员 发表于 2017-10-10 09:26:24 | 只看该作者
这个抓取工具不采集评论中的回复,回复@某人不是评价这条评论,而是回复某人信息。
举报 使用道具
504#
ld1425 新手上路 发表于 2017-10-10 09:46:13 | 只看该作者
你说“这个抓取工具不采集评论中的回复”, 可是同一条评论内的其余信息比如博主id,博主主页,发布时间,点赞数,回复数全都被采集了呀,只有对我有用的评论内容没有被采集,只有“回复”两个字。付钱了还没搜到,这就说不过去了吧,你们的工具既然默认不搜集回复,那就不应该收这条信息的钱!
举报 使用道具
505#
bowieD 金牌会员 发表于 2017-10-10 10:56:30 | 只看该作者
ld1425 发表于 2017-10-10 09:46
你说“这个抓取工具不采集评论中的回复”, 可是同一条评论内的其余信息比如博主id,博主主页,发布时间, ...

您好,规则已经经过修改,现在可以采集@某人后的评论了。
举报 使用道具
506#
ld1425 新手上路 发表于 2017-10-10 13:30:38 | 只看该作者
赞!解决问题及时干脆!还有一个问题反映一下: 下载的excel数据列表里,评论内容一列,能不能只显示评论本身,把发表评论的人名去掉,因为人名已经在这条评论的博主id一列显示过了。比如:
“微微不重名:回复@小日-先森:多少钱?” 这条评论里有效信息只有“回复@某人多少钱”,前面的人名能不能不要重复显示?能否把这个规则也改一下?
举报 使用道具
507#
umsung 高级会员 发表于 2017-10-10 14:14:55 | 只看该作者
这个可以通过excel处理
举报 使用道具
508#
monster0 新手上路 发表于 2017-10-10 17:08:51 | 只看该作者
阅读量和播放量能实现采集吗?
举报 使用道具
509#
umsung 高级会员 发表于 2017-10-10 17:14:53 | 只看该作者
monster0 发表于 2017-10-10 17:08
阅读量和播放量能实现采集吗?

只要是网页上公开显示的就能采集
举报 使用道具
510#
chengyiling 初级会员 发表于 2017-10-11 21:28:27 | 只看该作者
在最后的数据里怎么看是谁转发谁的,谁评论谁的啊
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 为什么用微软的excel无法打开xls文件?powe
  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法

热门用户

GMT+8, 2025-8-11 07:06