我想采集当当上畅销书的商品名称、市场价格和当当价格,查重主题名一直都显示“该名已被占用。可编辑:否”,换了n多次,都是名称被占用,命名主题名有什么要注意的?
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2015-8-13 11:34

沙发
挂件居然 初级会员 发表于 2015-8-13 11:05:57 | 只看该作者
集搜客累积注册用户已达到3W,所以很多主题名都是被使用过的,为了确保主题名的唯一性,主题名都不允许重名,所以设置主题名时尽量多带后缀来确保唯一性
举报 使用道具
板凳
tthaizhiguang 新手上路 发表于 2015-8-13 11:12:46 | 只看该作者
挂件居然 发表于 2015-8-13 11:05
集搜客累积注册用户已达到3W,所以很多主题名都是被使用过的,为了确保主题名的唯一性,主题名都不允许重名 ...

毕竟接受用户注册,为什么不用用户名和主题名作为识别呢?要不然以后主题名重复的几率会越来越高,但实际上挖掘规则却不一样。。。
举报 使用道具
地板
挂件居然 初级会员 发表于 2015-8-13 11:34:09 | 只看该作者
tthaizhiguang 发表于 2015-8-13 11:12
毕竟接受用户注册,为什么不用用户名和主题名作为识别呢?要不然以后主题名重复的几率会越来越高,但实际 ...

恩 你这个建议非常好,我们会把这个建议反映给技术部,后续可能会进行改进,非常感谢你的建议
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的
  • 下载支持win7的集搜客网络爬虫软件

热门用户

GMT+8, 2024-9-19 08:59