0 12007

我通过样例复制将整版的数据采集，怎么筛选掉不需要的数据阿

ym 于 2015-10-9 15:31 发表 [复制链接] [只看楼主] [打印] [上一主题] [下一主题]

问：第一行是我要采集的数据，框住的是不需要的，我通过样例复制将整版的数据采集，怎么筛选掉不需要的数据阿，求大神解答一下

答：xpath中有些字符串处理函数，比如，substring-after(), substring-before()等等，可以用

问：如果抓取结果还要做后续处理，我建议后续处理程序来做这个工作

答：用excel也可以

问：但是我要通过这些网址来作下一级线索的

答：看第一行，如果从？spm开始截掉是否可以？这个最容易些xpath

本帖子中包含更多资源

您需要登录才可以下载或查看，没有帐号？立即注册

x

转播

支持

反对

举报使用道具

| 回复

共 0 个关于本帖的回复最后回复于 2015-10-9 15:31

返回列表

精彩推荐

利用AI阅读和分析文本：扣子COZE记录用户反
在网页片段内直观标注——以B站评论采集为
利用AI阅读和分析文本：使用COZE建设游记文
使用AI工具Kimi生成python代码为文本分析结
苹果mac电脑安装集搜客网络爬虫软件失败的

我通过样例复制将整版的数据采集，怎么筛选掉不需要的数据阿

本帖子中包含更多资源

共 0 个关于本帖的回复最后回复于 2015-10-9 15:31

推荐板块

精彩推荐

热门话题

热门用户

	B Color Image Link Quote Code Smilies 高级模式您需要登录后才可以回帖登录 \| 立即注册回帖并转播回帖后跳转到最后一页

我通过样例复制将整版的数据采集，怎么筛选掉不需要的数据阿

本帖子中包含更多资源

共 0 个关于本帖的回复 最后回复于 2015-10-9 15:31

推荐板块

精彩推荐

热门话题

热门用户

共 0 个关于本帖的回复最后回复于 2015-10-9 15:31