如何将正文部分每条数据做为单独的字段抓取

AnswerDSL

http://ycyhfy.chinacourt.org/article/detail/2015/12/id/1777582.shtml
需要将正文部分按第一条、第二条、第三条，每一条做为一个字段抓取，而不是作为一个整体，请问怎么做到？

北京精友 · 发表于 2016-8-19 11:04:02

在提供的链接中，第一段是div中的第一个text，第二段是第三个text，第三段是第五个text，第四段是第七个text

分别将每个对应的text映射到抓取内容中即可。

如果其他相同结构的网页text分布没有规律，我们自定义xpath，使用contains函数，将“1.”“2.”，写到xpath中作为判断标志。
实例xpath<//*[@class='text general']/text()[contains(.,'1.')]>
关于xpath的函数教程参看http://www.gooseeker.com/doc/thread-1852-1-1.html

如何将正文部分每条数据做为单独的字段抓取

相关帖子

共 1 个关于本帖的回复最后回复于 2016-8-19 11:04

本帖子中包含更多资源

推荐板块

精彩推荐

热门话题

热门用户

	B Color Image Link Quote Code Smilies 高级模式您需要登录后才可以回帖登录 \| 立即注册回帖并转播回帖后跳转到最后一页

如何将正文部分每条数据做为单独的字段抓取

相关帖子

共 1 个关于本帖的回复 最后回复于 2016-8-19 11:04

本帖子中包含更多资源

推荐板块

精彩推荐

热门话题

热门用户

共 1 个关于本帖的回复最后回复于 2016-8-19 11:04