本帖最后由 a10863 于 2016-5-1 01:15 编辑
我在抓取论坛评论的时候碰到两个问题请教大神帮忙,十分感谢
第一个问题,我想要在每个评论抓取的时候重复抓这篇帖子的标题怎么处理?
第二个问题,我需要同时抓取名字、时间和评论内容,可是名字和时间在一个div层级里,评论内容在其下面并列的div层级中,这两个div的class不同,请大神帮忙指点一下怎么处理能同时抓取每个评论内容的名字、时间和评论。
大概像下面的一样
网页标签 class 备注
DIV postbit1 只有该条评论的网名和时间
DIV postbit2 只有该条评论的内容
DIV postbit1 第二条评论的网名和时间
DIV postbit2 第二条评论的评论内容
DIV postbit1 第三条评论的网名和时间
DIV postbit2 第三条评论的评论内容 |
|
|
|
|
共 3 个关于本帖的回复 最后回复于 2016-5-1 17:12