GooSeeker
产品
资源
教程
视频教程
使用交流
资讯
开启辅助访问
切换风格
请
登录
后使用快捷导航
没有帐号?
立即注册
登录
|
注册
快捷导航
资讯
常见问题
使用交流
python交流
视频教程
资源发布公告
数学建模交流
论坛
›
搜客社区
›
常见问题
5
8245
当前查看的主题为:珠海预售_2
zhuohui1987
于 2016-12-4 11:58
发表
[复制链接]
[只看楼主]
[打印]
[上一主题]
[下一主题]
zhuohui1987
积分
1871
精华
0
威望
846
金钱
2
最后登录 1970-1-1
加为好友
发送消息
访问家园
当前查看的主题为:珠海预售_2
没有线索了,可添加新线索或者激活已有的线索
xpath 不会写
诊断:网页上没有定位标志,表格有长有短
xpath
也不会对啊
table[@id='DataGrid1']/tbody/tr[2]也是不对啊呀
http://www.gooseeker.com/doc/article-264-1.html
http://www.gooseeker.com/doc/article-264-1.html
麻烦你叫我写一下,看一下
收藏
0
转播
支持
0
反对
0
举报
使用道具
|
回复
共 5 个关于本帖的回复 最后回复于 2016-12-4 16:19
zhuohui1987
积分
1871
精华
0
威望
846
金钱
2
最后登录 1970-1-1
加为好友
发送消息
访问家园
个人资料
主题列表
发消息
沙发
zhuohui1987
金牌会员
发表于 2016-12-4 11:59:07
|
只看该作者
教程我都看过来啊
举报
使用道具
回复
支持
反对
Fuller
积分
24021
精华
0
威望
6704
金钱
6
最后登录 2025-4-21
加为好友
发送消息
访问家园
个人资料
主题列表
发消息
板凳
Fuller
管理员
发表于 2016-12-4 15:37:23
|
只看该作者
最大的问题是没有设置关键内容,那么这个规则的线索就有可能什么都抓不到
举报
使用道具
回复
支持
反对
Fuller
积分
24021
精华
0
威望
6704
金钱
6
最后登录 2025-4-21
加为好友
发送消息
访问家园
个人资料
主题列表
发消息
地板
Fuller
管理员
发表于 2016-12-4 15:58:19
|
只看该作者
这个TD应该是要抓取下级线索的,自动生成的规则是
<TD>
<xsl:for-each select="following-sibling::tr[position()=12]/td/table/tbody/tr[position()>=2]">
<xsl:call-template name="TD"/>
</xsl:for-each>
</TD>
复制代码
网页上万一不是position()=12,比如,上面那个表格变长了,就抓不到了,而且又没有设置关键内容,没有抓到也不会报错。
应该用这个表头的文字作为标志。为了方便自定义标志,把这个子表用另一个整理箱来存储
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有帐号?
立即注册
x
举报
使用道具
回复
支持
反对
Fuller
积分
24021
精华
0
威望
6704
金钱
6
最后登录 2025-4-21
加为好友
发送消息
访问家园
个人资料
主题列表
发消息
5
#
Fuller
管理员
发表于 2016-12-4 16:12:01
|
只看该作者
因为你的这个样本页面下面那个项目名称表没有多条,我没法给你演示多样例采集,难道都是只有一条?
举报
使用道具
回复
支持
反对
Fuller
积分
24021
精华
0
威望
6704
金钱
6
最后登录 2025-4-21
加为好友
发送消息
访问家园
个人资料
主题列表
发消息
6
#
Fuller
管理员
发表于 2016-12-4 16:19:12
|
只看该作者
如果只有一条数据的话,也新建一个整理箱
生成规则你会发现,自动使用了一个定位标志,这个定位标志刚好是关于内部子表的,这样也省去写自定义xpath了。你可以看一下,跟你手工写的那个xpath几乎是一样的,其实你写的xpath基本上对了
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有帐号?
立即注册
x
举报
使用道具
回复
支持
反对
返回列表
B
Color
Image
Link
Quote
Code
Smilies
高级模式
您需要登录后才可以回帖
登录
|
立即注册
发表回复
回帖并转播
回帖后跳转到最后一页
回复
推荐板块
使用交流
常见问题
数学建模交流
python交流
视频教程
精彩推荐
360或火绒等杀毒软件导致GooSeeker爬虫软件
话题分析(NMF模型和LDA模型)软件的安装和
运行Apple无法验证的程序的方法
文本聚类分析软件的安装和使用方法
利用AI阅读和分析文本:扣子COZE记录用户反
热门话题
1
【集微库】微博采集工具箱使用常见问题
2
怎样使用快捷采集(以采集京东评论为例)
3
集搜客文本分词标注工具(V1版)
4
有没有办法采集机场的出租车信息?
5
获得积分的好方法:转发小程序、QQ群、微信
6
【求助】关于采集阿里巴巴国际站访客详情分
7
GooSeeker分词,情感分析和关键词抽取平台使
8
新浪微博_博主主页
9
怎样采集抖音关键词搜索后的数据
10
集搜客GooSeeker 网络爬虫版本发布公告
热门用户
Fuller
帖子:10607
访问主页>>
wangyong
帖子:1731
访问主页>>
gbkuce
帖子:0
访问主页>>
GMT+8, 2025-4-22 06:27
快速回复
快速发帖
返回顶部
返回列表
共 5 个关于本帖的回复 最后回复于 2016-12-4 16:19