调试状态无误

但是在实际读取的XML中挂牌日期这个字段和下方的日期数据均消失不见,请问什么情况?


举报 使用道具
| 回复

共 8 个关于本帖的回复 最后回复于 2017-3-1 09:55

沙发
scraper 论坛元老 发表于 2017-2-28 18:04:38 | 只看该作者
主题名是什么
举报 使用道具
板凳
fuduoster 新手上路 发表于 2017-2-28 18:28:36 | 只看该作者
OTC_Company_Detail
举报 使用道具
地板
Fuller 管理员 发表于 2017-2-28 19:06:19 | 只看该作者
我加载了你的规则,能采集到正确的信息
  1. <Company_Detail><item><注册地址>上海市宝山区同泰北路183号1号楼521室</注册地址><名称加编号>
  2.                 上海安防(SH100002)

  3.                                     3.50
  4.                
  5.             </名称加编号><法定代表人>蒋达先</法定代表人><行业>C - 制造业</行业><公司名称>上海安防电子股份有限公司</公司名称><总股本>12,000,000</总股本><挂牌日期>2012年2月15日</挂牌日期><电话>021-65440440</电话><公司简介>      公司专业从事视频监控产品的研制、生产、销售。产品在政府重点项目、交通行业、城市治安等高端市场,已经成为替代进口品牌的首选产品,在上海虹桥枢纽、世博会、快速路网、北京市城市治安、全国各地高速公路网等大型视频监控系统项目核心设备已经成功稳定地应用。      近期公司推出1080p高速云台摄像机等系列网络化高清产品和大型网络化安全管理平台以及综合业务光平台系列数字化产品。这一系列代表着安防行业发展方向的下一代产品的不断问世,彰显了公司在安防行业的领航者的地位。</公司简介><市净率>市净率:5.91</市净率><市盈率>市盈率: < 0</市盈率>
复制代码


我估计你没有打开滚屏,采集太快了,网页内容还没有加载好。可以做如下设置
1)DS打数机菜单 配置-》滚屏参数,滚屏次数设置成2
2)DS打数机菜单 配置-》延迟抓取,设置5秒
首选第一个设置,第一个还不够,再加上第二个


举报 使用道具
5#
fuduoster 新手上路 发表于 2017-2-28 19:26:14 | 只看该作者
我这两个选项和你推荐的配置是一样的……
举报 使用道具
6#
Fuller 管理员 发表于 2017-2-28 20:01:21 | 只看该作者
fuduoster 发表于 2017-2-28 19:26
我这两个选项和你推荐的配置是一样的……

你用的是火狐插件版还是GS爬虫浏览器版?我刚才测试用的是GS浏览器。
举报 使用道具
7#
fuduoster 新手上路 发表于 2017-3-1 08:54:54 | 只看该作者
我用的火狐插件,我换GS再试试
举报 使用道具
8#
Fuller 管理员 发表于 2017-3-1 09:34:36 | 只看该作者
fuduoster 发表于 2017-3-1 08:54
我用的火狐插件,我换GS再试试

火狐版的话,可能是语言设置的不合适,菜单 工具-》选项,点击“内容”,看“语言”设置,排序是否把中文放在最前面?


举报 使用道具
9#
fuduoster 新手上路 发表于 2017-3-1 09:55:25 | 只看该作者
我发现了,我之前把JS禁用了,现在启用后就正常了。
谢谢Fuller
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-4 14:36