http://so.tv.sohu.com/list_p12_p2_p3_u5185_u5730_p4-1_p5_p6_p7_p80_p9-1_...
搜狐视频的这个页面,默认打开的时候是海报的展示页面,通过列表右上的图标可以变成列表信息的显示方式,我想抓取列表中的详细信息,但是由于跳转的标志是个图标,没有文本记号,用记号线索没法跳转过去,而且是区域刷新也没法使用URL,请问这种情况有办法解决么?
非常感谢!
http://so.tv.sohu.com/list_p12_p2_p3_u5185_u5730_p4-1_p5_p6_p7_p80_p9-1_...
搜狐视频的这个页面,默认打开的时候是海报的展示页面,通过列表右上的图标可以变成列表信息的显示方式,我想抓取列表中的详细信息,但是由于跳转的标志是个图标,没有文本记号,用记号线索没法跳转过去,而且是区域刷新也没法使用URL,请问这种情况有办法解决么?
非常感谢!
搜狐视频模拟点击抓取方法
关于从搜狐视频上抓取电视剧信息,有以下几点需要说明:
1)实际上从是否转换成列表显示方式不影响抓取,他们的网页内容完全一样,只是显示格式变化。在列表方式中,虽然看到更多的信息,比如电视剧剧情简介,在另一种显示方式下,只是不显示而已
2)当记号不是文本的时候,要在Clue Editor工作台上,在最左边有个像字母T一样图标,鼠标移动到那,显示“作为记号的节点是文本(勾选)还是其它属性”,不勾选,就能用@class, @id, @title等作为记号
3)参看我定义的主题:test_click和test_click_list,从test_click模拟点击转到test_click_list。为了线索定位更加准确,需要选择MetaStudio菜单 配置-〉首选项,选择“线索定位”那个tab,选择“偏好class”
明白了,非常感谢Fulle
明白了,非常感谢Fuller的解答,感谢你把这么好用的工具带给大家!