如何爬多个包含固定字符的网址并记录

tillwemeetagain

原来一直用java写的爬虫程序，总是有一点点问题，现在想试试gooseeker，从某个网址开始，比如说：www.fudan.edu.cn，根据这个网址上的链接，如果有包含"edu.cn“的，则一直顺着爬下去，记录链接名称。
谢谢！

Fuller · 发表于 2016-4-23 17:39:07

在爬虫路线工作台上，可以创建样式线索，但是，现在是根据url中含有的字符串进行匹配，而且也不是包含关系，而是判断网址前半部分是否与“网页样式”相同，相当于前缀是否相同。如果要实现你的需求，样式线索的功能要做加强修改

共 1 个关于本帖的回复最后回复于 2016-4-23 17:39

	B Color Image Link Quote Code Smilies 高级模式您需要登录后才可以回帖登录 \| 立即注册回帖并转播回帖后跳转到最后一页