楼主大四狗,要做毕业设计了,选的题目是做一个带有新闻推荐功能的安卓APP,所以我想要一些新闻数据,我自己就先用Python的Scrapy框架写了几个Demo,但是水平有限,对于像新浪、凤凰之类的网站都是JS动态加载的数据,很难搞,好不容易找到了chinanews.com,里面是静态加载的数据,但是无奈数据较少,且图片信息不好抓取,15年的新闻和14年、13年的图片用的标签都不一致,不好处理,实在不想浪费太多时间在爬虫上,因为我要做的是APP= =!。。。就找到了GooSeeker(就刚刚才找到)。
想直接请教下大神们,能不能教我抓取新闻源。。。最好能从百度搜索结果开始抓。 具体的话我需要 新闻标题, 新闻正文, 新闻配图, 新闻配图的配文,发布时间,发布社, 图片只要URL也行。 麻烦各位大神了 |
|
|
|
|
共 3 个关于本帖的回复 最后回复于 2015-12-12 17:28