目录
- 快捷采集
- 初级教程(新版)
- 初级教程(老版)
- 数据转Excel处理
- 爬虫规则管理
- 高级教程(新版)
- 高级教程(老版)
- 用爬虫群分布式高效采集
- 爬虫关键知识拓展
- 问题集锦
- 实战演练案例
- 爬虫安装说明
- 关于集搜客
集搜客交流群
2000人群:点击加入
京东数据抓取,文本内容不显示如何抓取?
]8137[/attach][attach]8136[/attach][attach]8138[/attach] 有些文本内容显示
京东数据抓取,文本内容不显示如何抓取?
有些文本内容显示,有些没有显示,如何写规则,每单个商品的节点是LI,都属于一个UL,但是使用LI做样例复制显示找不到上级节点
为什么抓取游记文本的内容抓不全呢
最后只能抓取到界面显示的部分内容,全部文本没法抓下来,这是为什么呢
我抓取的内容是一个很长的文本,怎么只抓取其中一部分的内容?
[attach]7414[/attach] 这个篇文章全部都在一个标签里,我只想得到营业收入这个信息?
如何抓取网页表格内的文本内容且保留其格式
我想抓取每一个网页表格里的内容,但是把整个表格的文本内容抓下来以后表格中的制表符换行符都不见了,抓下来的数据没法做结构化处理随后我想在容器中添加节点去抓取每一个字段,然后用样例复制。但是只有容器节点才能使用样例复制。。请问有什么办法可以将整个表格抓取下来并保留其原有格式?
抓取结果文本内容中发现无效字符,怎么办
打开抓取结果文件,报错,应该是文本内容中有无效字符,怎么办?
映射后抓取的内容和文本框显示的不一致
[url]http://bj.lianjia.com/chengjiao/[/url] 需要抓取房价 在文本内容框显示的是数字价格但是映射后抓取出来的结果就变成了时间,是不是有一些反爬虫机制
如何完整映射文本内容
如何完整的映射框框里面的内容?点击的时候只显示一部分。 [attach]1215[/attach]
选好抓取内容后,测试的时候出来的内容不是本应该被抓取的内容
如下图选好了抓取【时间】 [attach]10441[/attach] 但是测试出来的结果,是上方位置的【
为什么不显示文本内容呢
[b]问[/b]:为什么不显示文本内容呢?attach]211[/attach][/align] [align=left][b]答[/b]:有些text没有文本
同层级下多个span里的文本映射到同一个抓取内容
任务名:新豆瓣电影数据分析第2级 问题1:影片类型在同一层级下的不同span里,内容映射只能显示一个,定位映射一做就出错问题2:因为某些电影详情页缺少信息如演员或是编剧,导致最终输出的数据文件有信息错位的情况,如图三,这种是要做定位映射还是使用
抓取内容怎么包括本页面网址
我想要采集做规则这个页面的网址 要怎么映射
怎样提取一段文本数据中的关键词内容
[i=s] 本帖最后由 wangyong 于 2020-11-13 15:40 编辑 [/i] 使用集搜客爬虫的[urlhttps://www.gooseeker.com/land/weibo.html]微博工具[/url]采集到了微博的博文数据,怎样能把一段博文中的关键词提取出来
如何抓取主页的全文内容?
微博正文还是不完整的,但是快捷服务里的“微博全文展开”又只能针对页面中的单一微博,不能通过结构化页面批量生产 有没有什么快捷方法能够抓取一个博主的所有微博且是全文
内容分析中的字典和文本分类
[i=s] 本帖最后由 数据分析小白edu 于 2020-8-7 16:12 编辑 [/i] 内容分析研究者曾经使用了不同的策略来创建类目和变量