世良情感网

利用ubuntu作为mongodb存储服务器scrapy爬取招聘数据

Python私教 2018-12-17 15:38:40

scrapy startproject tencent

cd tencent

scrapy genspider hr "tencent.com"

执行爬虫的命令

scrapy crawl hr

以上创建一个爬虫

爬虫源码

爬取内容类源码

设置

管道处理,存储进数据库

服务器上存储的内容截图

db.hr.find()

查询全部的招聘数据

如何查看是否能够用xpath爬取数据:如果doc内容和element内容一致,即可

0 阅读：15

Python私教

简介：全栈工程师,目标人工智能.抖音同理想国真恵玩.

作者最新文章

科技TOP

科技最新文章

热门分类

军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球健康房产家居星座旅游健身时尚科学探索职场育儿股票教育影视情感热点推荐热榜中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期青骄第二课堂少年风超级父母麻辣老师街拍恋爱攻略婚姻情趣正能量