MediaCrawler:爬取快手B站等

智能科技扫地僧 2024-03-22 08:23:23

项目简介

这个项目可以爬取抖音快手小红书 B站微博的视频，图文，作者信息以及评论。

小红书爬虫，抖音爬虫，快手爬虫， B站爬虫，微博爬虫...。目前能抓取小红书、抖音、快手、B站、微博的视频、图片、评论、点赞、转发等信息。

原理：利用playwright搭桥，保留登录成功后的上下文浏览器环境，通过执行JS表达式获取一些加密参数通过使用此方式，免去了复现核心加密JS代码，逆向难度大大降低

功能列表

平台

Cookie 登录

二维码登录

手机号登录

关键词搜索

指定视频/帖子 ID 爬取

登录状态缓存

数据保存

IP 代理池

滑块验证码

小红书

✅

✅

✅

✅

✅

✅

✅

✅

✕

抖音

✅

✅

✅

✅

✅

✅

✅

✅

✅

快手

✅

✅

✕

✅

✅

✅

✅

✅

✕

B 站

✅

✅

✕

✅

✅

✅

✅

✅

✕

微博

✅

✅

✕

✅

✅

✅

✅

✅

✕

使用方法创建并激活 python 虚拟环境# 进入项目根目录cd MediaCrawler# 创建虚拟环境python -m venv venv# macos & linux 激活虚拟环境source venv/bin/activate# windows 激活虚拟环境venv\Scripts\activate

安装依赖库pip3 install -r requirements.txt

安装 playwright浏览器驱动playwright install

运行爬虫程序# 从配置文件中读取关键词搜索相关的帖子并爬去帖子信息与评论python main.py --platform xhs --lt qrcode --type search# 从配置文件中读取指定的帖子ID列表获取指定帖子的信息与评论信息python main.py --platform xhs --lt qrcode --type detail# 打开对应APP扫二维码登录# 其他平台爬虫使用示例, 执行下面的命令查看python main.py --help

数据保存支持保存到关系型数据库（Mysql、PgSQL等）支持保存到csv中（data/目录下）支持保存到json中（data/目录下）

项目链接

https://github.com/NanmiCoder/MediaCrawler

0 阅读：0

智能科技扫地僧

感谢大家的关注

作者最新文章

1

我花了72小时研究CursorAgents，以下是必须分享的硬核干货！

2

AIAgent时代即将到来

3

【AI教程】即梦AI海报直出中文，非设计师的我已经破防

4

中兴通讯CDO崔丽受邀出席2024年《财富》MPW女性峰会

5

【转发AI洞察】：金融服务中的GraphRAG和标准RAG对比案例解析

6

Anthropic官方深入探讨prompt工程|全文脱水中文版

7

全网最全Kimi使用指南：解锁六大高阶技巧，提升效率新境界

8

【AI通义千问大模型】Qwen相关的核心概念

9

kimi高仿10W+爆款文章，1分钟出炉，真的太香了！

10

AI短视频神器来了！一键全自动剪辑！

科技TOP

1

重磅铁拳,中科院正式宣布,中方开始关闭EUV的大门

2

刚刚入网的荣耀GTPro,配置有点猛啊

3

1TB!去年捅破天的Ultra,杀回来了

4

下个月起,微信支付宝或将迎来“调整”!出门又要带“现金”了?

5

错位:黄仁勋李在容为中国市场奔走郭台铭李嘉诚为去中国化而出走

6

美团正式发布独立品牌“美团闪购”订单平均30分钟送达

7

可外接独立镜头,vivoX200Ultra配置全曝光,能打电话的相机?

8

"104%关税触发末日按钮?中国启动'彩虹防御',马斯克连夜改航班"

9

7600mAh只卖1千多,vivo超大电池的游戏手机来了

10

8000mAh+卫星通信+三防机身,这新机有点猛

科技最新文章

1

三星GalaxyS24轻薄美学,与实用主义的完美融合

2

OPPO新机官宣:4月22日,全新登场

3

续航强劲,流畅持久,游戏玩家的理想之选

4

2099元起步?红米Turbo4Pro迎来官宣,金属中框+超大电池

5

钛金属中框+2K直屏+超声波指纹,一款降价2899元的三星旗舰!

6

工信部出手!小米重磅应用适配华为纯血鸿蒙系统,网友浮想联翩

7

不要着急买手机!4月份还有不少新机价格买贵“大冤种”

8

100多元的华为5G手机,完美充当随身WiFi,还能升鸿蒙3.0系统

9

7200mAh+344W,荣耀刚公布的新手机,太猛了

10

荣耀GTpro官宣,6500mAh+骁龙8至尊+超声波指纹,不给友商留机会

热门分类

军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球健康房产家居星座旅游健身时尚科学探索职场育儿股票教育影视情感热点推荐热榜中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期青骄第二课堂少年风超级父母麻辣老师街拍恋爱攻略婚姻情趣正能量