rank_backend/docs/需求.md

现在这是我的项目概览：
项目概览

- 目标：抓取抖音“合集”和“单个视频”的数据，用于分析。
- 技术： selenium + webdriver-manager ，少量 requests ；支持无头模式与手动登录。
- 能力：从页面源码 JSON、DOM 选择器等多源提取数据，含反爬规避与调试截图。
脚本与输出

- douyin_scraper.py ：抓取合集数据（标题、播放/点赞统计、视频列表）；输出 douyin_collection_data.json 。
- douyin_scraper_enhanced.py ：合集增强版（手动登录、页面状态分析、截图）；输出 douyin_collection_data_enhanced.json 。
- douyin_video_scraper.py ：抓取单视频互动数据（点赞/评论/分享/收藏/播放等）、基本信息与评论采样；输出 douyin_video_data.json ，保存页面截图。
运行与依赖

- 依赖： requirements.txt （ selenium 、 requests 、 webdriver-manager ）。
- 运行示例： python3 douyin_scraper.py 、交互式增强版/视频版可选择手动登录。
注意事项

- 合规与频控：遵守平台条款与法律，控制抓取频率。
- 结构变更：抖音页面结构可能更新，需调整选择器/解析逻辑。
- 环境匹配：确保本机 Chrome 与 ChromeDriver 版本兼容。

需求：
根据链接https://www.douyin.com/video/7556193043586600201
后面的7556193043586600201是可以替换的，获取到所有的短剧集数视频列表
7556193043586600201这个就是集数，每一集的这个都不一样
进行爬取短剧的点赞数，评论数，收藏数，全部评论内容

总体来说就是输入视频的链接也就是这个https://www.douyin.com/video/7556193043586600201，然后就可以自动的获取到该系列所有的视频列表，有了列表之后只需要遍历列表，对每个视频进行单独的爬取，之后就可以获取到该视频的点赞数、收藏数、评论数、评论内容了，获取的视频列表一定要保存起来

但是现在有一个简单的要求，就是可以输入一个视频的链接，然后只对这一集来进行爬取点赞数、收藏数、评论数、评论内容

流程：
输入视频链接->自动识别短剧集数列表->通过列表抓取所有集数短剧视频->获取该系列每个视频的点赞数、收藏数、评论数、评论内容->打印出来即可