这是一个用于爬取XDGAME网站游戏标题的Python爬虫程序。
- 从
https://www.xdgame.com/game/1.html获取游戏标题 - 使用Selenium处理JavaScript动态内容
- 支持多种获取方法,确保成功率
pip install -r requirements.txtpython main.pypython simple_crawler.pymain.py- 完整版爬虫,包含requests和Selenium两种方法simple_crawler.py- 简化版爬虫,仅使用Seleniumrequirements.txt- 项目依赖debug.html- requests方法获取的HTML调试文件debug_selenium.html- Selenium方法获取的HTML调试文件
- 双重保障: 先尝试requests方法,失败后自动切换到Selenium
- 多种选择器: 使用多种CSS选择器和XPath表达式确保成功率
- 错误处理: 完善的异常处理机制
- 调试支持: 自动保存HTML内容用于调试
程序成功获取到游戏标题:Valheim: 英灵神殿
- 需要安装Chrome浏览器
- 需要安装ChromeDriver(Selenium会自动管理)
- 程序使用无头模式运行,不会打开浏览器窗口