Skip to content

maoyusan/xdgame-sort

Repository files navigation

游戏标题爬虫

这是一个用于爬取XDGAME网站游戏标题的Python爬虫程序。

功能

  • https://www.xdgame.com/game/1.html 获取游戏标题
  • 使用Selenium处理JavaScript动态内容
  • 支持多种获取方法,确保成功率

安装依赖

pip install -r requirements.txt

使用方法

运行完整版爬虫(包含多种方法)

python main.py

运行简化版爬虫(仅Selenium)

python simple_crawler.py

文件说明

  • main.py - 完整版爬虫,包含requests和Selenium两种方法
  • simple_crawler.py - 简化版爬虫,仅使用Selenium
  • requirements.txt - 项目依赖
  • debug.html - requests方法获取的HTML调试文件
  • debug_selenium.html - Selenium方法获取的HTML调试文件

技术特点

  1. 双重保障: 先尝试requests方法,失败后自动切换到Selenium
  2. 多种选择器: 使用多种CSS选择器和XPath表达式确保成功率
  3. 错误处理: 完善的异常处理机制
  4. 调试支持: 自动保存HTML内容用于调试

获取结果

程序成功获取到游戏标题:Valheim: 英灵神殿

注意事项

  • 需要安装Chrome浏览器
  • 需要安装ChromeDriver(Selenium会自动管理)
  • 程序使用无头模式运行,不会打开浏览器窗口

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published