这里只入门最简单的静态界面的爬取方法,高手请绕道。以下也只是我的一些学习笔记与顺序,仅供参考。

  1. 正则表达式学习笔记
  2. Python 正则表达式 re 模块
  3. Requests 库
  4. BeautifulSoup 模块
  5. 阅读这篇 csdn 并上手尝试: Python爬虫史上超详细讲解(零基础入门,老年人都看的懂)-CSDN博客
  6. 然后,你就会爬取静态页面了

Record: 这些学习的实际时间是 2024 年 8 月份,也是我第一次实习的时候。幸运的是,第一段实习中就认识了许多友好且能力强的同事,我其实不善言语,但他们也处处帮着我带着我,这才让我有了更多的时间来学习知识,提升自己。后来回学校后忙于学业,一直没有时间整理这些笔记。终于,在 2024 年末开始了这些工作。谨以此系列纪念我的第一段实习。