Python入门:从零基础到实现简单爬虫

发布时间:2026-01-05

一、Python环境搭建

首先需要安装Python环境,推荐下载官网的最新版本(3.10+):Python官网。安装完成后,通过cmd输入python --version验证是否安装成功。

二、基础语法:变量与循环

Python的变量无需声明类型,直接赋值即可:

# 定义变量
name = "Python学习者"
age = 25
# 循环输出
for i in range(5):
    print(f"第{i+1}次学习Python")
            

三、简单爬虫案例:爬取网页标题

使用requests库爬取网页标题,先安装库:pip install requests

import requests
from bs4 import BeautifulSoup

# 请求网页
url = "https://www.python.org/"
response = requests.get(url)
# 解析网页
soup = BeautifulSoup(response.text, "html.parser")
# 获取标题
title = soup.title.string
print(f"网页标题:{title}")
            

注意:爬虫需遵守网站的robots协议,禁止爬取敏感信息,仅用于学习交流。

Python自动化:批量处理Excel表格

发布时间:2026-01-04

一、openpyxl库介绍

openpyxl是处理Excel xlsx格式的常用库,安装命令:pip install openpyxl

二、批量读取Excel数据

from openpyxl import load_workbook

# 加载Excel文件
wb = load_workbook("数据.xlsx")
ws = wb.active
# 读取所有行
for row in ws.iter_rows(values_only=True):
    print(row)