Python爬虫
Python爬虫1.任务介绍爬取豆瓣电影Top250的基本信息 2.爬虫初识爬虫的本质就是模拟浏览器打开网页,获取网页中我们想要的那部分数据。 3.基本流程3.1 准备工作导入包 123456import bs4 # 网页解析,获取数据import re # 正则表达式,进行文字匹配import urllib.reques...
Python爬虫1.任务介绍爬取豆瓣电影Top250的基本信息 2.爬虫初识爬虫的本质就是模拟浏览器打开网页,获取网页中我们想要的那部分数据。 3.基本流程3.1 准备工作导入包 123456import bs4 # 网页解析,获取数据import re # 正则表达式,进行文字匹配import urllib.reques...
错误与异常12345678910# 捕获异常try: print("------test-------1--------") f = open("123.txt", "r") # 要打开的文件不存在 print("------test-------2--------") ex...
文件操作打开文件1f = open("test.txt", "w") # 当写入文件时,若文件不存在,则会新建一个文件 如果不写清楚对文件的操作方式,则会默认以“r”模式打开,当文件不存在时,则会报错 关闭文件1f.close() 写文件12345f = open("test.txt", "w")f.wri...
函数1 函数定义和调用123456789# 函数定义def printinfo(): print("--------------------") print(" Hello World ") print("--------------------")# 函数调用printinfo() 带参数的 12...
1 循环语句1.1 for循环12345678910for i in range(5): print(i)'''结果:01234''' 123456789for i in range(0, 10, 3): #从0开始,到10结束,每次加3 print(i)'''结果:0369'...