单线程版本

import requests
from bs4 import BeautifulSoup

url = 'https://inst.eecs.berkeley.edu/~ee127/fa19/Lectures/'
page = requests.get(url).content

soup = BeautifulSoup(page, 'html.parser')

links = soup.find_all('a')
for link in links:
	href = link.get('href')
	if href.endswith('.pdf'):
		file_url = url + href
		with open(href, 'wb') as f:
			f.write(requests.get(file_url).content)

下载25个文件，费时180秒左右。

多线程版本

对于这种国外网站，常常下载速度较慢，这种IO密集型的任务使用多线程就非常有必要了。

from threading import Thread
import requests
from bs4 import BeautifulSoup

def download(url, href):
	r = requests.get(url + href)
	with open(href, 'wb') as f:
		f.write(r.content)

url = 'https://inst.eecs.berkeley.edu/~ee127/fa19/Lectures/'
page = requests.get(url).content

soup = BeautifulSoup(page, 'html.parser')
links = soup.find_all('a')
threads = []
for link in links:
	href = link.get('href')
	if href.endswith('.pdf'):
		t = Thread(target=download, args=(url, href))
		threads.append(t)
		t.start()

for t in threads:
	t.join()

这时，下载同样的文件，只需12秒左右，效果还是很明显的。