2017-01-19 | Code | UNLOCK

简单Python抓取网页下载地址

下午,一哥们说要下载美剧《福尔摩斯:基本演绎法》,网页上几十个迅雷下载链接,嫌麻烦不愿一个一个点,我就建议了如下方法:

写个程序去抓取网页上有用的迅雷下载链接,再把全部链接复制到迅雷,就OK。

这里我用Python简单写了个。。。不喜勿喷。。。

抓取的网页:http://www.qtfy.cc/mjxz/13553.html

# -- coding: utf8 --
import urllib.request as request
from bs4 import BeautifulSoup

def geturl(href):
html = request.urlopen(href).read().decode(‘utf-8’)
html_Soup = BeautifulSoup(html, ‘lxml’)
a = html_Soup.find_all(‘a’)
for link in a:
if link.get(‘href’) is not None:
if “thunder” in link.get(‘href’) :
print(link.get(‘href’))
if “ed2k” in link.get(‘href’) :
print(link.get(‘href’))

if name == ‘main‘:
geturl(“http://www.qtfy.cc/mjxz/13553.html“)

简单易懂,达到想要的效果就行。

针对其他的电影网站下载链接,稍微改下即可。

评论加载中