2017-01-19 | Code | Unlock

简单Python抓取网页下载地址

下午,一哥们说要下载美剧《福尔摩斯:基本演绎法》,网页上几十个迅雷下载链接,嫌麻烦不愿一个一个点,我就建议了如下方法:

写个程序去抓取网页上有用的迅雷下载链接,再把全部链接复制到迅雷,就OK。

这里我用Python简单写了个。。。不喜勿喷。。。

抓取的网页:http://www.qtfy.cc/mjxz/13553.html

# -*- coding: utf8 -*-
import urllib.request as request
from bs4 import BeautifulSoup

def geturl(href):
    html = request.urlopen(href).read().decode('utf-8')
    html_Soup = BeautifulSoup(html, 'lxml')
    a = html_Soup.find_all('a')
    for link in a:
        if link.get('href') is not None:
            if "thunder" in link.get('href') :
                print(link.get('href'))
            if "ed2k" in link.get('href') :
                print(link.get('href'))

if __name__ == '__main__':
    geturl("http://www.qtfy.cc/mjxz/13553.html")

简单易懂,达到想要的效果就行。

针对其他的电影网站下载链接,稍微改下即可。

评论加载中