perl循环调用python爬虫批量下载喜马拉雅音频
2018-09-16 本文已影响68人
了尘兰若
手机下载喜马拉雅音频后,获得的音频文件虽然可以转成mp3格式,但其文件名却是一长串字符串,无法辨别是哪一集,网上找了各种工具,都有局限性,庆幸的是发现了一个python爬虫可以在电脑上实行批零下载文件名正确的音频,项目地址如下:
xmlyfetcher用于下载喜马拉雅歌曲资源,可以下载单个音频资源,也可以下载整个专辑. 项目地址:https://github.com/smallmuou/xmlyfetcher
运行之后发现一个小问题,该脚本只能爬取一页的内容,于是写了一个perl脚本循环调用该爬虫,实现一个脚本下载一部作品。脚本如下,运行前做适当修改(专辑地址、保存路径、页数):
#!/usr/bin/perl
use strict;
use warnings;
my $url = "https://www.ximalaya.com/youshengshu/16951017/";#专辑地址
my $dir = "/mnt/e/BaiduYunDownload/Ximalaya/daomubiji2";#文件保存路径,提前创建
my $num = 29;#专辑总页数
for (my $i=1;$i<=$num;$i++) {
my $url2 = $url . "p$i/";
system ("xmlyfetcher -o $dir $url2");
}