用Wget下载文件
从网络上提取数据是数据科学家的重要任务之一。Wget是一个免费的实用程序,可以用于从网络上下载非交互式的文件。它支持HTTP、HTTPS和FTP协议,以及通过HTTP的代理进行文件检索。由于它是非交互式的,即使用户没有登录,它也可以在后台工作。所以下次当你想要下载一个网站或者一个页面上的所有图片时,wget可以帮助你。
一、安装
1 | pip install -i https://pypi.tuna.tsinghua.edu.cn/simple wget |
二、使用
1 | import wget, tarfile |