ubuntu软件推荐:Web站点抓取工具webhttrack

近来发现Ubuntu下一个很好用的web站点抓取工具webhttrack,能够将给定网址的站点抓取到本地的目录中,并实现离线浏览,很实用。

1、安装webhttrack

ubuntu 16.04的官方源中就有该工具。
$ sudo apt-get install webhttrack

2、启动webhttrack

技术分享图片
$ webhttrack
该命令会启动浏览器,打开一个页面,引导用户一步一步配置要抓取站点相关的信息。如下图所示,将openstack官网上的安装指南站点全部抓取到本地一个目录中。
技术分享图片
离线浏览抓取到本地目录下的web站点内容,和原站点一模一样,如下图所示。

发表评论

项目已添加到购物车。
0 项 - ¥0.00