如何打包下载一个sina的博客

目前为止还没有发现那样的工具,最简单的办法就是自己编一个程序,如同网络中的Spider一样,根据某些特征不断去抓取下载自己博文内容,然后打包,就这么简单。给你提供点编程思路:

1. 下载自己博客首页;

2. 从页面中将所需的链接提取出来,保存到一个文件。

3. 读取文件的内容,使用其中的链接下载其它网页。

4. 从新下载的网页中提取所需的链接,附加到文件的后面。

5. 重复3、4步骤,直到把所有博文全部下载。

6. 重新整理所下载的网页,去掉其中的HTML标签,再保存为.txt文件。