自己动手编写CSDN博客备份工具-blogspider之源码分析(2)
来源:http://blog.csdn.net/gzshun
唐僧:你想要啊?悟空,你要是想要的话你就说话嘛,你不说我怎么知道你想要呢,虽然你很有诚意地看着我,可是你还是要跟我说你想要的。你真的想要吗?那你就拿去吧!你不是真的想要吧?难道你真的想要吗?……
悟空:我Kao!
在开篇,先happy下,有个好心情,才能天天向上,奋发图强,自强不息。
继《自己动手编写CSDN博客备份工具-blogspider》与《自己动手编写CSDN博客备份工具-blogspider之源码分析(1)》博文后,继续贴出处理的一些函数,原理很简单。
一.在博客的下载过程中,打印了一些信息到屏幕,也保存到了*.log文件
唐僧:喂喂喂!大家不要生气,生气会犯了嗔戒的!悟空你也太调皮了,我跟你说过叫你不要乱扔东西,你怎么又…你看我还没说完你又把棍子给扔掉了!月光宝盒是宝物,你把他扔掉会污染花草草也是不对的!
二.申请了空间,在程序结束后必须释放,要不内存泄露了,污染到内存,污染到花花草草也是不对的.
三.下载个人博客的主页,并分析出必要的信息,比如下载:http://blog.csdn.net/gzshun主页,程序将该文件保存到了本地的"index.html"文件中,先贴出一点html文件的源码,这样就更加清晰的了解代码的字符串解析:
博客标题:
博客的总页数:
博客的排名,积分信息:
贴出源码,这几个字符串解析函数没必要看,自己看下html的规则就能解析出来了:
以上使用了rank_info_addr数组,是为了在while (fgets(line, sizeof(line), fp)) 循环里面方便赋值。
博客里面可能有很多页,必须我的博客就有2页,这时候网址是这样:
http://blog.csdn.net/gzshun/article/list/1
http://blog.csdn.net/gzshun/article/list/2
所以循环下载blog.csdn.net对应自己的博客列表就行,网页文件的名称如:/gzshun/article/list/1 把gzshun改为自己的csdn的id就是了。
先来杯咖啡,待下一篇文章,前几天奔波在火车上,辛苦啊,今天及时赶到,马上发表,持之以恒。。
推荐阅读
-
自己动手编写CSDN博客备份工具-blogspider
-
自己动手编写CSDN博客备份工具-blogspider之源码分析(1)
-
自己动手编写CSDN博客备份工具-blogspider源码下载(4)
-
自己动手编写CSDN博客备份工具-blogspider之源码分析(3)
-
自己动手编写CSDN博客备份工具-blogspider源码下载(4)
-
自己动手编写CSDN博客备份工具-blogspider之源码分析(2)
-
自己动手编写CSDN博客备份工具-blogspider之源码分析(1)
-
自己动手编写CSDN博客备份工具-blogspider
-
自己动手编写CSDN博客备份工具-blogspider之源码分析(3)
-
自己动手编写CSDN博客备份工具-blogspider之源码分析(2)