** 廖雪峰python教程爬虫 **
-
早就想看一下python的语法,一直没时间。最近闲下来了,在廖雪峰的python教程里看了和python相关的一些语法,觉得python真的很神奇,比起java和c真的是简洁又优雅。奈何只学到皮毛,还需要不断深入才行。
-
光说不练哪行,于是就拿廖雪峰的官网开刀了..((^__^) 嘻嘻……).写了个简陋的爬虫,主要是为了熟悉一下python的语法。
-
爬虫主要是通过GET来获取http的body,然后过滤不必要的信息,最后通过html2text来进行转换成markdown格式.html2text的文档在Internet上并没有太多..目前遇到的问题是转换img链接的时候,链接过长会换行,折腾了好久还是没找到解决办法...
-
这个爬虫并没有任何的难度,纯属为了练习!!!