12306火车票余票查询器 今天写了一个12306火车票余票查询器的爬虫,在这里记录一下过程. 本博客同步更新:http://blog.csdn.net/riba2534 首先先看一下最终效果: 比如想查9月2日从西安&…
分类:网络爬虫
HDU自动AC机,八小时爬上杭电首页
身为一个ACMer,整天面对电脑屏幕,一个题冥思苦想一整天,调bug调到绝望,看着自己可怜的AC数,想想都很绝望~ 那么在学习之余我们也应该做一些有趣的事情,比如说 自动AC? 体验体验AC的快感,最然是假的(捂脸) 说…
记一个小小的小说爬虫
首先发现了一个网站:http://www.qb5200.org/ 页面整洁干净,没什么广告,然后里面有很多小说,但是我在TXT格式下载的时候又发现打不开下载链接,但是网页观看体验不好,没办法,只能借助爬虫了 随便用一本小…
Python网络爬虫与信息提取(三):网络爬虫之实战
此系列笔记来源于 中国大学MOOC-北京理工大学-嵩天老师的Python系列课程 7. Re(正则表达式)库入门 regular expression = regex = RE 是一种通用的字符串表达框架,用来简洁表达一…
Python网络爬虫与信息提取(二):网络爬虫之提取
此系列笔记来源于 中国大学MOOC-北京理工大学-嵩天老师的Python系列课程 4. Beautiful Soup库入门 Beautiful Soup库可对HTML/XML格式进行解析并提取相关信息 安装:管理员方式打…
Python网络爬虫与信息提取(一):网络爬虫之规则
此系列笔记来源于 中国大学MOOC-北京理工大学-嵩天老师的Python系列课程 1. Requests库入门 安装:管理员方式打开CMD-输入pip install requests 安装Requests库 Reque…