谈谈爬虫-模拟登录思路
谈谈爬虫-模拟登录思路
最近在做的 sideproject,需要网络上的文章数据。于是顺便学习了下爬虫技术,也算是有些心得体会。写下来分享给刚入坑的新人。 怎么理解模拟登录? 怎么理解模拟登录? 把这句话补全就是: 怎么(让机器)模拟(人在浏览器上的行为)登录(指定的网站)。 那么这个问题实际上问的是: 人通过浏览器登录网站时,浏览器为我们做了哪些事情。 那么我们需要做的只有:写一个脚本,让这个脚本模拟浏览器的行为,做我们希望它做的事情。 有兴趣参考: 当在浏览器地址栏输入一个URL后回车,将会发生的事情?