Ins水军来袭--浅谈利用python爬虫批量注册ins

2261 查看

作者: 0han 关注我的公众号: enighan

python偏向脚本语言,是平时完成一些简单项目的很好的工具。今天我发现ins主页注册时,邮箱部分不需要验证,并且正则表达式设置非常简单,随便输入了一串字符dashfjhafjhd再加上@shabi.com都可以注册。所以我决定写一个脚本批量注册ins水军账号,然后再写个批量登陆ins操作一类的脚本,命令他们赞我照片 分分钟网红(为什么每个项目最初的目的都是那么简单粗暴直白。。。)。。。差点忘了说,ins可能国内上不了,反正能看到这篇文章的大多都是喜爱科学上网的主,哈哈。



首先我查了ins的api,没什么能用的,然后我就考虑直接用爬虫写,因为我有写过爬有道词典查单词然后自动生成生词本的经验。我所用的lib是requests库,官方手册很明了,而且有中文的看的不累。下面上部分代码,有经验的朋友一看就能自己写,由于这个脚本还没写完,为了保护我继续开发的热情我还是先不公布全部代码,而且在研究的过程中我遇到了一个难题,就是ajax,但偷偷透露给你们,面对这种反爬虫机制,在谷歌浏览器的开发者模式中直接把整个request-header给copy下来做成header就行了。顺便在告诉你们一个秘密,在我下面的post截图里的verify一定要=False,要不然会SSL Error 原因自己查当然我目前还没有加代理,最好我等会还是加一下。。。每注册四个账号换个ip一类的。。。毕竟我严谨嘛XD。。。



requests.post命令,参数如图

然后提交表单的data部分有四个选项,email,password,username,first_name。 这里面有几个正则机制,我是自己磨出来的,建议你们也自己摸,我直接告诉你们你们没感觉,email就如我文首所说,基本就是有@符号和.com就行了,password必须要大于6位数而且最好不要太简单,容易报错。username在人为注册时会自动替换成email@符号前的那些字符,但是人为操作时网页会帮你自动小写,所以作为机器人我们要有自知之明,记得加个.lower(),first_name好像可以随便写,正如我最后面成功的截图中采用林俊杰的“编号89757”,毕竟是个机器号嘛哈哈。建议first_name用人名,我目前的思路是从http://www.behindthename.com/random/一类的网站随机生成几百个名字然后储存成文档,要用时随机调用或者按顺序调用。不过没想那么多比如脚本的性能一类的。下面是为了批量生成用户名写的随机函数,自己带入程式看。



random随机函数,先别忘了import哟

最重要的一点就是将每次生成的账户,用户名(username)和密码(password)抽取出来储存在文本文档里,而且一定要逐行(\n)!!!这是为了方便后面批量登陆操作。如最后截图显示,成功后应该会返回一个ture,就代表成功了。这篇文章并没有写完,我还会继续开发并分享心得,全部完成时应该会公开发布,并且通过别的途径公布ins号(求涨活粉。。。)如果你感兴趣 请点喜欢,当然我不care这浮夸的功能,我更希望你有问题可以评论我,和我讨论。超欢迎的,hello world! guys!



命令行回传成功信息 以及我让他顺便把用户名和密码也print给我看下好让我在网页端登陆试试看这个account是不是真的成功存在了。

哈哈哈 第一个成功的机器人账号,编号89757先生(林俊杰wow)