网站LOGO
静若安然
页面加载中
12月4日
网站LOGO 静若安然
记录个人学习生活和成长历程
菜单
  • 静若安然
    记录个人学习生活和成长历程
    用户的头像
    首次访问
    上次留言
    累计留言
    我的等级
    我的角色
    打赏二维码
    打赏博主
    php防爬虫模拟登录
    点击复制本页信息
    微信扫一扫
    文章二维码
    文章图片 文章标题
    创建时间
  • 一 言
    确认删除此评论么? 确认
  • 本弹窗介绍内容来自,本网站不对其中内容负责。

    php防爬虫模拟登录

    Akria · 原创 ·
    Web 安全 · Web安全
    共 2909 字 · 约 2 分钟 · 4419
    本文最后更新于2024年01月27日,已经过了312天没有更新,若内容或图片失效,请留言反馈

    爬虫模拟登录成为一种常见的技术手段,通过模拟登录,即可直接获取目标网站的数据,而不必单独爬取,为防止爬虫可采取以下3种方法

    验证码机制

    验证码是防止爬虫模拟登录的最简单有效的方法之一,通过在登录页面中加入验证码,可以防止大部分的爬虫工具,具体实现方法如下:

    • 在登录页面中加入验证码输入框和验证码图片
    php 代码:
    //login.php
    <?php
    session_start();
    $code = rand(1000,9999);
    $_SESSION["code"] = $code;
    $im = imagecreate(60, 20);
    $black = imagecolorallocate($im, 0, 0, 0);
    $white = imagecolorallocate($im, 255, 255, 255);
    imagestring($im, 5, 5, 2, $code, $white);
    header("Content-type: image/png");
    imagepng($im);
    imagedestroy($im);
    ?>
    //在表单中显示验证码图片和输入框
    <form action="check_login.php" method="post">
        <label>用户名:<input type="text" name="username"></label>
        <br>
        <label>密 码:<input type="password" name="password"></label>
        <br>
        <label>验证码:<input type="text" name="code"></label>
        img src="login.php" />//在前面添加<
        <input type="submit" value="登录">
    </form>
    • 在后台验证验证码是否正确
    php 代码:
    //check_login.php
    session_start();
    if(strtoupper($_POST["code"]) != $_SESSION["code"]) {
        echo "验证码错误";
    } else {
        //验证码正确,进行其他验证或操作
    }
    • 值得注意的是,此方法防止不了爬虫工具通过OCR技术解析验证码的攻击

    加密验证机制

    通过加密验证,可以防止爬虫工具直接获取登录接口的URL和参数,具体实现方法如下:

    • 获取加密密钥
    php 代码:
    //获取密钥
    $rand_str = substr(md5(uniqid()), 0, 6);
    $timestamp = time();
    $key = md5($rand_str . $timestamp);
    • 将密钥以及需要传递的参数进行加密处理
    php 代码:
    //加密
    $param = array("username" => "xxxx", "password" => "xxxx");
    $param_str = http_build_query($param);
    $encrypted_str = bin2hex(openssl_encrypt($param_str, 'AES-128-ECB', $key));
    • 将加密后的字符串以及密钥传递给后台验证
    php 代码:
    //传递
    $url = "http://xxx.com/check_login.php";
    $fields = array("param" => $encrypted_str, "key" => $key);
    $curl = curl_init();
    curl_setopt($curl, CURLOPT_URL, $url);
    curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($curl, CURLOPT_POST, 1);
    curl_setopt($curl, CURLOPT_POSTFIELDS, $fields);
    $res = curl_exec($curl);
    • 在后台进行解密验证
    php 代码:
    //check_login.php
    $key = $_POST['key'];
    $encrypted_str = $_POST['param'];
    $param_str = openssl_decrypt(hex2bin($encrypted_str), 'AES-128-ECB', $key);
    $param_arr = array();
    parse_str($param_str, $param_arr);
    $username = $param_arr['username'];
    $password = $param_arr['password'];

    此方法可以有效防止爬虫工具直接获取URL和参数,增加了攻击难度

    动态令牌机制

    通过动态令牌机制,可以防止爬虫工具通过抓包攻击获取登录接口的URL和参数。具体实现方法如下:

    • 在登录页面中加入动态令牌输入框
    php 代码:
    //login .php
    <?php
    session_start();
    $token = md5(uniqid());
    $_SESSION['token'] = $token;
    <form action="check_login.php" method="post">
        <label>用户名:<input type="text" name="username"></label>
        <br>
        <label>密 码:<input type="password" name="password"></label>
        <br>
        <label>动态令牌:<input type="text" name="token"></label>
        <input type="submit" value="登录">
    </form>
    ?>
    • 在后台验证动态令牌是否正确
    php 代码:
    //check_login.php
    <?php
    session_start();
    if($_POST['token'] != $_SESSION['token']){
        echo "动态令牌错误";
    }else{
        //动态令牌正确,进行其他验证或操作
    }
    ?>
    声明:本文由 Akria(博主)原创,依据 CC-BY-NC-SA 4.0 许可协议 授权,转载请注明出处。

    还没有人喜爱这篇文章呢

    我要发表评论 我要发表评论
    博客logo 静若安然 记录个人学习生活和成长历程 51统计 百度统计
    ICP 蜀ICP备2023037012号-1

    💻️ Akria 15小时前 在线

    🕛

    本站已运行 7 年 100 天 23 小时 10 分
    静若安然. © 2017 ~ 2024.
    网站logo

    静若安然 记录个人学习生活和成长历程