需要一些帮助将PHP的base64解码脚本“翻译”成Python

0 投票
1 回答
619 浏览
提问于 2025-04-16 10:23

我一直在尝试把一个叫做simplesamlphp的东西连接到我的django应用上。

我快成功了……不过我需要在Python中复制这个php脚本的功能:

我已经把php中$raw变量的内容复制到64.rtf文件里。但是当我运行Python的对应代码时,出现了一个错误,提示:

TypeError: Incorrect padding

PHP代码:

function getValue($raw) {

    $val = $raw;

    $url = parse_url($raw, PHP_URL_QUERY);
    if (!empty($url)) $val = $url;

    $arr = array();
    $query = parse_str($val, &$arr);

    #echo('<pre>');print_r($arr);

    if (array_key_exists('SAMLResponse', $arr)) return $arr['SAMLResponse'];
    if (array_key_exists('SAMLRequest', $arr)) return $arr['SAMLRequest'];
    if (array_key_exists('LogoutRequest', $arr)) return $arr['LogoutRequest'];
    if (array_key_exists('LogoutResponse', $arr)) return $arr['LogoutResponse'];

    return rawurldecode(stripslashes($val));
}

function decode($raw) {
    $message = getValue($raw);
    #echo 'using value: ' . $message; exit;

    $base64decoded = base64_decode($message);
    $gzinflated = gzinflate($base64decoded);
    if ($gzinflated != FALSE) {
        $base64decoded = $gzinflated;
    }
    $decoded = htmlspecialchars($base64decoded);
    return $decoded;
}    

到目前为止,我在Python中只写出了这个:

string64 = open("64.rtf", "rU").read()
decodedstring = base64.b64decode(string64,)

我到底哪里没搞明白?是rawurldecode(stripslashes那部分吗?还是url_parser?

这些到底有什么作用,为什么对解码这么重要?

希望你能帮忙。谢谢……

1 个回答

0

这就是它的全部内容。

#!/usr/bin/env python

import base64
import zlib
import cgi
import urlparse

def getValue(raw):
    args = urlparse.parse_qs(urlparse.urlparse(raw).query)
    keys = ['SAMLResponse', 'SAMLRequest', 'LogoutRequest', 'LogoutResponse']
    for key in keys:
        if key in args: return args[key][0]

def decode(raw):
    message = getValue(raw)
    message = message + "=" * (4 - len(message) % 4)
    base64decoded = base64.b64decode(message)
    try:
        base64decoded = zlib.decompressobj().decompress('x\x9c' + base64decoded)
    except zlib.error:
        pass # may want to handle this error
    return cgi.escape(base64decoded, True)

data = 'PHNhbWxwOlJlc3BvbnNlIHhtbG5zOnNhbWxwPSJ1cm46b2FzaXM6bmFtZXM6dGM6U0FNTDoyLjA6cHJvdG9jb2wiIHhtbG5zOnNhbWw9InVybjpvYXNpczpuYW1lczp0YzpTQU1MOjIuMDphc3NlcnRpb24iIElEPSJwZnhkYTAxMjkzOC03MDkxLWNjZjQtZTc2Ny0wZWQ4OGVhN2Q1YmYiIFZlcnNpb249IjIuMCIgSXNzdWVJbnN0YW50PSIyMDExLTAxLTIxVDEyOjI4OjI5WiIgRGVzdGluYXRpb249Imh0dHBzOi8vd2F5Zi5teWRvbWFpbi5kay9zaW1wbGVzYW1sL3NhbWwyLW15bG9naW4ucGhwIiBJblJlc3BvbnNlVG89Il82ZDhmNDAxZDUzYTg1NDkzMzY2N2FiNWU5NzE1NWNmMzJjYWExMjBkZDciPjxzYW1sOklzc3Vlcj5odHRwczovL3Rlc3RicmlkZ2Uud2F5Zi5kazwvc2FtbDpJc3N1ZXI'

url = "http://www.google.com?SAMLResponse=" + data
print decode(url)

你在尝试解码你的字符串时出现错误,是因为这个字符串并不是一个真正的base64编码。base64编码的数据长度总是能被4整除,而你的字符串不能。为了让字符串的长度能被4整除,会在字符串的末尾加上'='字符。在你的情况下,长度除以4的余数是3。所以,我们需要在字符串的末尾加一个'=',这样才能正确解码。

撰写回答