NodeJS模块研究 - querystring

querystring 是专门用来解析和格式化 URL 的查询字符串 URL 的工具。

  • 序列化和解析查询字符串
  • 不同语言的兼容处理
  • 百分比编码的原理

🔍 关注公众号“心谭博客” / 👉 查看原文: xxoo521.com

序列化和解析查询字符串

形如w=%D6%D0%CE%C4&foo=bar的字符串,就符合查询字符串的格式。querystring 提供了两种 api,一类用于序列化(编码),简单来说就是json => url查询字符串;另一类用于解析(解码),简单来说就是 url查询字符串 => json

  • 序列化 API:querystring.encode()querystring.stringify(),两者完全一样
  • 解析 API:querystring.decode()querystring.parse(),两者完全一样
const querystring = require("querystring");

const params = {
    foo: "bar",
    baz: ["qux", "quux"],
    corge: ""
};

// output: foo=bar&baz=qux&baz=quux&corge=
console.log(querystring.encode(params));

不同语言的兼容处理

由于不同的语言中,百分比的编码规则有区别。例如对字符串 心 谭 来说:

  • 在 java 中,空格换成+号,结果是%E5%BF%83+%E8%B0%AD
  • 在 js 中,空格换成字节码,结果是%E5%BF%83%20%E8%B0%AD

在 querystring.encode() 和 querystring.decode() 接口中,可以使用特殊的百分比编解码函数。

const params = {
    key: "原文地址: http://xxoo521.com/#"
};

querystring.stringify(params, {
    encodeURIComponent: encodeURI // 覆盖默认的百分比编码函数
});

querystring.parse("xxoo521.com%2F%23", {
    decodeURIComponent: decodeURI // 覆盖默认的百分比解码函数
});

百分比编码的原理

前面有提到百分比编码,也就是 js 中常用的 encodeURIComponent 函数。它的编码规则如下:

  • 部分字符不编码:abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789-_.!~*'()
  • 其他字符:获得 16 进制的字节码(大写),每个字节前添加%

代码如下:

/**
 * 将单个字符按编码要求处理成百分比字节码
 * @param {string} ch
 */
function chToHex(ch) {
    const buf = Buffer.from(ch, "utf8");
    let hex = "";
    for (let i = 0; i < buf.byteLength; ++i) {
        hex = hex + "%" + buf[i].toString(16).toLocaleUpperCase();
    }
    return hex;
}

const chs =
    "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789-_.!~*'()";

/**
 * @param {string} str
 * @return {string}
 */
function myEncodeURIComponent(str) {
    if (str === null || !str.trim().length) {
        return str;
    }

    let ans = "";
    const length = str.length;
    for (let i = 0; i < length; ++i) {
        if (chs.includes(str[i])) {
            ans += str[i];
        } else {
            ans += chToHex(str[i]);
        }
    }
    return ans;
}

对于原文地址:心谭博客这段字符串的编码结果是:

%E5%8E%9F%E6%96%87%E5%9C%B0%E5%9D%80%EF%BC%9A%E5%BF%83%E8%B0%AD%E5%8D%9A%E5%AE%A2

参考链接

评论

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×