前言

想必大家日常开发中经常碰到小数相加结果不准确的坑,也都知道这是因为精度丢失导致的,更是知道能通过一些库,比如 big.js、decimal.js 等解决,但是你知道它们是怎么解决的吗?

今天我带大家一步步分析 big.js 部分源码,帮助大家理解这类库对精度丢失的处理方式。

初窥门径 —— 打开调试窗口

<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Document</title>
<script src='https://cdn.jsdelivr.net/npm/big.js@6.2.1/big.min.js'></script>
</head>
<body>
<script>
new Big(0.1);
</script>
</body>
</html>

我们可以通过 F12 或者 Ctrl+Shift+I 打开 Chrome DevTool。

big.js 如何解决精度丢失问题源码解析

在 Sources 标签的 Page 项里,找到未混淆的代码文件 big.js(xxx.min.js 文件一般是压缩混淆后的代码,可读性不高),这个就是我们要用到的完整源码了。

知根知底 —— Big 构造函数做的好事

我们先来看看 Big 构造函数做了什么事。

function _Big_() {
function Big(n) {
var x = this;
// 可以通过函数调用的形式来创建 Big 对象
if (!(x instanceof Big)) return n === UNDEFINED ? _Big_() : new Big(n);
// 区分是否为 Big 示例.
if (n instanceof Big) {
x.s = n.s;
x.e = n.e;
x.c = n.c.slice();
} else {
// 边界处理
if (typeof n !== 'string') {
if (Big.strict === true && typeof n !== 'bigint') {
throw TypeError(INVALID + 'value');
}
// Minus zero?
n = n === 0 && 1 / n < 0 ? '-0' : String(n);
}
parse(x, n);
}
x.constructor = Big;
}
...
return Big;
}

可以发现,一开始的时候,构造函数进行了 边界处理 以及 入参检查 ,随后通过 parse 函数处理,最后修正构造函数的指向。

我们先将 this 对象添加进 watches 里,接着 parse 函数后的位置打个断点然后刷新。

big.js 如何解决精度丢失问题源码解析

看看经过 parse 函数生成的数据:

big.js 如何解决精度丢失问题源码解析

其中,c 是去除首尾的 0 之后的所有数字组成的数组,e 表示用科学计数法表示 parse 函数的入参 x 时 幂的值 ,s 表示正负(1 表示正数,-1 表示负数)。

new Big(120) 举个例子,去除首尾 0 后,c 属性的值为 [1, 2]

入参 x = 120,用科学计数法表示就是 1.2 * 10²e 的值就是 幂 ,也就是 2,显然 s = 1。同理,new Big(1.2) 对应的值就是 c = [1, 2], e = 0(1.2 * 10º), s = 1

显然,parse 函数用来处理数据,为后续的运算做准备。

对细节感兴趣的小伙伴可以通过 Ctrl + F 快捷搜索研究一下。

big.js 如何解决精度丢失问题源码解析

到此为止,我们已经窥得 Big 构造函数的全貌,接下来我们看看 plus/add 方法做了什么吧。

抽丝剥茧 —— P.plus 源码分析

老方法,Ctrl+F 搜索 P.plus 后回车,跳转到该方法在文件中所在的位置。

完整源码

P.plus = P.add = function (y) {
// 1. 用 x 和 Big 两个变量分别保存 this(调用者) 和 Big 构造函数
var e, k, t,
x = this,
Big = x.constructor;
// 2. 将入参转化为 Big 对象
y = new Big(y);
// 3. 判断是否符号不同,如果不同则直接调用 minus 做减法(1 + (-1)=== 1 - 1)
if (x.s != y.s) {
y.s = -y.s;
return x.minus(y);
}
// 4. 分别存储 x 和 y 各自的小数点位置以及 number 数组
var xe = x.e,
xc = x.c,
ye = y.e,
yc = y.c;
// 5. Either zero?
if (!xc[0] || !yc[0]) {
if (!yc[0]) {
if (xc[0]) {
y = new Big(x);
} else {
y.s = x.s;
}
}
return y;
}
// 6. copy xc 数组
xc = xc.slice();
// 7. 补 0(对齐 x 和 y 的长度)
// Prepend zeros to equalise exponents.
// Note: reverse faster than unshifts.
if (e = xe - ye) {
if (e > 0) {
ye = xe;
t = yc;
} else {
e = -e;
t = xc;
}
t.reverse();
for (; e--;) t.push(0);
t.reverse();
}
// 8. 如果 xc 长度大于 yc,则交换它们
// Point xc to the longer array.
if (xc.length - yc.length < 0) {
t = yc;
yc = xc;
xc = t;
}
e = yc.length;
// 9. 相加
// Only start adding at yc.length - 1 as the further digits of xc can be left as they are.
for (k = 0; e; xc[e] %= 10) k = (xc[--e] = xc[e] + yc[e] + k) / 10 | 0;
// No need to check for zero, as +x + +y != 0 && -x + -y != 0
if (k) {
xc.unshift(k);
++ye;
}
// Remove trailing zeros.
for (e = xc.length; xc[--e] === 0;) xc.pop();
y.c = xc;
y.e = ye;
return y;
};

步骤 1 —— 变量定义

big.js 如何解决精度丢失问题源码解析

步骤 1 中使用 xBig 两个变量分别保存 this(调用者) 和 Big 构造函数。

步骤 2 —— 处理入参

big.js 如何解决精度丢失问题源码解析

步骤 2 中将入参 y 转为 Big 实例。

步骤 3 —— 判断符号

big.js 如何解决精度丢失问题源码解析

步骤 3 中对判断 xy 的符号是否不同,如果不同的话,会先将 y 取反,调用 minus 方法处理,因为 一个数加上一个负数相当于减去这个负数取反(就是 1+(-1)===1-1 的道理)。

这里显然符号相同,因此继续走下去。

步骤 4 —— 保存属性

big.js 如何解决精度丢失问题源码解析

步骤 4 中将 xy 的数字数组和符号位置都保存起来,至于作用是啥我也不知道,我也才调试到这呢,继续往下看。

步骤 5 —— 处理值为 0 的情况

big.js 如何解决精度丢失问题源码解析

步骤 5 的 if 看来是进不去了,我们自己分析一下吧。

if 的判断条件是 !xc[0] || !yc[0],诶,这就用到了步骤 4 的变量了。xc 就是 x 的数字数组(就是 big 实例的 c 属性),yc 同理。这里大家注意一下,经过构造函数调用 parse 解析之后,实际上是已经移除首尾的 0 了,那么 !xc[0]!yc[0] 怎么可能为 true ?那肯定是有段逻辑让它变成了 0 咯,直接看源码,果然被我揪到了。

function parse(x, n) {
...
// Determine leading zeros.
for (i = 0; i < nl && n.charAt(i) == '0';) ++i;
if (i == nl) {
// Zero.
x.c = [x.e = 0];
} else {
// Determine trailing zeros.
for (; nl > 0 && n.charAt(--nl) == '0';);
x.e = e - i - 1;
x.c = [];
// Convert string to array of digits without leading/trailing zeros.
for (e = 0; i <= nl;) x.c[e++] = +n.charAt(i++);
}
...
}

很明显的,它都给出注释了,当实例化时入参 x 判定为 0 的时候,x.c 和 x.e 都会被置为 0 。那步骤 5 很显然就是个 提前返回操作 ,直接返回和 0 相加的结果。

步骤 6 —— 拷贝 xc 防止数据污染

big.js 如何解决精度丢失问题源码解析

步骤 6 中拷贝了一份 xc 数组,防止数据污染。

步骤 7 —— 补 0 对齐

big.js 如何解决精度丢失问题源码解析

这段代码的作用是 补0 ,为的是对齐 xy 的长度,这样方便后续 按位置进行运算(有没有做过大整数加法的小伙伴?里面有个补 0 对齐的操作)。

举个例子,比如 big(1.2).plus(120),那么 t = xc = [1, 2],执行 reverse + push + reverse 后就是 [0, 0, 1, 2] 和 [1, 2, 0, 0]

步骤 8 —— 比较 xc 和 yc 的长短

big.js 如何解决精度丢失问题源码解析

步骤 8 中,将 xc 指向长度较长的数组,yc 指向较短的数组,且将较短的 yc.lengthe 存储起来。

步骤 9 —— plus 操作

big.js 如何解决精度丢失问题源码解析

步骤 9 就是正戏了,到这里真正开始了 plus 操作。

这里有点大整数相加的意思,为了让大家理解,我饭都不吃肝了个动图。

big.js 如何解决精度丢失问题源码解析

这下大家知道为什么要将 xc 指向较长的数组,而将 yc 指向较短的数组了吧,因为较短的数组前面都是 0,实际上这些 0 都没必要进行相加处理了。

至此,我们的 P.plus 的源码就分析结束了。

终章

本文就到此结束了,总览这个解析过程,我们可以发现 big.js 的加法操作,就是 将小数全部变成整数,然后进行相加 。你不是小数运算会丢失精度吗,那我都变成整数不就好了,计算完我再变回小数,更多关于big.js 解决精度丢失的资料请关注本站其它相关文章!

发表回复