04-sourcemap的原理和作用
学习调试,sourcemap 是绕不开的概念,有了它才能直接调试源码。
这一节,我们就来探究下 sourcemap:
什么是 sourcemap
sourcemap 是关联编译后的代码和源码的,通过一个个行列号的映射。
比如编译后代码的第 3 行第 4 列,对应着源码里的第 8 行第 5 列这种,这叫做一个 mapping。
sourcemap 的格式如下:
{
version : 3,
file: "out.js",
sourceRoot : "",
sources: ["foo.js", "bar.js"],
names: ["a", "b"],
mappings: "AAgBC,SAAQ,CAAEA;AAAEA",
sourcesContent: ['const a = 1; console.log(a)', 'const b = 2; console.log(b)']
}
- version:sourcemap 的版本,一般为 3
- file:编译后的文件名
- sourceRoot:源码根目录
- names:转换前的变量名
- sources:源码文件名
- sourcesContent:每个 sources 对应的源码的内容
- mappings:一个个位置映射
为什么 sources 可以有多个呢?
因为可能编译产物是多个源文件合并的,比如打包,一个 bundle.js 就对应了 n 个 sources 源文件。
重点是 mappings 部分:
mappings 部分是通过分号;
和逗号 ,
分隔的:
mappings:"AAAAA,BBBBB;CCCCC"
一个分号就代表一行,这样就免去了行的映射。
然后每一行可能有多个位置的映射,用 ,
分隔。
那具体的每一个 mapping 都是啥呢?
比如 AAAAA 一共五位,分别有不同的含义:
- 转换后代码的第几列(行数通过分号 ; 来确定)
- 转换前的哪个源码文件,保存在 sources 里的,这里通过下标索引
- 转换前的源码的第几行
- 转换前的源码的第几列
- 转换前的源码的哪个变量名,保存在 names 里的,这里通过下标索引
然后经过编码之后,就成了 AAAAA 这种,这种编码方式叫做 VLQ 编码。
sourcemap 的格式还是很容易理解的,就是一一映射编译后代码的位置和源码的位置。
各种调试工具一般都支持 sourcemap 的解析,只要在文件末尾加上这样一行:
//@ sourceMappingURL=/path/to/source.js.map
运行时就会关联到源码:
除了调试的时候会使用 sourcemap,线上报错定位源码也需要用到:
开发时会使用 sourcemap 来调试,但是生产可不会,但是线上报错的时候确实也需要定位到源码,这种情况一般都是单独上传 sourcemap 到错误收集平台。
比如 sentry 就提供了一个 @sentry/webpack-plugin 支持在打包完成后把 sourcemap 自动上传到 sentry 后台,然后把本地 sourcemap 删掉。还提供了 @sentry/cli 让用户可以手动上传。
平时我们至少在这两个场景(开发时调试源码,生产时定位错误的源码位置)下会用到 sourcemap。
sourcemap 只是位置的映射,可以用在任何代码上,比如 JS、TS、CSS 等,而且 TS 的类型也支持 sourcemap:
指定了 declaration 会生成 d.ts 的声明文件,还可以指定 declarationMap 来生成 sourcemap:
这样在 VSCode 里我们就可以直接点击某个类型来跳转到源码里对应的地方了。
这也算 sourcemap 应用的另一个场景,用于生成的类型和源码中定义的关联。
知道了什么是 sourcemap,那 sourcemap 是怎么生成的呢?
sourcemap 的生成
编译工具在生成代码的时候也会生成 sourcemap:
其实 sourcemap 就是由一个个位置的映射组成的,关键就是要知道源码的哪个位置对应到了编译后代码的哪个位置:
通过 astexplorer.net 可以看到,AST 中保留了源码中的位置,这是 parser 在 parse 源码的时候记录的。
然后进行 AST 的各种转换之后会打印成目标代码,打印的时候是一行行一列列的拼接字符串,这时候就有了目标代码中的位置。
这两个位置一关联,那不就是一个 mapping 么?
这样就生成了 sourcemap。
当然 sourcemap 有对应的格式和编码,自己生成还是挺麻烦的,我们会用 source-map 这个包:
source-map 可以用于生成和解析 sourcemap,它暴露了 SourceMapConsumer、SourceMapGenerator、SourceNode 3个类,分别用于消费 sourcemap、生成 sourcemap、创建源码节点。
生成 sourcemap 的流程是:
- 创建一个 SourceMapGenerator 对象
- 通过 addMapping 方法添加一个映射
- 通过 toString 转为 sourcemap 字符串
const { SourceMapGenerator } = require('source-map');
const map = new SourceMapGenerator({
file: "source-mapped.js"
});
map.addMapping({
generated: {
line: 10,
column: 35
},
source: "foo.js",
original: {
line: 33,
column: 2
},
name: "christopher"
});
console.log(map.toString());
消费 sourcemap 用 SourceMapConsumer 的 api。
可以调用 originalPositionFor 和 generatedPositionFor 分别用目标代码位置查源码位置和用源码位置查目标代码位置
还可以通过 eachMapping 遍历所有 mapping,对每个进行处理。
const { SourceMapConsumer } = require('source-map');
const rawSourceMap = {
version: 3,
file: "min.js",
names: ["bar", "baz", "n"],
sources: ["one.js", "two.js"],
sourceRoot: "http://example.com/www/js/",
mappings: "CAAC,IAAI,IAAM,SAAUA,GAClB,OAAOC,IAAID;CCDb,IAAI,IAAM,SAAUE,GAClB,OAAOA"
};
(async function() {
await SourceMapConsumer.with(rawSourceMap, null, consumer => {
// 目标代码位置查询源码位置
consumer.originalPositionFor({
line: 2,
column: 28
})
// { source: 'http://example.com/www/js/two.js',
// line: 2,
// column: 10,
// name: 'n' }
// 源码位置查询目标代码位置
consumer.generatedPositionFor({
source: "http://example.com/www/js/two.js",
line: 2,
column: 10
})
// { line: 2, column: 28 }
// 遍历 mapping
consumer.eachMapping(function(m) {
console.log(m);
});
});
})();
这些 api 还是很容易理解的。
知道了位置从哪里来,知道了怎么用 source-map 的包生成 sourcemap,那就知道了平时我们用的 sourcemap 是怎么来的了。
我们用到的 webpack、babel 等等工具的 sourcemap 的生成和消费都是用的 source-map 这个包,大家也可以把小册仓库的代码下下来跑跑试试。
更详细的介绍可以看 source-map 这个包的文档。
总结
这节我们学习了 sourcemap,它是通过一个个行列号的映射来关联编译后的代码和源码的。
调试的时候会使用 sourcemap,这样可以直接在源码打断点调试。
线上报错的时候会使用 sourcemap 来映射到源码,我们会把 sourcemap 单独上传 sentry 等错误收集平台。
生成的类型也可以通过 sourcemap 关联到对应的源码中的定义
sourcemap 是挺常见的,并且用途也很多。
它的生成可以通过 source-map 包的 api,而 mapping 的位置来源可能是源码 parse 后的 AST 中的位置信息和打印代码时计算出的位置信息的关联。
理解了 sourcemap 的作用,就知道为什么调试离不开 sourcemap 了。