TOC

转载：Golang 自举

作者： InfoQ 原文链接 (Google 公布实现 Go 1.5 自举的计划)
日期： 2021-01-30
标签： Golang

Google最近公布了实现Go 1.5自举（Bootstrap）的计划。相关文档的作者是Go核心开发者Russ Cox，他在Go语言上已经耕耘了接近6年。据Russ介绍，Google就“如何从Go源码树中去除所有的C程序”已经酝酿了一年。

自举（Bootstrapping）是这样的过程，“用要编译的目标编程语言编写其编译器（或汇编器）”。一般而言，自举有几个优势，比如：

用于测试被自举的语言；
支持使用通常更为高级、提供更多高级抽象的语言来编写编译器；
编译器也可以得益于语言层面的任何改进。

如前所述，Google在一年前就开始了从Go源码树中去除C代码的努力，转换计划分为5个步骤：

第 1 阶段——开发一个从 C 语言到 Go 语言的翻译器，将现有的 C 编译器翻译成 Go 语言的。
这一阶段利用了一个事实：原来的编译器没有大量使用一些很难移植到 Go 语言的特性，比如宏、联合和指针运算等。
第 2 阶段——转换编译器的源码树，得到一个 Go 语言的编译器，但是比较原始，而且是 C 风格的。
第 3 阶段——将前面得到的编译器转换为符合 Go 语言习惯的程序，主要通过识别包，添加文档和单元测试实现。
第 4 阶段——优化编译器，解决编译器和 CPU 的内存使用问题，可能引入并行化。
此外，尝试在今天使用的不依赖架构的无序树（Node*s）和依赖架构的有序列表（Prog*s）之间引入一个新的中间表示，目的是改进编译器在消除冗余的 nil 检查和边界检查等情况下的优化能力。
第 5 阶段——用最新版的 go/parser 和 go/types 替换前端。

Russ提到，他们还考虑了一些替代方案，不过基于各种因素都排除了，在一年前的这份文档中都有描述。

Go 的自举

编译器的自举通常会引发 “先有鸡还是先有蛋” 的问题，必须提供一种方式来编译我们要创建的语言。

Go 的情况是，要构建 Go 1.5，必须先安装 Go 1.4 或更高版本，然后使用现有的 Go 工具链创建 Go 1.5 工具链的一个基本版本。一旦有了（Go 1.4）编译的 Go 1.5 工具链，就可以再用它来构建自身了，可以进一步用它构建 go_bootstrap 和其余的标准库和标准组件。这个过程加入了一个中间步骤——生成的工具链再被用于构建其自身，它可以应用于未来的任何 Go 版本。

为进一步了解 Go 实现自举的计划，InfoQ 采访了 Russ。

实现自举看上去是 Go 语言的一个很大的里程碑。在语言的演进过程中，为什么决定在这个阶段做这个事情呢，可以详细介绍一下吗？

Go 是一门不错的通用语言，但在设计时考虑的适用场合是编写大规模、高并发的服务端软件，就像运行在 Google 的服务器上的那些。如果更早实现自举，Go 编译器就是第一个大型的 Go 语言程序，这对语言设计存在不利影响，会让我们远离真正的目标。
没有更早实现自举，还有一些技术原因，比如可移植性，从源代码编译比自举更容易，而且我们也能尽早有一个稳定的编译器实现。

使用 Go 来构建 Go，与使用 C 相比，你认为对哪些具体领域有较为明显的改进？

Ken Thompson 曾经对我说，用 Go 编写程序感觉比用 C 更简单。一个原因是，Go 消除了好几类常见的 C bug，比如悬挂指针、内存泄漏、缓冲区溢出、深度递归时的栈溢出、误用 void* 和意外的数值转换等。
与任何标准的C工具链相比，标准的 Go 工具链对模块化、单元测试和性能分析支持更好，不过让我最兴奋的是在修改内部API或重构时，应用自动化程序重写（如 gofix）的前景。

在 “Go 1.3+ Compiler Overhaul” 这篇文档中，你描述了分 5 个步骤将现有的编译器从 C 迁移到 Go 的过程。请问到目前为止，已经完成了哪些步骤了？其余步骤打算何时完成？

对 Go 项目而言，将语言的运行时从 C 转换到 Go 更为重要，所以我们先做了这个。现在我们正回到编译器。
从文档角度看，我们目前处于第 2 阶段。翻译器已经完成，而且帮助我们转换了运行时。我们正在将其应用于编译器。我们希望完成 Go 1.5 编译器的转换。清理工作会在 Go 1.5 之后的项目中进行。

查看英文原文：Google Aims at Bootstrapping Go 1.5

<p>原文底部有申明：未经许可不得转载。</p>

如果你有魔法，你可以看到一个评论框～

一	二	三	四	五	六	日