今天,“Linux三剑客”中一个非常古老的工具突然登上了GitHub今日热榜:
——这竟是因为80岁的原作者更新了。
是的你没听错,有人都80岁了还在改代码!
这位大神,就是加拿大计算机科学家——布莱恩·柯林汉(Brian Kernighan)。
与比尔盖茨、Java之父、Python之父等大佬齐名的他,开创的“Hello World”范式让每一位学编程的同学刻烟吸肺:
不管你学的什么语言,第一个程序就是学会输出它。
此外,C语言的第一本编程著作,作者之一有他;Unix系统的早期开发人员、AWK(Linux及Unix中的文本数据处理工具)的共同创造者名单中,他也赫然在列。
如今老爷子已经满头白发,还活跃在“一线”——
今年5月,AWK的GitHub仓库中,老爷子提交了新的pull request,给AWK添加了一直没法做到的Unicode支持。
对此,网友的态度是这样的:
是什么让这位大佬常年保持编程热情的呢?
免试进入贝尔实验室
事情还得从柯林汉的大学时代说起。
柯林汉于1942年出生于加拿大,本科就读于多伦多大学工程物理学。
他形容这是一个给那些自己也不知道想学什么的人准备的“大杂烩”专业,但很幸运,刚上大一他就对编程开始感兴趣,学起了Fortran语言。
当时,计算机的发展还处于初期。他直到大三才见到全校唯一的一台晶体管计算机:IBM 7094。
由于太贵(时值300万美元),学生们并没有机会碰到它。
由此可见彼时工具的稀缺,所以正在学编程的柯林汉也就只是拜读了丹尼尔·麦克拉肯的大作,获得了“颇丰”的理论知识,实际并没有真正上手写过一行代码。
大一暑假,不知道他如何在一家石油公司找了个实习,任务是用COBOL语言给精炼厂开发优化软件。
鉴于这个语言他不熟,也没有编程经验,所以最后也没写出个像样的程序来。
虽然受了一点小挫折,但他对编程的热情并没有退却,回到学校继续研究。
大四毕业后,柯林汉决定继续深造,并拿到了MIT和普林斯顿大学的offer。
由于去MIT要7年才能完成博士学业,且每周需做30小时的研究助理工作,而普林斯顿只要3年且提供全额奖学金,再加上柯林汉的好友就在普林斯顿,他毫不犹豫地选了后者。
在普林斯顿大学,柯林汉读的是电子工程专业,因为当时同样还没有专门的计算机系。
这完全没妨碍他前进。
读博期间,他先是得到了MIT的实习机会,有幸在后来的图灵奖得主费尔南多·科巴托(Fernando Corbató)门下干活,给一种叫作Multics的分时操作系统项目写代码。
转年夏天,他又得到了贝尔实验室的实习机会,在那里写汇编语言。
为了方便在Fortran程序中做列表处理,他还写出了一套函数库,他形容这份工作“十分过瘾”。
转眼到了博士毕业,柯林汉被直接留校任教,并在没有进行面试和研究成果展示的情况下,成为了贝尔实验室的正式成员,足以见其优秀。
而他和Unix的渊源也就此展开。
Unix命名人
我们现在的大部分服务器、手机系统和物联网系统的底层基本都是基于Unix。
而三大系统之一的Linux也是一种类Unix系统,可以说,Unix是现代操作系统的源头之一。
说起来比较意外,这么一个重要的操作系统,其初代版本被后来的图灵奖得主Ken Thompson仅花3周的时间就搞定了。
当时的Unix还叫UNICS (Uniplexed Information and Computing System),后来被柯林汉改成了现在的名字。
Unix中有一个核心工具,叫做AWK,柯林汉就是其发明者之一(名称中的“K”正是代表他)。
AWK作为一种文本处理语言,只做过滤和转换文本行这一件事,却成为Unix/Linux平台上现有功能最强大的数据处理引擎之一。
在Linux系统中,它和grep、sed命令并称为“三剑客”,并占据“老大”席位,掌握了它,处理日常操作可以6到飞起。
如今,AWK已经分化出三个版本,依然受到人们的欢迎,诞生45年仍未“退休”。
除了AWK,柯林汉还发明了AMPL,一种描述并求解大规模复杂数学问题的建模语言,支持世界上大部分的求解器。
还有编译器Ratfor、文档编制预处理器Pic、Grap和数学排版语言Eqn等这些重要研究成果背后都有他的身影。
除了写代码,柯林汉还很爱写书,且诞生了不少经典之作。
比如你想了解Unix的历史,就可以看《Unix传奇》,作为参与者和见证人之一,他写的这本书可以让没有足够专业技术背景的人也能欣赏Unix的思想。
而文章开头所说的“Hello World”范式,则是出自于他与C语言之父丹尼斯·里奇(Dennis Ritchie)合写的开山之作《C程序设计语言》。
再比如柯林汉的第一本著作《The Elements of Programming Style》(《编程格调》),则留下了一个以他名字命名的定律——柯林汉定律,即:
(相比于复杂代码,简单的代码更可取。因为调试复杂代码的过程中,任何问题都会十分棘手,甚至无法解决。)
解决问题靠拖延?
那么,柯林汉本身是个什么性格的人呢?
2021年他接受《程序员》采访时,曾被问了这么一个问题:
(以上两人都是他在贝尔实验室的同事)
对此,柯林汉连连摆手:
老爷子说了,遇到新问题,他的解决方案通常简单粗暴,那就是尽可能地拖延,以及祈祷问题消失,或者祈祷问题自己解决自己。
这个玄学办法本身是不能解决问题的,但这样做,柯林汉有足够时间消化问题,然后想出对策。
而且,他其实会选择直接动手搞定问题。
今年1月1日,柯林汉刚好过80岁生日。
上个月,油管频道Computerphile对他进行了采访,大伙儿才知道,老爷子还在改代码!
柯林汉说,没有任何一种计算机语言或工具是万能的,AWK也不例外。
此前,AWK只适用于ASCII或8位输入,不能处理Unicode(统一码)。
△图源Youtube频道Computerphile视频
几个月前,柯林汉花了点时间,折腾了一下AWK——他称它是“一个非常古老的程序”——现在AWK可以处理UTF-8输入和输出了。
现在,用户已经能用正则表达式提取日语字符以及类似的东西。
视频中柯林汉还顺口提了一嘴,他修补了一些“又快又脏”的东西,让AWK可以处理CSV文件。
△图源Youtube频道Computerphile视频
整个采访过程,老爷子依然健谈,精神面貌也不赖。
话说回来,精力充沛的他,对几十岁的“古老程序”改改改,还有啥原因呢?
柯林汉的回答是这样的:
今天的计算环境,和三、四十年前非常不同,内存量也大大扩充了,“这会改变你对AWK的思考方式,尤其是AWK运行不起来的部分”。
所以,老爷子一直偷偷在后台玩儿新版本的AWK,目的是尽可能做拓展,让AWK更容易实践和使用。
这其实是柯林汉一以贯之的行事准则,此前,他就在播客CoRecursive中表示过:
有意思的是,世界上没有万能工具,也没有万能通才。老爷子自己就承认说,他的bug是还没完全搞懂Git怎么用。
所以他只能通过电子邮件,把更改发送给当前的维护人员。
△图源柯林汉的邮件
网友:Hacker永不退休
80岁高龄还要修改几十年前写下的代码,这位程序员届卷王的故事再次引起了网友关注。
自面世起,AWK就广受欢迎。看到AWK在今天依然能得到完善,变得更强,不少人对老爷子的敲代码热情表示respect。
有的网友表示了对老爷子的感激。
还有人觉得,为改善程序员写代码的环境不断付出,是一件很鼓舞人心的事情。
当然少不了玩梗的人。
One More Thing
最后,让我们回到“Hello, world”。
这句“万物开头”其实最早是在柯林汉1974年撰写的《Programming in C: A Tutorial》中首次出现,后来才被合写进那本经典之作。
该书中两位作者形成的写代码风格,也被称为K&R风格(K&R即指柯林汉Kernighan和里奇Ritchie)。
有意思的是,柯林汉表示这本书是自己强行拉着丹尼斯写的。
至于为什么选择用“Hello, world”而不是别的,柯林汉自己都记不清了。
在接受福布斯杂志访谈时,他模模糊糊回忆:
参考链接:
[1]https://www.youtube.com/watch?v=GNyQxXw_oMQ
[2]https://arstechnica.com/gadgets/2022/08/unix-legend-who-owes-us-nothing-keeps-fixing-foundational-awk-code/?comments=1
[3]https://www.theregister.com/2022/08/23/universal_unix_tool_awk_gets/
[4]https://www.cs.princeton.edu/~bwk/
[5]https://corecursive.com/brian-kernighan-unix-bell-labs1/
[6]https://baijiahao.baidu.com/s?id=1696979082867013424&wfr=spider&for=pc
[7]https://github.com/onetrueawk/awk/commit/9ebe940cf3c652b0e373634d2aa4a00b8395b636