HTML5正名记:两家机构的博弈与一种标准的诞生

jopen 10年前

导语:美国《纽约客》杂志近日撰文,对HTML5标准的诞生和正名过程进行了简要回顾。

以下为文章主要内容:

你可能已经知道,10月28日,万维网联盟(以下简称“W3C”)正式推荐HTML5。你或许也知道,这与应用和万维网有一定的关系。问题在于:这跟你有关系吗?

答案是,至少与网民有关系。所以,我们有必要了解一下HTML5是什么,以及究竟是谁控制W3C。除此之外,还有必要知道HTML5得到W3C推荐 幕后的各种冲突。今后10年,将有数十亿人使用万维网,但真正有资格给“万维网”下定义的人却凤毛麟角。W3C就是这样一家组织。那么,它的成员包括什么 人?他们想干什么?又是谁为他们提供资助?

W3C诞生

万维网已经渡过了千禧年。它的设计方案最早在1989年提出,距离现在已经过去25年。6年后,网景的IPO(首次公开招股)扣动了硅谷的神经。当 万维网还是新生事物时,很多精通电脑的人都很鄙视它——与其他超文本发布系统相比,这是一项极其原始的技术。例如,你可以将自己的网页链接到其他任何页 面,但你却无法知道何时有人链接你的网页。万维网也不允许你在浏览器中编辑页面。对很多超文本领域的精英思想家和程序员来说,这都是非常严重的缺陷。

然而,万维网却很容易建立,学习难度也很小。它拥有自己的一套传送模式——任何人都可以通过阅读网页学习HTML语言,然后查看底层的HTML代码。万维网完全都由简单的文本和图像构成,它们与其他同样简单的文本和图像相互链接。

科技行业向来信仰功能主义(featurism),所以人们开始向万维网中添加所有他们所能想到的东西。如何展示3D图像?如何让文本发光,甚至滚 过整个页面?如何将网页变成软件?不同的浏览器相继涌现,每一个都形成了自己的文化,并拿下了一定的份额,包括Mosaic、网景、IE、 Cyberdog、Spyglass、Lynx和Amaya。

随着万维网的日益复杂,这一生态系统也逐步形成了群雄割据的局面。当时,每种浏览器只能渲染一种格式的图片,如果我使用另外一种格式,那么当我向你 发送某张图片的链接时,你就无法看到真实的效果。倘若这种局面持续下去,当今世界将会有多个万维网并存。无序状态也会紧随其后,而摄影师必将怨声载道。

随着这种割裂局势愈演愈烈时,人们意识到需要有一个组织来之定义一种通用的语言,将所有必要的功能都包含在内。之后,该组织还必须撰写一份文档,包 含超文本标记语言的所有演变过程。这是一个标准化流程,是一种出于商业目的而展开的技术外交,对互联网的发展至关重要。事实上,这并非计算行业的原创。

1908年,当自动钢琴生产厂家在水牛城的Iroquois酒店参加“水牛城大会”时,人们对钢琴纸卷上每英寸的穿孔数量存在分歧,有人喜欢9个, 有人喜欢8个。这种差异会导致成本增加,不仅对厂家不利,还会令用户困惑。他们最终达成了一致,因此在当今世界,每英寸9孔的钢琴纸卷已经成为标准,没有 人会生产其他标准的自动钢琴。

在冲突中前行

当然,网页的问题要复杂得多,它需要通过数十种标准来规范文字、声音、图像、交互、协议、代码等各种元素。而W3C则扮演了“万维网议会”的角色。 这是一个标准制定组织,他们会组织各种会议,让相互竞争的组织坐下来制定统一的标准,然后将这些标准从“工作草案”过渡为“候选推荐”和“提议推荐”。最 终,如果标准能够经得起考验,便会获得“W3C推荐”资格。

万维网发明人、W3C理事蒂姆·伯纳斯-李(Tim Berners-Lee)领导该组织开了20年的会议。它的会员包括近400家学术机构、非营利组织和公司。其中最积极的参与者是开发网络软件并拥有大量 网站的企业,包括谷歌、微软和非死book。他们支付会员费——美国大型企业的年费为6.85万美元,但非营利组织和小公司的年费少得多,发达程度较 低的国家也会按比例减少。

W3C的文化使命是“向所有人开放万维网,无论硬件、软件、网络基础设施、语言、文化、地理位置以及身体和心智能力如何。”要实现这一目标,就需要一个专门的委员会来制定标准文件。

如果你想了解万维网发展的最新消息,可以访问W3C的主页,查看最新新闻。当你阅读那些枯燥的标准时,或许会认为制定标准的过程是一个文雅甚至有些 学术化的流程——所有的参与者都会对分号的位置这种问题展开冷静的讨论。但实际情况并非如此。制定重要标准的过程有时很平和,但有时也要经过激烈的厮杀。

这并不是什么令人难堪的秘密,相反,这恰恰代表了一个良性的流程。“技术标准化是一种商业外交。”多次参与这类活动的惠普商业战略总监史蒂芬·瓦利(Stephen R. Walli)写道,“与外交家一样,所有的参与者都希望在扩大经济影响的同时捍卫自己的主权。”

曾在1974年开发了HTML的先驱语言“标准泛化标记语言”(Standard Generalized Markup Language)的查尔斯·古德法布(Charles Goldfarb)表示:这类标准与立法一样,都要经历深层的冲突才能最终确立。

跳舞的猴子

从一开始,HTML就为文本内容制定了一系列标记规则。如果你想添加标题,就要使用<h1>标签,例如<h1>你的标 题</h1>。<h1>是一个标记,“你的标题”只是字符数据。你的浏览器可以解读这些HTML规则,然后以相应的格式展示出 来。

HTML的实质就是大批的标签。但HTML5却成了一种“结缔组织”,负责将多种多样的其他技术粘合在一起,包括音频、视频、图片、文字、标题、引 文、开放式画布、3D图像、电子邮件地址等。它可以让你知道这些内容的存在,并提供各种渠道将其融入同一个页面。你甚至可以“验证”页面。截至目 前,Apple.com有1个HTML5错误。这其实已经很不错了,《纽约时报》网站的错误达到141个。

在这种情况下,验证是一种理想的构造。它的意义在于,如果你遵守W3C的规定,你的网站将会吸引更多的访客。不过,这两种页面对多数人来说都是可以 接受的,毕竟浏览器的容错率极高。事实上,任何一个标准组织的最终都会形成一种认识论:由于意见多种多样,所以他们必须从中挑出一些作为基本信念。自动化 的验证器是一种编码信念系统。并非每个网站都提供有效的HTML,就像并非所有天主教徒都会遵守婚前性行为禁忌一样。事实上,完全遵守HTML规范的网页 比例,与遵守婚前性行为禁忌的天主教徒比例可能非常接近。

这些冲突令HTML5受到了格外关注。为了理解个中缘由,必须回到1996年6月,当时,新版HTML刚刚推出。HTML3.2是一个重大更新,因 为它将之前的很多实践正式列为官方标准。JavaScript已经被添加到浏览器中,于是,页面上的所有元素都可以活跃起来。HTML3.2其实并没有对 JavaScript过多着墨,只是写道:“今后的HTML将有脚本。”

“JavaScript的目标是当你把鼠标移动到一只猴子上面时,能让它跳舞。”一位著名评论家写道。这些跳舞的猴子最终催生了更多“跳舞的猴 子”,首先是弹窗,随后在微软的帮助下,又可以在不刷新浏览器的情况下通过IE加载新的数据——谷歌地图、Gmail、推ter和非死book 等“网页应用”均属此类。现在,整个万维网到处都是跳舞的猴子。我们仍把网页称作“页面”,但其中有很多其实已经变身为软件应用,其复杂程度之高甚至可以 完成文字处理、运行视频游戏。

2004年,这种从页面向应用的改变吸引了很多跨国公司的兴趣,他们从这种动态网页中看到了巨大的利润前景。然而,W3C已经对万维网展开了长达数 年的改造。他们在力推“无障碍网络”——通过为网页赋予自我描述的功能,让盲人和其他残疾人也可以使用网络。他们还希望开发语义网络,将所有的思想都集中 到一套分散化的思想库中。为了实现这一目标,W3C着手开发新版HTML,也就是XHTML2。配合着其他一些标准,便可通过更好的技术改造很多网页的功 能特性。然而,当W3C希望构建无障碍网络的同时,整个网络行业却都希望“让猴子跳舞”。

WHATWG扭转趋势

必须强调的是,在追求这一目标的过程中,W3C似乎变得有些脱离实际。例如,W3C的情感标记孵化集团希望通过情感来标记任何内容。他们 说:“EmotionML提供了一种机制,通过科学有效的描述符来代表情感。”他们还补充说:“由于无法达成一致,EmotionML并不提供单一的情感 词汇表,而是让用户在他们的注释中选择最适合的情感词汇。”

具体效果如何呢?你可以使用下面一段代码来描述0.5的快乐值:

<emotion dimension-set=”http://www.w3.org/TR/emotion-voc/xml#pad-dimensions”><dimension name=”pleasure” value=”0.5″/></emotion>

EmotionML还擅长表达愤怒、焦虑、痛苦和轻蔑。如果这种标准得到W3C的推荐,并广泛普及,那么政治博客的愤怒情绪便可量化,你甚至可以选择只阅读包含快乐情绪的万维网。

但这显然没有成为现实。2004年,正当W3C从事这一项目时,万维网也悄然发生了很多变化。谷歌上市,苹果通过基于Web的iTunes商店卖出了不计其数的歌曲,苹果还推出了自己的Safari浏览器。

除此之外,一群来自苹果、Mozilla和Opera的工程师组成了一个名为WHATWG的组织,也就是“网络超文本应用技术工作组”的缩写。他们对W3C的XHTML发展方向感到担忧,担心该机构忽视HTML,忽视真正的需求。

WHATWG开始从事本应由W3C从事的工作——定义新版HTML,也就是HTML5,集合各种新兴的万维网技术,并进行标准化。把这些新技术集合 在一起,可以让浏览器变成通用的高速电脑,提供更智能的表格、更好的视频和音频,还能更好地把文档转换成代码,令越发紊乱的万维网更加有序。此后,浏览器 成了应用的载体,可以在上面运行软件。

2007年,W3C认可了WHATWG的方向,开始亲自处理HTML5。而XHTML2所倡导的情绪化网络从未真正发展起来。WHATWG仍然保持独立,双方展开了并不顺畅的合作。

尽管W3C接纳了HTML5,有关这种语言究竟如何部署以及何时部署,仍然留下了很多疑问。CNET的史蒂芬·夏克兰(Stephen Shankland)常年追踪这一标准化流程,根据他的记录,W3C讨论这项技术的邮件列表中曾经出现过“幼稚”、“不可忍受”、“可笑”和“鬼把戏”这 样的词汇。

同样是在2010年,史蒂夫·乔布斯(Steve Jobs)发出了一封公开信,宣称HTML5风格的网络技术才是未来发展方向,Adobe的Flash专有平台无法担此重任。这封信意义重大,因为它意味 着HTML5得到了一家顶尖科技企业的祝福,从纸上谈兵进入到实践摸索阶段。

现在,经过了7年的发展,HTML5的命运似乎最终有了定论。据夏克兰报道,WHATWG和W3C之间仍然存在分歧。孰是孰非似乎并不重要。双方都 在各司其职地肩负着自己的责任。各种各样的冲突仍会不断涌现,然后逐一解决,如此往复,最终出台通用标准。WHATWG显然希望W3C终止这样的模式,但 它毕竟已经统领万维网20年。

如今的浏览器速度早已今非昔比,代码编写者再也不必担心不兼容的问题。不过,他们似乎只看重速度,没人试图改变核心。以文档驱动的传统万维网仍是网页的基础,但以应用驱动的万维网却可以跨越平台,支持任何手机。它更加复杂,有时甚至令人困惑,但多数时候都可以正常运行。

终成行业标准

W3C的HTML5标准内容非常“丰富”,光是图片部分就有1.4万个单词,这还只是一小部分,全文多达53万单词,达到HTML4的5倍多。但即 使如此冗长,它也只是描述了万维网定义的很少一部分。例如,他并没有提及如何制作JPG图片或GIF图片,以及这些文件如何安排在二进制数据流中。其他内 容则由其他组织负责制定相应的标准,这些标准又基于更多的标准而来,甚至可以追溯到数十年前的内容。

万维网最初是为了发布和分享文档之用,现在已经成为一套操作系统,它能监控手机电量、录制和发送语音,还能管理电子邮件和聊天、提供游戏运行环境。

与微软Windows或苹果Mac OS操作系统不同,HTML5标准是开放的,所有人都可以使用。如果你想编写一个浏览器,随时可以获得足够的信息,不会有任何隐瞒。甚至还有专门的教程帮助你开展初期的工作。

任何的标准都可以折射一种文化,HTML5也不例外。它体现出我们对文字、标题、视频和音频的偏好:我们喜欢把各种内容组织成列表,我们还喜欢看图 片,我们希望任何事情都能具备动画和互动能力——每个字、每个标签、每个结构元素。HTML5的所有内容都可以由代码解读,也都可以由用户来旋转和操纵。

万维网曾经是一个获取信息的地方,但现在,它也成了一个做事情的地方。这花了10年时间才最终实现。现在是2014年,HTML5终于得到了官方的认可。就像1908年的水牛城大会一样,只要你使用了合乎标准的自动钢琴,便可倾听百年之前的乐曲。


本文转载自: 新浪科技