让文献上的算法走进真实世界,打造算法的“App Store”

jopen 10年前

        算法正在改变世界。

        每天打开的网页和应用,无一不是强大的算法在背后运转,决定你看到什么、喜欢什么、看什么样的书、交什么样的朋友,甚至过怎样的生活……

        但是,对于开发者们来说,这还不够。日益膨胀的数据要求他们用更新、更强大的算法来挖掘出这些海量数据背后的秘密,但是新算法的寻找成本、试用 成本,却都让很多公司望而却步;与此同时,学院派和大公司研究院里最新的理论成果,顶多在获得了研讨会上的几阵掌声后,就躺在了文献的故纸堆里。

        在企业家和学术界之间,仿佛隔着一道无形的鸿沟,难以跨越。

        这点,被称为面向算法的“App Store”的 Algorithmia 两位创始人,可能知道地最清楚。

让文献上的算法走进真实世界,打造算法的“App Store”

        CEO Diego Oppenheimer 是微软 Excel 团队的成员,主攻商业智能和数据分析工具。如果你曾经用 Excel 来处理非常大型的数据,那可能背后就有他的努力在。他的工作之一是每天都想着要找到最好用的算法,来提高数据的处理效率。有一天,他打电话给微软研究院, 寻求一种算法,对方建议他可以去联系研究院的 XX 教授。于是绕了几个弯之后,他联系上那位博士,对方和他说,“啊,我已经在这个算法上研究了六七年了!”

        而与 Oppenheimer 相反,Algorithmia 的联合创始人 Kenny Daniel,则是一个相当学术的人。他在南加州大学获得了博士学位,并且为美国交通部定制了一个算法理论,来让交通资源可以最大规模优化。可以用 Oppenheimer 的话说,Daniel“是一个写代码的天才。” 但是后来发生的事让 Daniel 很沮丧:他的学术成果发表了,大家都跑来向他发来祝贺,然后呢?他苦心研究的成功就躺在了文献里,再没有然后。

        就是这些经历,让 Oppenheimer 和 Daniel 决定一起做些什么,改变这一现状。Oppenheimer 告诉 PingWest,在那个教授告诉他自己已经研究那个算法很长时间的那一刻,“我完全震惊了!心里想说,你为什么从来都没有告诉我们?我们还是在同一家公 司!”Oppenheimer 说,“微软有很多这样顶尖的研究员——但是如果在一个公司内都是这个情况,可以想想整个世界是怎么样的?而且,再设想一下,如果我不是微软的员工,而是一 个中型公司的成员,我又怎么样能找到这样的算法呢?”

        于是就有了 Algorithmia 的诞生。它的模式很简单,就像是应用商店,只不过,里面出售的不是一个个应用,而是一个个算法。它的用户,也不是普通的消费者,而是开发者或者互联网公 司。“大家可以把自己的算法放到我们的平台上出售,需要的人就可以购买使用。就是这么简单。”Oppenheimer 说。

        但是其实一点也不简单。很多作者未必想要把自己的成果开源,而且如果仅仅是提供算法,那么开发者购买试用的成本也并没有降低。为了真正能够实现 “算法的交易”,他们需要做很多额外的事情:比如搭建自己的云平台,这样一旦用户找到需要的算法,不需要下载安装,而只需添加几行代码,导入自己的数据, 就可以获得返回结果,从而避免了要把算法集成进应用;它也能够根据算法的规模,来调整自己的运算能力。

        “我们不仅提供交易的平台,还提供很多服务,这样的话,用户们不用去下载文档,而是可以直接通过我们的服务器进行部署。只有这样,作者们会放心 把算法放到平台上,用户们也会乐于购买。因为尝试新算法的成本会非常低。”Oppenheimer 告诉我。“你看,现在的问题就是,算法的实验成本太高。你必须要有个人去读那些文献,然后下载代码,然后安装部署,还要不断调整。但是很可能一周过去后, 发现这个算法并不能解决问题。这样就浪费了大量的精力和时间。但是在 Algorithmia 的平台上,用户们只要花几个小时最多一天的时间去比较各种算法,然后进行测试。这样一来,选择新算法的风险就降低了很多。这样才能促成新算法的大规模应 用。”

        但是怎么来保证算法的质量呢?最主要的还是搭建起自己的社区。比如,对于开源的算法来说,人们可以看到代码,所以可以相互改善;而即使不是开源 的算法,在它运行的时候,Algorithmia 也会有一些 metric 来追踪,来看是不是有什么异常的行为。另外,开发者们也会有自己的声望,可以查看他们的背景信息和资料,而随着平台的进一步扩大,用户们对算法及其作者评 价将会是重要的依据。同时,一旦算法得到更多人使用,那么算法开发者们也可以获得更高的收入。

        有趣的是,Algorithmia 团队也会采用在自家平台上出售的那些机器学习的算法,来对平台上各式算法进行分类和排序。包括标签、相关性、作者说明等信息,而在算法的作用下,也会呈现 出类似 Amazon 网站上购物体验的效果,比如针对你的历史记录进行个性化推荐,或者显示出,“喜欢这个算法的用户还浏览了其他哪几个算法”,等等。

        就像我之前写过专注预测功能的机器学习服务器 Prediction IO 一样,还有很多垂直的平台也在做算法出售的事情,但是 Oppenheimer 认为,这只能证明这个领域的需求非常强劲,人们都在寻找好的解决方案。“但是我们不选择做垂直领域的原因,就是因为算法本身就是跨领域的,而且不同算法之 间可以相互协作。”

        尽管愿景很宏大,但是 Algorithmia 是一个 4 个人的初创公司,这也意味着在一开始,在算法作者和应用者之间,他们必须得有一个当前的重心。“我们是一个面向算法开发者的平台,想要让那些美妙的算法得 到应用,但是,只有在市场需求很强的时候,这一情景才会实现。所以,我们目前主要的重心在于获得好的算法,建立起这个社区。”Oppenheimer 说。

        看起来,Algorithmia 已经取得了不错的开端。他们选择从学术界先下手。虽然算法开发者并不局限于学术界,但是学术界无疑是最明显的例子。学者们进行了多年的研究,发表了论文, 代码也都成型,但是,如果不商业化,也许就只能眼睁睁看着它在三年后因为没有人维护和更新变得落伍——既然这样,为什么不把它放到 Argrithmia 上呢?教授们可以看着自己的算法被使用、运行,更新、改变世界,而他可以继续回到他的研究工作中去,更别提还会带来不错的收入了。

        Oppenheimer 和 Daniel 收获了很棒的回应。一个月前,他们去了卡耐基梅隆大学——一所在计算机科技领域拔尖的学府,教授们的反馈很让他们兴奋。然后他们去了哈佛、MIT、斯坦福……

        “那些学校里的人都给了很正面的反馈。”Oppenheimer 说。他们甚至还在华盛顿大学里收获了一个投资人,对方对于 Algorithmia 的出现非常兴奋。“当然有的人也会有一些问题,比如,大部分教授问的第一个问题是,那知识产权是谁的?这个毫无疑问,当然属于他们。当我们这么说了之后, 他们的反应都是,那太棒了!”

        当然,对于 Algorithmia 来说,这并不仅仅是美国市场的事,Oppenheimer 想要把它做成一个全球性的平台。这当然合理,还有那种语言比代码更能全世界通行呢?

        亚洲显然就是他寄望颇深的一个地方。在整个采访中,他多次兴奋地和我说,“我们非常期待。亚洲将是非常非常重要的部分。” 不过,他指的不是那里的人口,而是产出的高水准的工程师和学术人员——“如果能把他们吸引进来,那将会是 Algorithmia 平台上最大的内容贡献者!”所以他们选择引入日本电商网站乐天旗下的风险基金 Rakuten Ventures 作为 Algorithmia 的早期投资者之一,也是希望有一天,能够借助乐天在亚洲的影响力和资源,迅速扩张。

        但 Oppenheimer 同样强调了中国。他告诉 PingWest,中国有太多优秀的工程师,也有很多人在计算机科学领域进行了非常深入的研究,但是没有太多可以发布到全球的平台,而 Algorithmia 无疑会是一个很好的机会。Oppenheimer 甚至借鉴了之前 GitHub 的遭遇,“我们想要每个人都可以接触到 Algorithmia,即使是在墙内。所以我们也在考虑说把算法部署在中国公司的私有云内,把公司内部的算法和我们的相结合。”

        目前 Algorithmia 已经完成了一轮 240 万美元的种子轮融资,由 Madrona Venture Group 领投,其他机构投资者包括 Rakuten Ventures、Deep Fork Capital 等。不过,现在产品还是在 Beta 测试的阶段,但是 Oppenheimer 告诉我们,最迟到今年年底,他们会对外公测。

        到时候,你就可以看到,算法的 App Store,会不会像应用商店一样改变世界了。