相比芯片,我们更该在意深度学习框架的中国化

jopen 7年前
   <p style="text-align:center"><img alt="相比芯片,我们更该在意深度学习框架的中国化" src="https://simg.open-open.com/show/c4d0bb8f7f6a13a9b6f352d871b8f4f6.jpg" /></p>    <p>这两天美国宣布对中兴进行封锁,可谓在科技圈掀起了从上到下的一股龙卷风。</p>    <p>4 月 16 日美国商务部发布命令,禁止美国企业向中兴通讯销售元器件,时间长达 7 年。假如这一纸禁令真正生效,意味着中兴通讯旗下全产业链所依靠的芯片等核心元件失去获取渠道,基本意味着庞大的中兴通讯将面临无法继续经营的最坏可能。</p>    <p>中兴通讯股价随之快速下跌,已相当于两个跌停板,其美国供应商的股价在“禁令”发布后也遭遇不同程度的下跌。</p>    <p>19 日,中国商务部新闻发言人高峰在新闻发布会上表示,美方行径引起了市场对于美国贸易和投资环境的普遍担忧。</p>    <p>随着中美贸易战延伸到科技领域,似乎一夜间我们又回忆起了缺失核心研发能力的恐惧。“缺芯之痛”转瞬弥漫在舆论氛围里,甚至关于“中国科技到底行不行”的讨论又一次尘嚣直上。</p>    <p>当然了,出问题就无限夸大其实并没有太大意义。客观来说,美国的芯片禁令无法持久,毕竟这背后涉及的美国本土产业链、利益群落与工作岗位非常庞大。一旦接连失去中国大客户,美国引以为傲的科技产业本身就会撑不住。</p>    <p>另外我们需要认清的是,半导体行业今天的国际格局并不是几个月,甚至几年内造成的。而是整个半导体工业时代发展和遗留下来的产物。中国以及全世界更多市场的计算机、工业、通用电子系统上本土芯片占有率都是零。</p>    <p>事实上,中兴这样的中国企业,在技术上的锐意进取是有目共睹的。但芯片研发制造能力的国际垄断,是几十年积累下来的产业现实,是大量的科技因素与市场封锁、贸易规则制定综合得出的结论。是一两家公司,甚至是集合整个科技集群都难以改变的。</p>    <p>换句话说,中国科技公司面临可能出现的困境,除了加强研发投入也没有什么别的办法。过去我们无法改写,但今天我们能改变的东西,叫做未来。</p>    <p>就像几十年前的半导体技术是核心中的核心。今天提起能改变未来世界的技术,AI 绝对是当仁不让。尤其值得注意的是,这个刚刚兴起、充满变化的技术领域里,中美之间的价值突围和技术博弈其实更加激烈。</p>    <p>AI 的国家战略重要性是母庸质疑的,而针对产业链上游核心技术的争夺正在逐步呈现白热化。假如我们希望若干年后整个产业界,甚至整个国家不会再因为一纸封锁领而恐慌,那么 AI 这个战场的基础设施,才是真的不容有失。</p>    <p>或许对于大部分人来说,AI 的底层之争在今天还有些陌生,但它确实很可能像曾经的半导体一样,产生新时代的世界科技格局垄断效应。比如说每个 AI 开发者都会用到,所有 AI 应用产生的基础——深度学习开发框架。</p>    <p>在这个普通人很陌生的领域,中国科技公司和万千开发者,正在一点点刷新着中国科技的存在感。</p>    <p><strong>被忽略的深度学习框架</strong></p>    <p>芯片为什么重要?原因在于它是一切运算的基础,是最后端的的东西,没有它一切硬件都玩不转。所以当垄断形成,就能对其他经济体的科技发展形成底层制约。</p>    <p>同样的道理,在 AI 时代也体现在开发框架这件事上。我们知道,AI 开发者不能每开发一个模型就从最底层重新来过,所以想要进行算法训练、模型开发、应用部署,都必须在一定的开发平台上来完成。AI 发展到今天,这个平台的角色主要依靠大学和企业提供的深度学习框架来扮演。</p>    <p>在中国,深度学习框架相对来说是一个科研和开发领域的事情,但在美国,产业界围绕开发框架的争夺战早已经火星四溢。</p>    <p>比如说,很多美国媒体都认为,谷歌今天在云计算、硬件、语音助手、AI 教学等业务中,全都展现出“TensorFlow First”的特点,用尽各种办法将开发者引导至自己的开发平台上,并且坚决不兼容其他开发框架。</p>    <p>而 非死book、微软则对 TensorFlow 的封闭深恶痛绝,形成了以 caffe、Python 结盟形式的“反谷歌联盟”,希望以兼容性和社群开放等优势,打破谷歌一骑绝尘的战略格局。</p>    <p>对开发框架的重视,隐藏着科技企业和背后国家经济体对 AI 未来的押注。试想无数应用都在自己的平台上进行开发,那么所有数据、算法创新和模型训练过程就都留在了平台当中。企业和平台收获的,是作为地基的产业地位。而国家经济收获的,是可以从源头上控制其他经济体 AI 应用的“上游效应”。</p>    <p>幸运的是,已经吃够了“下游之苦”的中国,在深度学习框架这件事上并没有落后。</p>    <p>为了解决当时主流开发框架仅支持但 GPU 应用,无法进行大规模数据处理的问题。百度从 2013 年就开始研发自己的深度学习框架 PaddlePaddle,经过长期内部应用后,在 2016 年正式将其进行开源。</p>    <p>这也让百度成为继谷歌、非死book、IBM 之后,全球第四家、中国第一家开源深度学习开发框架的科技公司,之后 BAT 相继推出深度学习开发框架,在这场基础设施争夺中,中国产业壁垒的高度已和过去不再相同。</p>    <p><strong>可能出现的中美 AI 对决中,开发框架或是轴心武器</strong></p>    <p>就目前中国 AI 的整体行业氛围而言,似乎普遍更关注 AI“用”的一面,容易忽略在应用之前的开发与创新,以及为创新提供的基础设施,是整个 AI 商业想象力的原点。</p>    <p>事实上,假如我们将中美两国看做处于竞比关系的两个 AI 技术群落,那么深度学习框架的质量和接受度,很可能会影响到整个产业竞赛的进程甚至结果。</p>    <p>或许可以从三个角度,来看为什么中国一定要有自己的深度学习框架,以及中国开发者为何更应该支持“国货”。</p>    <p>1、 中国 AI 无法离开中文:我们知道,AI 的一个重要领域是语言与对话的交互。那么未来在中国市场应用的,必然是基于中文的 AI 开发。但在 NLP 与语音交互、神经网络翻译等技术上,国外主流开发框架很少有中文数据集,也缺乏在中文领域的技术探索。如今来看,开发者想要开展这方面的工作,几乎必须依赖 PaddlePaddle 这样的国产框架所提供的开发基础和数据集、文档。</p>    <p>2、 产业链的安全风险:去年,谷歌的 TensorFlow 曾经被爆出重大安全漏洞。虽然没有造成实质影响,但当时专家评估,类似的漏洞完全可以影响甚至摧毁所有基于该平台开发出的 AI 模型。要知道 AI 大量涉及安防、识别、城市交通、公共服务等国家事务核心领域应用,这些应用如果在国外框架中开发运行,那么安全风险不言而喻。</p>    <p>3、 产业应用需求不同:相比于美国,中国对 AI 开发这件事的需求其实有很大不同。比如说传统企业多、开发者的应用需求大、商业期待迫切、开发人才处在发展阶段。那么相比于前沿探索类的开发,中国开发者更需要在开发框架提供高效、灵活的开发方案,以及快速部署、弹性学习的能力。这些因素当然是远在天边的欧美开发平台不会考虑的。只有深谙中国开发者需求和中国 AI 市场生态环境的企业,才可能进行针对性价值提供。</p>    <p>不难看出,基于应用性、安全性和中文开发的必然性,中国的深度学习开发框架之争都是注定要发生的。</p>    <p><strong>别是一风景</strong></p>    <p>在科技领域,“理性支持国货”显得尤为重要。毕竟不能为一些大局层面的考虑,牺牲货真价实的成本与效率。 好在“国框”其实在很多层面上已经足可与欧美一较高下,比如 Caffe 创始人贾杨清在评价百度的 PaddlePaddle 时,也认同其在简洁、灵活、快速等领域功力不俗,并且解决了 Caffe 早期的不少遗留问题。</p>    <p style="text-align:center"><img alt="相比芯片,我们更该在意深度学习框架的中国化" src="https://simg.open-open.com/show/0f6a60cecd7bc4167c187b394572f2a1.png" /></p>    <p>今天的“国框”已经不能说是为了爱国而爱国的强硬选择。在很多层面上,AI 开发的自主、自有、自生态,已经可以在中国这个世界第二大 AI 技术实体与市场独立完成。</p>    <p>或许对于中美贸易战,以及可能的科技禁运等情况,我们还是有些过于敏感了。</p>    <p>诚然,硬件和底层技术有差距,是必须要承认的事实;但在新的领域,在争夺未来的原点上,中国科技工作者、开发者以及无数企业,一直都没有停止奔跑。中美之间的差距,今天也在以肉眼可见的速度缩小。</p>    <p>对待中美科技之争,更合理的方式或许是承认差距的同时,认清很多关键领域的国家自信。</p>    <p>更多核心领域达成技术突破;开发者、资本和平台有效组织产业聚合;营造更好的创新土壤,那么中国终有一天不会再被人牵着鼻子走。</p>    <p>星河流转之后,或许别是一风景。</p>    <p>来自: <a href="/misc/goto?guid=4959013209664366934" id="link_source2">钛媒体</a></p>