王小川:搜狗的前生今世
今天我来为大家分享的是:跨度十年的“搜狗输入法”的来世今生,关于它的现状、缘起、爆发、渠道推广,以及中间的意外(与 google 的意外摩擦)、产品内涵、商业化思考和未来展望。这里面有从 0 到 1 的过程,也有从 1 到2、从 2 到 3 的过程。
大家都知道,互联网正经历从 PC 时代到移动互联网时代,正如以前我们走出去的时候,大家会说:“诶,你是做互联网的,我是传统行业的。”那时候,听着觉得蛮骄傲的。再后来,大家谈到互联 网,是这么说的:“诶,你是做互联网的。”或者说:“你是做传统互联网的,我们是做移动互联网的。”在这中间,我感觉自己经历了互联网的史前文明到泡沫化 的过程。
2006 年 6 月 5 号“搜狗输入法”上线,差不多经历了十年,十年历程非常长,今天就从输入法展开。
目前“搜狗输入法”的最新研究是完成搜狗输入法与智能硬件的结合,最大的突破不在于输入体验,而是用想象力推动产品的创新。从这件事情之后,我 们发现互联网开始以我们为开头,像百度也开始干了这些类似的事。我们以前“做得少,说得少”,或者是“做得多,说得少”。现在呢,我们是开始干,就想到很 远未来的事情了。
一、产品现状
先给大家看下,“搜狗输入法”今天的现状。给大家看一下艾瑞第一季度的数据,首先,在 PC 端上,“搜狗输入法”仅次于 QQ 的用户量,且覆盖面最高。而移动端上,微信、QQ 名列第一、第二,搜狗占第三,虽然排第三,胆与用户量最高的微信差距一倍多,为什么呢?其实是被苹果坑了一把,苹果 IOS 系统去年才开放了除自带系统外的别的输入法安装,而那时很多人已经适应了苹果自带的输入法。
从场景上覆盖,不仅是 PC 端、移动端,甚至凯迪拉克汽车也内置了我们的输入法。那怎么去理解输入法?其实就两件事:表达自己的思想、语言智慧,跟外界沟通;获得对世界长久的感知。 传统的表达自我就是拼音输入,手机端的输入法里面使用九键的用户大概占 60%;另外一种就是手写。我们可以看到,“搜狗输入法”每天打出来的文字有 520 亿,这个数据大概等于 7.2 万的《红楼梦》。未来,我们可以做更多努力。
还有“搜狗语音识别”,每天有超过一亿次,“搜狗输入法”是目前中国最大的语音品牌。后来通过第三方去检测,《重庆邮电大学评估报告》显示,我们的语言准确率达 96.5%,其实准确率来自于大量数据的优化。
有人和我说“语音输入”会不会颠覆“文字输入”?我就问过专家,他说大概一年半前有人问他文字和语音的比例是多少?文字:
语音大概是 3 :
1。我就担心趋势会变,但是半年之后,比例还是一致的。我担心是因为流量因素,可是通过数据分析我们发现,从月初到月末,文字与语音的比例基本是恒定的,到了月末没流量了,文字和语音一起都没了,所以与流量没关系。因此,在人的表达里面,还是以文字为主,语音为辅。
表达,就是对世界的感知。除了自我表达以外,还有就是对世界的感知,这部分主要是图像。在图像工作里面,我们有些成绩可以分享:在上周的比赛 中,我们展示了一个产品“食图”。当你拍一个吃的图片后,可以告诉你:这是什么、卡路里多少。我们的产品原型已经做出来了,这就是除了文字之外的表达。
还有一个项目,就是手表的滑行输入,这是我们寻找的别的输入方案。
二、缘起
我们是怎么想到做“输入法”这件事的呢?
2005 年,恰逢搜狐无线部分被移动带走了,股票市值大跌,搜狗基本属于一出生就没钱的状态。搜狗引擎发布上线后的一年左右时间,很痛苦,工具条效果不理想。在此 介绍一个人,我们内部称他为“输入法之父”,他名叫马占凯。马占凯 2005 年来北京,他发现一件事:当你用紫光输入法的时候,打字比智能 ABC 好很多,但是紫光的词库不全。他又发现使用百度搜索引擎时,可以通过输入拼音搜索出文字来。输入法有这个空间在,而百度可以解决这个问题,于是他就给百度 提建议说:紫光+百度搜索引擎可以做出很酷的产品。他一共给百度发了五份邮件,得到的答复都是:“谢谢你的建议。”于是马占凯就来联系搜狗,这一次,他改 变了策略,不讲搜索引擎,只是先说,目前的输入法有什么改进的地方,并提出了 100 个问题点。我当时就与他产生了互动,于是搜狗就开始做了输入法。
他通过数据分析发现,windows 的下载量几亿次,接下来就是 QQ 和输入法了,输入法本身存在一个很大的空间。现在的产品是有痛点的,智能 ABC 一点都不聪明,紫光开始会组词,这是紫光对智能 ABC 的推陈出新,剩下来就是搜索引擎这件事了。
这背后还有些小花絮,当时有几个最优秀的产品经理是反对这件事。将搜索引擎并到词库,程序放到桌面,产品经理认为是不合适的。还有一位资深的产 品经理认为,输入法的兼容性很难,主流的程序可以,但是很多应用程序不兼容。还有很多…但是那时我们没有兼听那么多意见,匆忙就上线了。
有高频需求,有痛点,有解决方法就可以去做这样一件事情,即便他背后有瑕疵。这就是输入法背后的故事。
三、爆发与渠道推广
“搜狗输入法”项目一旦上线之后,就得到了很多好评。试想一下,今天如果有一个软件让你能无障碍地跟老外沟通,你会怎样?这就是当初输入法好评如潮的原因。输入法本身的意义就是帮助大家去表达,让表达速度快一倍。
我们很开心,在搜狐黄金广告位、导航栏里面推搜狗输入法。可是,一年时间,我们的市场份额仅仅是2%。这一次事情给我们很大的教训:之前,我们 认为一款好的产品,往搜狐上一放(那时我们认为搜狐是世界的中心)就应该收获巨大的份额,但市场打破了我的思路,就跟习惯牛顿经典力学的人突然接受到了量 子力学的理论一样。
当时搜狐有一种观念,就是“闭关”,认为跟别的网站链接,把流量分给别人,流失流量,就跟叛国一样严重。2% 的市场份额让我们认知到搜狐不是宇宙的中心,
这个系统存在裂痕。
后来,我们组建了团队,琢磨推广这件事情,我们到华军、太平洋下载站去打广告,当然,最重要的渠道是番茄花园,番茄花园是免费为盗版光盘提供母 盘为主营业务。番茄花园创始人跟我打了一个比方,Windows 是收费昂贵的毛坯房,土豪才用,而且还要自己改数法,装软件;而番茄花园是精装房,把基本配套软件打包了,所以一年有数千万收入。我们借这个东风与它合 作,使得我们的输入法在 Windows 覆盖下去了,所以我们的份额从 2007 年的2% 到 2008 年的 40%,再到 209 年的 70%,这就是我们输入法借助番茄花园得到的增长。
那个年代跟现在不一样,今天的网络特别发达,今天一个好产品可以很多人都知道,而当初,走渠道的广告力量更重要。我们今天还是认为,如果产品不是革命性的、颠覆性的、非用不可的,渠道还是非常重要,方便大家去下软件。
这就是输入法得到的一个宝贵经验。不管你产品多么好,你要把产品送达到用户手上去。
输入法给我们一个反思,即便它比别的产品好非常多,也很难在短期内得到份额,那搜索引擎呢?
我们之前受到了两个理论的影响:
第一个理论:有 20% 的用户会用两个搜索引擎。
这意味着我们要达到 20% 的份额,但其实因为百度已经做到家喻户晓,这时候当第一个搜索引擎满足不了他的时候,用户才会去使用第二个,20% 的人换第二个搜索引擎。实际上使用我们搜索引擎的份额是2%,而且这2% 的用户也很难得到满意的答案,因为百度的搜索引擎已经做得很强大了。
第二个理论:
用户一般从搜狐首页搜索栏进入搜狗搜索。
我们认为搜狐本身是一个百货公司,百货专柜越多,本身越权威,就是互相成长,可是实际上,他卖的是频道,而引擎是立即消费的事情,就跟买可乐一样,我们会去百货公司买可乐吗?这是我们在做输入法的时候明白的道理。
我们当时想通过“搜狗输入法”推出“搜狗引擎”,但这好比买了洗衣机后,结果发现里面装着 4 听可乐。我们后来发现,浏览器好比冰箱,拉开冰箱,发现里面的可乐是搜狗可乐,即使不是百度可乐,也会喝。于是我们就找到了一种打法,当你用搜狗牌洗衣机 (输入法),我们送你搜狗牌电冰箱,里面装着搜狗可乐。
因此,我们就进入了浏览器的研发。我们当时经历了蛮艰难的过程。“新型的输入法、浏览器、搜索引擎”构成了信息交互的三个源头,后来这种方法有两家公司都在用:360 和猎豹,而且他们更厉害,还可以杀掉你的软件。
四、与 Google 的意外摩擦
讲一场意外。2007 年 4 月 4 号,谷歌“拼音输入法”发布了,它很重视,这是他继发布谷歌平台之后的第二场发布会。2 点上线,3 点多我们的设计师反映谷歌“输入法”抄袭了我们的词库,比如我们打错的词,以及很多生僻的、一般不会上的词,谷歌也打得出来。
后来,我们采取的做法就是:我们的人给太平洋网络的人暴露消息。发布会一结束,太平洋消息也出来了:根据网友反馈,谷歌抄袭了搜狗输入网词库。 于是产生了很多的报道,我们也准备了一系列素材并发起了大量的宣传攻势。谷歌一直都没有应对,直到 5 天之后,他才发表声明:我们也经过一些网民反馈,发现我们输入法用了一些网上的数据。后来,双方开始骂战,谷歌说自己有专利,可是后面查实 2003 年毫无相关联专利,之后还花 120 万雇佣水军进行网络口水战。
网民还反过来质疑我们,说谷歌是技术大拿,应该是搜狗输入法贼喊捉贼。那时出现大量专题讨论这件事情,今天看来,也是很好的破冰事件,天时地利,刚好赶上和谷歌的一场官司。
有几个经验和大家分享下:
第一,不要神话谷歌的技术万能;
他的输入法不够好,因为任何公司都是有边界的,我们词库方面还有北大中文系的编辑,这也是我们的优势,同时,谷歌的技术是浙大一个兼职的实习生,而搜狗输入法的人才非常齐备,这也是他落败的原因;
第二,和大品牌吵架有利于提升品牌;
一吵架就有一堆人围观,易于品牌传播,现在这种机会越来越少。
第三,机会留给有准备的人;
搜狐在市场上非常彪悍,数据、技术都做得非常透,因此拥有很多优势,对付谷歌,跟对付纸老虎一样。
第四,危机公关有三原则:及时、透明、有诚意。
谷歌过了 5 天才发表声明,错过了最好的时间,而且谷歌先后改动口径也缺乏诚恳,违背了“透明且统一口径”的原则。
五、搜狗输入法的产品内涵
输入法的智慧、语法、词品都来自于互联网,所以,以互联网的眼光,让打字更省力,能少打一个字是一个字,以情景化的智慧来解决输入的问题,实际上这也是技术实力的展现。
我们做了很关键的一件事,就是云端,云输入法有什么好处呢?云端查询云,端放了 2 千万的词!本地词库是隔断时间更新,而云端则是实时更新。本地就是二元模型,云端是三元模型,就类似于是翻译机,所以可以让准确率达到非常高。
其实在谷歌之战中还有一个很重要的经验,认真把专利申请下来。我们把“云输入”叫做晦涩的“一种字词转换结果的获取方法及系统”,这是我们最基 本的模型。除此之外,为了打出更多的词,我们还用了什么方法呢?不是所有的词,都是靠云端收集的,我们知道中国人取名是有规律的,比如说王建军的“建”就 是建设的“建”,因此我们要去知道名字的秩序,我们去找了相应的数据,也通过内部的关系去人人网拿了关于人名的数据进行研究、拆解。移动端使用时,我们还会把通讯录的人名读取出来作为数据研究。
另外一个例子,很有意思,骰子这个字读(tou),但是 shaizi 也可以打出来,这也申请了一个专利在后面。
在词库这方面也有一个压力,互联网时代出现了很多词。比如,有一段时间火星文很火,因为个人觉得破坏传统文化,当时没有引进词库,后来就觉得自 己错了,自己太老态了:年轻人用新东西,应该支持它,让它发展。怎么让自己放下年龄的劣势,跟年轻人走,这是我现在所反思的问题。
我们去分析了键盘上的键盘使用情况,发现 Space,Backspace 使用频率很高,于是我们做了一个纠错系统,在“默默地纠正错误,好事不留名“和”嘚瑟一下,提示错误“中,最后我们还是选择了后者。
还有一些别的专利优化,比如说“联想输入”这些专利。再讲一个例子,我们发现小写字母,安卓本身带的输入法,会带来粘连,因为小写字母本身不 平,在视觉上会干扰到用户,因此我们进行了优化,把字往上提,并默认使用大写字母,因为他们更规则,字更平,并将字的间距拉开,在优化之后,搜狗输入法的 点击准确率的 85% 提高到了 90%。
改变一种行为习惯是有风险在的,是会被骂的。记得 QQ 有一次升级,就是变成全部在线状态,被骂得一塌糊涂。当初还有很多类似的暗讽段子,后来迫于舆论压力,QQ 改版回去了。
如何让输入法更省力,并让表达更有意思?
比如说:
走你(┏ (゜ω゜)=☞),
孙杨( ̄へ ̄)字符画,我们从“让输入法的打字更省力“变向”让表达更简单“。PC 里面不仅可以打文字,也还可以打好玩的表情,这一次我们发布了花边字,专供 IOS 用户用的,让表达变得更加好玩、更简单,帮你去做一些创作。
除此之外,我们也是最大的 UGC 皮肤基地:10 万多个皮肤、3 万多个作者。
在输入法背后,我们做了这样三件事:一个就是大数据,在这个“大数据“都快成了过时词汇的今天,我们用了 100 亿的网页帮用户编辑和表达;二是云计算,利用云端更强大的计算和存储资源去提供服务;三是全球最大的 UGC 皮肤园地之一。在这背后,就单单输入法,我们背后有 200 多项专利。IE 浏览、视频提取、号码库这些也都是我们做的创新。我们要把自己更多的精力放在产品和创新。
六、搜狗输入法的商业化启示
作为一个免费的输入法,怎么让它变得有商业价值。我觉得重要的是两个,第一个叫工具,第二个叫服务。
产品不能帮助用户做选择,而服务,就是用户对结果正确性无精确的定义,产品需要帮助用户做选择。工具的商业价值小,服务的商业价值大。
讨论下羊毛出在猪身上的问题,请注意,我们讲的是一款产品上的猪和羊的问题,而不是一个产品的价值转到另外一款产品上去。有时候服务的价值在哪?腾讯最 后是靠游戏是去赚钱;淘宝就是一个服务,搜索是排序的;微博本身是工具,它在信息流里插入了用户期盼之外的东西,它把“工具”服务化,之前因为政治因素避 免审查,微博会删掉一些消息,可是这样容易得罪用户,因而他后来就想了一个办法,把信息延迟展现出来,这也是微博的能力和权力,调配信息流的顺序,这也是 一种服务;非死book 插广告,用户接受了,就是一种服务。Hao123 是一种服务,编辑了一个选择范围给你。
番茄服务和 hao123,是两个很重要的服务模式。我们之前好奇,搜狐的访问来源是哪里来的,通过服务器查询发现 hao123 占了其中大概三分之一。
再说,智能硬件该是工具还是服务呢?我认为不带有帮助用户做选择的产品不算是智能产品,虽然有创新,但商业价值不高。工具,意味着智商等于0,你动一下它用一;智能意味着:0<智商<用户;而智慧则表示:智商>=用户。
所以,有三个概念:
1、从工具到服务;
2、从企业内部来讲,就是从连接到智慧;
当连接无处不在时,需要机器帮你做选择,这时候连接已经没有价值,而是判断连接产生价值。
3、智能硬件:从拟人到取代人。
现在冰箱联网了,电视机联网了,可是孩子还没联网,这是一个新的浪潮,拟人或者取代人。这时候我们看看,GOOGLE 在干什么?它在干无人驾驶,取代司机,开始会利用自己的视觉能力自己学习;Nest 在家里帮你调节温度、光线,是自己去探知你想要干什么;扫地机器人,取代保洁阿姨。
七、搜狗输入法的未来展望
那我们下一步想做什么东西?就是让表达和获取信息更简单。比如说在苹果手表里,一个框内输入,即便是滑行输入,都已经成为了一种很笨、不太被人所接受的做法,那我们设想搜狗通过短词去猜测你想要说什么,这时候,工具就变成了服务,在人的输入里面就会变得更加容易。
手机端对 PC 端的取代,并不仅仅是轻了,可以移动了,而是提供更好地认知世界的方式。如果我们把人的表达和对世界的感知追到极致,这让我想到电影《她》里面所描述的超智能系统,这是我对未来世界的构想。
希望大家在自己的路上都能够勇于突破,实现自己的理想。