文章转载自:百度世界2015,“度秘”讲了一则怎样的故事
阿兰·图灵认为,如果一台机器能够与人类展开对话而不能被辨别其机器身份,那么它就抵达了可被称为人工智能的境地。
有趣的是,以1991年为始,不断有人宣称某款聊天机器人“史上首次”通过图灵测试,由于人类样本缺少标准,多数用于挑战的机器人程序都力求“伶牙俐齿”,注以讽刺、反问、厌倦等情绪语句试图蒙蔽人类对象。
一言蔽之,我们对于“人性”的要求,或许与阿兰·图灵在六十多年前的设计初衷早已分道扬镳:人工智能的优劣,在于它能否取悦规则,而非伦理或是哲学层面的突破。
故而微软小冰的卖萌战术能够横扫中文社交网络,调戏Siri也成为了风靡世界的某种恶趣味。不是恐怖的拥有自我学习能力的机器人在挑战位于智慧种族顶端的人类,而是愚蠢不堪的人类在绞尽脑汁的挑战机器人、试图难倒后者或是使其“出尽洋相”。
娱乐至上始终是主旋律,就像当今智能手机的计算能力早已远超美国发射阿波罗11号探月的大型计算机,但是人们仍然只会摩擦屏幕玩着《愤怒的小鸟》。然而,这并不妨碍科技企业抢占未来机遇的决心,人工智能的性质意味着它作为解决方案具有高度的统筹能力,不可替代性极高。
在美国,语义分析、深度学习等领域的专家早被瓜分一空,苹果、Google、亚马逊和微软,纷纷开始尝试说服本土高校的教授们放弃终身制的教职加入商业公司,它们同时还要提防学习能力过强的中国竞敌横刀夺爱,当Google失去了吴恩达、微软失去了张亚勤之后,接盘者的受益效果很快显现:“BAT”之中,百度第一个拿出了完成度极高的机器人助理产品“度秘”。
“度秘”亮相于百度年度最高规格的活动“百度世界”,李彦宏将其使命描述为“索引真实世界”,一语道出百度对于人工智能的定义:它不应当是一个排解无聊、逗人捧腹的玩物,而是一款具备主动计算能力、接管用户生活需求的工具。
包括李彦宏在内,百度负责技术的几名高管,都将发言重点聚焦于“度秘”的技术天赋以及解决问题的简洁路径,“百度提供的秘书”这一命名的国情特色相当突出,所谓“秘书”,符合的其实是召之即来挥之即去、能办事儿却不多话的岗位想象。
如果说“我是谁、我从哪里来、我到何处去”是哲学经验的三大终极问题,用于商业化的人工智能产品同样需要回答这三个问题:“我是谁”意指身份认同问题和能力边界问题;“我从哪里来”意指数据来源问题,处于计算的底层;而“我到何处去”意指用户服务问题,处于计算的前端。
这是2014年百度技术开放日揭晓的“百度大脑”项目的运作原理图解,它与李彦宏在今年百度世界上解说“度秘”时划分的三个层级——底层连接3600行、中层全网数据挖掘、上层理解用户需求——是一脉相承的:
首先要解决的,是突破App的孤岛效应而获取数据。当超链接文本协议在移动端全面失效,通过爬虫进行索引收录的方式也就变得遥不可求,所以“连接能力”进而显得至关重要,即应用方需要主动加入进来贡献数据,而实现这一诉求的前提,是要取得应用方的信赖和足够分而食之的利益。
其次要解决的,是有了数据之后,怎样处理这些数据。“大数据”的概念虽火,但是数据规模越大,冗余存量也就越多,缺少提炼能力,这些数据就只会消耗储存空间。吴恩达在Google时曾使深度学习系统能够识别猫的图片,这在当时成为一件震惊业界的新闻。吴恩达在百度继续的神经网络技术,目的也是驱动技术的变革,将数据的获取途径进一步延伸到各类传感器上。
最后剩下的,就是与用户发生沟通,接受市场的检验。百度曾被质疑移动战略杂乱无章,但是随着时间推移,所有的布局都被连成了一条线,即手机百度(入口端)、百度糯米(交易端)、百度地图(本地端)三点一线,“度秘”最为技术支持,成为撑起所有服务的一根支柱。
李彦宏与比尔·盖茨私交甚好,他们或许属于同一类极客——后者创办微软之前,曾经毫不客气的批评另一群主张破解与共享的极客“使用软件需要付钱”——信奉技术的力量,并追求将之发扬实现回报。
因此,相比Siri和Google Now,“度秘”的实用主义色彩十分显眼,它的舞台在其诞生之前就已搭好,货币化的前程亦可预期,这种取舍,让人想起李彦宏的早年经历:他在松下信息技术研究所实习时就已在涉足人工智能的识别效率课题,而工业研究解决实际问题的特点使李彦宏放弃校园研究以及博士学位,转投道琼斯旗下开发搜索技术。
换句话说,在李彦宏看来,不能被商业市场接纳的技术产品,都有违他的职业价值观。这种坚持,亦影响了百度的团队作风,比如还是吴恩达,他在Google用面部识别技术学会了认猫,在百度则是开发出了名为“脸优”的换脸App,上架iOS试图冲击“爆款”。