曾经谈过一个道理,是说人工智能的科幻色彩固然能够引发公众的遐想和惊叹,但在实际应用层面,企业仍需考虑这项技术的功利用途,要有天马行空的瑰丽,也要有落地生根的务实。
历史学家认为战争和商业是推动人类进步的唯二因素,既然战争的代价实在过于高昂,那么拥抱商业也就成为仅剩的选项,驱使着天才们日以继夜的为之奋斗,人工智能在本质上和交流电其实并无区别。
而在中国的人工智能领域,有着这么一起案例,对于如何将高端深厚的技术落地到商用市场,或许有着相当的启发性。
说得更通俗一点,ProductAI的应用场景之一,就是向各类电商及零售平台提供技术支持,使其增加识图功能,用户能够上传拍得的照片,借助人工智能的计算能力,寻找同款大衣、同款包包甚至同款面料,从而承接消费行为。
是不是距离想象中高大上的人工智能,有着那么一点点儿不一样?
甚至有人会问,这也属于人工智能吗?实际上也有黑客在论坛回复:这确实是属于非常正宗的人工智能。以前图片是一种静态的存在,ProductAI更像一个能量模块,它有给图片打标注的能力,将会让每一张图片都拥有了自我认识的能力,进而和更多的图片进行交互。
以图搜图曾是专业搜索引擎的功能,随着Google、Bing和百度等通用搜索引擎的加入,它的黑科技成分被稀释了不少,图片识别的原理和文字相仿,都是通过比特化的拆解,记住信息内容的特征,然后再由机器在数据库中去进行匹配,交给用户最为接近的结果。
就像机器翻译永远只会逐字逐句的获得词语转化而无法理解语义和修辞,人工智能所能起到的作用,就是模拟人脑的思维结构来优化这项工作,通用搜索引擎的「以图搜图」在很大程度上只能采取「撞库」的形式索引信息,当两张图片的元素略有不同——拍摄角度、遮挡情况、成像质量等——时,准确匹配的难度就很高了,打个比方来说,机器可以在一秒钟之内,从上亿张图片里找到相同的两张,但是想要让它理解猫和狗是两种不同的动物,却是有着登天之难。
早些时候,Facebook的机器算法就曾将丹麦哥本哈根的著名雕塑小美人鱼的照片判断为色情内容而进行屏蔽,引起舆论一片哗然。而在微博上,博物杂志这种识别各种植物的人肉搜索引擎受到广泛欢迎,无疑是对现有识图技术的赤裸裸的嘲讽。
解决不了准确性,就很难开启商业化的进程,在实验室里留得太久,也会造成技术研发和市场需求的错位,虽然标准化的识图应用——比如针对K12人群的拍照解题类产品——在最近几年已经隐有气势,但在真正产值巨大的企业级市场,人工智能和识图引擎的结合还存在着相当充裕的空白。
在ProductAI的后台提供支持的是一套神经网络,它不是压缩图片的像素去进行对比识别,而是用海量的学习和消化来理解图片的含义,并进行语义提取。
看上去,在互联网企业越来越讲究赋能的时代,反而会让传统企业的春天提早到来,马云说互联网会成为未来的电能。
人工智能就符合这样的说法,在可见的阶段里,它并不适合作为一款商品放在超市的货架里供人选购,但是任何企业必然都需要它的力量,作为增益服务的关键道具。
有个令人捧腹的故事是说,某款逼死拖延症患者闹钟应用的运行模式,是让人在睡前拍下一张静物照片——比如客厅的电视机——那么在次日早晨响起时,用户必须起床前往客厅,在同样的角度也拍下一张照片,当两张照片被判断为一致时,闹钟才能被关闭,以此来逼迫那些喜欢随手按掉闹钟的贪睡者。
只是有一次,一名用户在临睡前拍下的照片是冰箱里的一个苹果,第二天早上当他打开冰箱时,发现那个苹果被室友咬了一口,这下就不好收拾了,闹钟的铃声无论如何都停不下来,换上一个新的苹果都没办法骗过系统,于是只好重新刷机,把手机还原到初始状态。
显然,人工智能的理论和畅想如何炫目,都比不上解决这类问题来得痛快。