理论教育 智能商业的引擎:算法化的实现

智能商业的引擎:算法化的实现

更新时间:2025-01-03 理论教育 版权反馈
【摘要】:我们提到算法时,常常会接上另一个词——“引擎”。只有算法才能让数据中的能量得以完全喷发出来,为智能商业这辆“汽车”推进加速。这些可能因素中有些具有决定性的价值,有些却是彻底的“噪声”,而且,它们还在实时发生着变化。这就是我们将算法称为智能商业的“引擎”而非“工具”的关键理由,它是智能的核心。基于数据和算法,完成“机器学习”,实现“人工智能”。

我们提到算法时,常常会接上另一个词——“引擎”。这是一个奇妙的比喻,因为如果我们将数据看作是DT(data technology,数据处理技术)时代的一桶高标号汽油,那么算法无疑就是这台引擎。只有算法才能让数据中的能量得以完全喷发出来,为智能商业这辆“汽车”推进加速。

搜索是第一个数据和算法驱动的互联网产品,使我们每个人都可以在海量的互联网数据中找到最相关的信息。谷歌的成功正发源于其创始人提出的PageRank算法。谷歌创造的另一个功能强大的算法是其在线广告市场引擎——pay per click(点击付费广告),每天都有价值10亿美元以上的在线广告通过这一算法投放到最合适的观众面前。

在商业语境下,算法就是一组反映了产品逻辑和市场机制的计算指令的集合。完成了商业场景的数据化之后,算法就是提炼数据价值的思路,而DT时代的数据价值就是商业价值。如同谷歌正在做的,我们每个人打开过的那些商品的页面、网购的某件商品,都无疑是数据的“金矿”,但只有当在线广告的算法引擎从中挖掘出每件商品的潜在买家,并据此投放广告时,这座数据金矿的价值才真正被开发出来。

算法看似高精尖,但实际上,算法在我们的日常生活中早已无所不在。不仅是手机和汽车,在房子里、电器里、玩具里都藏有算法。现在的银行是错综复杂、规模巨大的算法聚合,只是当中会有人时不时地微调一下罢了。世界上主要的股票期货市场,看似有无数的交易员以各种手势不知疲倦地报价买卖,但真正“不知疲倦”地记录各种数据,做出空单或者多单决策的同样是算法,而交易员常常只是算法决策的执行者。算法制定飞机航程,然后把飞机开走;算法管理厂房,进行贸易,控制货物流通,兑现利润,甚至做账。

Polyphonic(一家针对音乐和唱片公司的技术研发公司)开发的算法用数学函数解构歌曲的曲调、节奏、和弦进程、声音饱满度等指标,来预测一首新歌能否流行。有一个名不见经传的歌手的新专辑,据算法分析,该专辑14首歌中有9首能登上流行排行榜,连写这个算法的工程师都觉得难以置信。这张名为《跟我远走高飞》(Come Away with Me)的专辑最终热销2000万张,那名叫诺拉·琼斯(Norah Jones)的歌手当年获得5项格莱美奖。

设计一套算法并非易事,工程师需要以机器可读的语言编写,然后进行千丝万缕的测试,找到复杂编码中的每一个问题。久而久之,计算机工程师研发了无数个互相关联、互相依赖的算法,形成了编码的生态系统。然而这套生态系统中的复杂程度日增,系统中的小问题也会迅速蔓延。算法与算法之间的相互作用,乃至算法本身,其复杂程度开始胜过人类的脑容量。不夸张地说,如果有一天一切算法都骤然失灵,那世界即便谈不上毁灭,也会了无生趣。

算法是什么?让我们回到这个基础问题上。算法是按照设定程序运行以获得理想结果的一套指令。

人类可见的最早算法来自两河流域的苏美尔人,他们留下的一块距今4600年的泥板上刻着一段文字,写的是利用小型称量工具,在人数不定的一群人中平均分配几千公斤谷物可重复使用的方法。计算机的发明使算法的功能被极大提升,因为在做重复性工作时,计算机显然更具优势,而人们要做的是运用计算机语言将众多极为简单的指令组成非常复杂的逻辑推理链条。譬如,做蛋糕的时候该加一小勺白糖,人可以执行,计算机可不行,它首先必须知道白糖是什么;其次,“一小勺”的量不够精确;最后,计算机也不知道怎么“加”,从如何拿起勺子到如何移动勺子再到如何把勺子里的白糖倒到碗里,计算机都需要明确的指示才能执行。可见,算法是一种严苛的标准。(www.daowen.com)

不过,随着算法对我们日常生活的渗入,一个小错误就可以击垮整个系统,导致火箭陨落、电网崩溃、市场坍塌,前两者我们或许还没见到实例,但是因为算法的一个小错误引发连锁反应导致市场崩盘的惨剧确实发生过。2010年5月6日,美国股市就曾因为计算机算法停止竞价,导致股价大幅下跌,市场崩溃,这种情况被人们称为“闪电崩盘”。

那么怎样避免这样的情形再次发生?怎样让算法越来越聪明?怎样让算法超越人类既有经验,创造出前所未有的价值?这些领域都有巨大的发展空间。

算法是“机器学习”的核心——笨机器用笨办法,靠着算法的持续迭代优化,变得越来越聪明。即便是一个非常粗糙的算法模型,也可以在实时在线、全本记录的数据中,通过没有预判和方向的数据探索,来发现那些广泛潜伏但我们无从察觉的关系结构,并持续优化。

这是算法的又一次决定性的跃升。[2]也是在这次跃升中,数据对算法的巨大作用被充分显现出来。任何一个算法模型,尤其是能够自我学习、自我优化的算法模型,比如股票市场分析模型或者巧克力爱好者口味偏好模型,都承担着在成千上万个可能的因素中寻找出所隐藏着的联系的艰巨任务。这些可能因素中有些具有决定性的价值,有些却是彻底的“噪声”,而且,它们还在实时发生着变化。所以算法真正要准确地预测股价,或是猜对某种朗姆酒口味巧克力的受欢迎程度,就必须通过分析海量数据来实现,必须在实时更新的数据中快速迭代优化。

机器学习的原材料是数据,数据越多越好。并且机器学习能够克服各种复杂情况,只要数据足够丰富,简单的学习算法可以轻松编写百万行长的新算法,工程师的工作轻松多了。工业革命使得体力劳动自动化,信息革命使得脑力劳动自动化,而机器学习使得自动化过程本身自动化。战胜围棋本身并没有什么商业价值,但它带来了算法的突破,而这种突破肯定可以被应用到不同的商业场景中。

数据时代的智能商业对算法提出了全新的要求:算法的迭代方向、参数工程等,都必须与商业逻辑、机制设计,甚至价值观融合为一。当算法迭代优化时,决定其方向的不仅是数据和机器本身的特性,更包含了我们对商业本质的理解、对人性的洞察和对创造未来商业新样貌的理想。

这就是我们将算法称为智能商业的“引擎”而非“工具”的关键理由,它是智能的核心。基于数据和算法,完成“机器学习”,实现“人工智能”。第三次工业革命发展到今天,计算方法已经产生了从量变到质变的飞跃,可以说是数据时代最根本的特征。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈