GE和硅谷的数据专家与日本是完全不同的。在日本,隶属于信息系统部门,仅从事数据分析的负责人就被称为数据专家。但在硅谷,数据专家是名副其实的“专家”。研究生院取得博士学位的研究者进入硅谷创业公司,作为数据专家直接参与同商业直接相关的数据分析业务的例子比比皆是。
由于他们原本是研究数据方面的学者,即便进入民间企业后,也保持着在大学或者研究机构等学术界所拥有的习惯。他们在硅谷创业公司开始工作后,通过业务开发习得的新型数据分析手法也作为自己的研究成果写成论文,然后在学会发表这样的例子不胜枚举。
由硅谷著名的创业公司共同举办,集合了各公司的数据专家,并让他们按照学术风格发表自己研究成果的大规模研讨会时常举办。其中,最具人气的是2012年之后,每年在硅谷举行的关于深度学习的“Bay Learn”论坛。
深度学习是这几年人工智能性能提升的最重要的推手,同时也是“机器学习”的一种方法。它模拟人类大脑的结构,使用“深度神经网络(deep neural network)”进行学习。深度学习在语音识别、图像识别、机器翻译等领域中取得了非常大的成绩。以大数据分析为核心竞争力的美国谷歌、Facebook、苹果,以及中国的百度等高科技巨头,同时还有获得风投巨额资金的硅谷创业公司,都从学术机构中拼命争抢深度学习方面的研究人才。
深度学习研究者对于将自己的研究成果作为论文发表的积极性很高。这是因为深度学习的技术进化速度特别快。如果不能参加学会发表自己的研究成果,得不到其他研究者的反馈和想法,自己的知识和技能马上就可能过时。
所以,在硅谷,如果企业不允许将自己的研究成果向外部公开的话,是没有办法招聘到优秀的深度学习研究人才的。以保密主义著称的苹果公司长时间禁止自己的工程师在外部发布研究成果。但是,当苹果公司意识到这个制度是没有办法招聘到优秀的深度学习研究者之后,2016年末其取消了员工向外面发表研究成果的禁令。
2016年11月召开的“Bay Learn”论坛是由微软的子公司领英(LinkedIn)举办,谷歌、Facebook、百度、领英等科技公司的工程师、研究者共同发表成果。不仅有口头的论文发表,也有利用午餐或者晚宴的时间将自己的研究成果印在海报上向参与者介绍的“海报演讲”,会议氛围与某些领域的学会没有太大区别。
笔者是在“Bay Learn”论坛上结识了第3章介绍的GE数字的数据专家廖林峡的。廖林峡利用工业机械安装的传感器收集的数据进行故障预测。他针对故障预测模型所采用的深度学习这一研究内容进行了“海报演讲”。(www.daowen.com)
廖林峡来自中国,他在中国湖北省的华中科技大学毕业后赴美留学,获得了美国俄亥俄州辛辛那提大学的工学博士学位。随后在美国新泽西州的德国西门子研究所、硅谷最著名研究所美国施乐帕罗奥多研究中心(Palo Alto Research Center)从事健康及IoT数据的研究工作。2015年,他入职GE数字。
他进入GE后,首先在GE运输部门从事货运列车的故障预测工作。然后,轮岗到GE能源,从事发电机等相关的数据分析工作。他说:“数据分析的方法论和工具在不同领域之间并没有什么不同,这种轮岗很常见。”
廖林峡参加“Bay Learn”论坛并进行海报演讲的契机,来自同事的建议。他回忆说:“GE运输的货运列车故障预测模型使用传统机器学习的方法进行开发,并导入了实际的系统。然后,我想‘如果用深度学习的方法改良这个预测模型会产生怎样的效果呢’,于是开始了研究。我的同事建议我说,如果将这个研究成果在‘Bay Learn’论坛上发表,可能会得到在其他企业工作的数据专家的宝贵意见。你为什么不去试试呢?”
实际上,他在“Bay Learn”论坛进行海报演讲时,不仅仅与硅谷的技术企业,还与德国博世等制造行业供职的数据专家进行了讨论。
他解释自己在GE数字工作的意义时说:“数据分析的技术进展太快了,与其他研究者进行对话是不可或缺的。由于GE数字的硅谷本部汇集了各业务部门的数据分析专家,所以可以很方便地与其他研究者进行交流。我的团队中就有来自南加州大学的副教授,这里的工作是十分刺激的。”
集聚优秀的数据专家也是硅谷的“规律”之一。GE忠实地实践着这一“规律”。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。