苹果公司2亿美元购入专门挖"暗数据"的AI小公司

2017年5月14日,美国的《福布斯》报道了人工智能初创公司Lattice.io 被苹果收购的消息,苹果随后官方确认了这次收购。此后,又有媒体爆料收购的金额为2亿美元,收购在数周前已经完成,Lattice.io的20名员工加入苹果。

Lattice.io 虽然成立时间不长,但是创始人大有来头。Mike Cafarella是密歇根大学的助理教授,也是著名的数据库系统领域的专家,曾与别人共同设计了 Hadoop 系统。

而另一位创始人 Christopher Re 教授来自斯坦福大学,此前曾构建了机器学习系统DeepDive。Lattice公司的成立正是为了实现 DeepDive 系统的商业化。

Lattice 的投资方包括谷歌风险资本(GV)和 Madrona 等机构。

简单地来说,Lattice.io可以从大量从未被仔细研究过的暗数据(dark data)中挖掘出有价值的信息。虽然每天传感器、互联网和移动设备等都会产生大量的数据,但是这些数据往往杂乱无章,缺乏结构。

举个例子,全世界的学者都会发表成千上万篇论文,但这些论文中既有统计数据,又有图片数据、引用数据、文本数据等等内容,非常难以实现结构化。

Lattice.io 的 DeepDive 系统正是可以从这样一些杂乱无章的数据中提取出结构化的信息,储存在结构化的数据库里。

目前,DeepDive 已经在很多领域产生应用,比如对抗人口贩卖活动。根据国际刑警组织的分析,人口贩卖已经成为仅次于毒品和武器走私的全球第三大非法贸易。

贩卖的人口主要在工厂中从事强迫性的苦力工作或者被迫成为性工作者,人口贩子可以从相关的流程中获得分成。作为商业流程中不可或缺的一环,贩卖人口的广告也总会在网上露出一些痕迹。

于是,Lattice 参与了美国国防部领导的 Memex 项目,负责从网页求职广告数据中抽取出与人口贩卖相关的结构化数据。互联网上有海量的广告网页,可以理解成一个个 HTML 文件,里面既有 HTML 的标签,也有非结构化的文本内容。

项目的其他参与者从网上找到了3000万条和性服务有关的广告。

虽然不同的广告形式、内容、风格都不相同。不过通过DeepDive系统,可以把这些广告所含的信息整理成表,包括不同的列,比如:广告的链接、广告中联系人的姓名和电话号码、工作地点,以及工资等。

这样,网络广告数据就变成了一张可以存储在 SQL 甚至 Excel 中的表格。

图丨DeepDive的人口贩卖跟踪系统

在赋予了数据结构后,数据分析师就可以利用这些表格进行有目的的数据分析工作,比如,回答了以下几个问题:如何判断某个工作广告是否面向被贩卖的人口?如何了解人口贩卖组织的内部结构?如何帮助执法者找到危害最大的人口贩卖集团,解救处境最危险的受害者?

因为有了DeepDive,复杂的分析性工作变成了简答的数据库查询任务。

例如,人口贩子经常移动受害者,保持对他们的控制。所以如果求职者经常变换工作地点,说明他们更有可能被人控制。

此外,没有被贩卖的性工作者存在经济上的理性,会提出合理的价格并规避风险加大的行为。如果一个求职个体要求非市场化的价格或提供非正常性的服务,就应该引起执法者的注意。

关于苹果公司的AI布局

苹果公司并没有过多地透露这次收购的具体细节,只是在一则声明中表示:“苹果公司会不时收购一些小型技术公司,但我们通常不讨论收购的目的和计划。”

Lattice.io 是苹果在在过去2年多时间里收购的至少第三家人工智能公司。2015年10月,苹果收购了语音技术公司VocalIQ,此举被认为用于增强语音助手 Siri 和未来的汽车搭载交互系统。

2016年8月,苹果又斥资2 亿美元收购西雅图的人工智能初创公司 Turi,并随后成立了机器学习部门。

和其他硅谷的巨头相比,长期以来苹果并不以人工智能著称。Facebook 的人工智能负责人 Yan LeCun 曾经公开表示,苹果并不是人工智能研究圈子中的一员。

一方面是因为苹果的公司文化不算开放,也很少发表人工智能相关的学术论文;另一方面则是因为苹果在挖掘用户数据和保护用户隐私的平衡中更偏向后者。

然而,每个季度都能卖出几千万台手机的苹果公司显然不能忽视用户数据带来的巨大红利。早先收购的人工智能公司往往被认为有非常具体的产品整合目的,尤其是相关的语音分析技术可被用来增强Siri系统。

但对于 Lattice 的这次收购,无疑可能将在更大的尺度上帮助苹果整合并分析收集到的各种数据。

毫无疑问,手机作为一个多媒体终端,获取的数据会非常杂乱多样,可能包括用户的位置数据、App使用记录、文字、图片、视频等等。如果能从这么多非结构化的信息中抽取出数据整理成表格,有可能将苹果的数据分析水平提升一个层次。

此外,DeepDive在医疗领域也有应用。如果向系统输入大量生物医学领域的论文数据,系统就会自动提取论文中提及的疾病、基因、表型形状等关键词,还能从论文中挖掘出药物和身体分子相互作用的关系。

考虑到苹果长期以来在医疗领域的布局,DeepDive的这些功能也有可能派上用场。

SOURCE: http://tech.163.com/17/0515/19/CKGJL5T900097U7T.html

TAG: 苹果

上一篇:韩国节目谈中国手机支付消费 直呼:好神奇