Webhostingtalk资讯网

自动化:这是数据科学与机器学习的未来吗?

2018-01-17 09:41
作者:admin

  机器学习是计算机历史上最大的进步之一,现在人们认为它能够在大数据和分析领域发挥重要的作用。从企业的角度来看,大数据分析是一个巨大的挑战。例如,理解大量的并且不同的数据格式、为分析准备数据以及过滤冗余数据等工作会消耗大量资源。聘请数据科学家和专家是一项代价昂贵的任务,并非每个公司都能负担得起。专家认为,机器学习能够自动执行许多与分析相关的任务,包括常规任务和复杂任务。自动化机器学习可以释放大量的资源,这些资源可用于更复杂和更具有创新性的工作。机器学习似乎一直在朝这个方向发展。(如果您想要了解更多关于机器学习的使用的信息,请参阅《机器学习的承诺和陷阱》一文。)

自动化:这是数据科学与机器学习的未来吗?

  信息技术背景下的自动化

  在IT环境中,自动化能将不同的系统和软件连接起来,使它们能够在没有任何人为干预的情况下完成特定的工作。在IT行业,自动化系统既可以执行简单的任务,也可以执行复杂的任务。简单作业的示例是将表单与PDF集成并向正确的收件人发送文档,而提供离线备份是复杂作业的示例。

  为了完成这项工作,需要对自动化系统进行编程或给出明确的指令。每当需要自动化系统来修改其作业的范围时,就需要有人更新程序或指令集。虽然自动化系统的工作效率很高,但可能会由于各种原因而出现错误。错误出现时,需要确定并纠正根本原因。显然,要完成他们的工作,自动化系统运行完全依赖于人工操作。工作性质越复杂,出错和问题的概率就越高。

  通常,常规作业和可重复的作业会分配给自动化系统。IT行业中自动化的一个常见例子是网络用户界面测试的自动化。不同的测试用例被输入到自动化脚本中,并且相应地测试用户界面。(有关机器学习的实际应用的更多信息,请参见下一代欺诈检测中的机器学习和Hadoop)。

  支持自动化的论点是,它可以执行常规和可重复的任务,并使员工腾出时间来执行更复杂和更具有创造性的任务。然而,也有人认为自动化已经取代了许多以前人类从事的各个工作或角色。现在,随着机器学习进入到各行各业,自动化可以开辟出一片新天地。

  自动化是机器学习的未来吗?

  机器学习的本质是系统能够在没有人为因素干预的情况下不断地从数据中学习和进化。机器学习能够表现得像人脑一样。例如,电子商务网站中的推荐引擎可以分析用户的独特偏好和品味,并推荐最适合用户选择的产品和服务。有了这种能力,机器学习成为了自动化与大数据和分析相关的复杂任务的理想选择。它已经打破了传统自动化系统的主要的局限性,传统自动化系统不能在没有常规人工干预的情况下运行。许多案例研究表明,机器学习能够完成复杂的数据分析任务,这一点将稍后在本文讨论。

  正如前文所示,大数据分析对于公司来说是一个具有挑战性的任务,它可以把部分工作委托给机器学习系统。从企业的角度来看,这会带来许多好处,例如,为更具创造性和关键的任务腾出数据科学资源、完成更多的工作、花更少的时间完成任务以及更高的成本效益。

  案例研究

  2015年,MIT的研究人员开始研发一种数据科学工具,它能够使用一种叫做深度特征合成算法的技术,从海量的原始数据中创建预测数据模型。科学家们声称,该算法能够结合机器学习的最佳特性。科学家们表示,他们已经在三个不同的数据集上测试了这个算法,并打算将测试范围扩大到更多的数据集。研究人员James Max Kanter和Kalyan Veeramachaneni在一篇将在一个国际数据科学和分析会议上发表的论文中描述了他们是如何做到这一点的,“我们使用自动调整过程,在没有人参与的情况下优化了整个路径,使其能够推广到不同的数据集。”

  让我们来看看这个任务到底有多复杂:这个算法有一种被称为是自动调整功能的能力,有了这个能力,它可以从原始数据(如年龄或性别)中获得或提取见解或值,然后,它可以创建预测数据模型。该算法使用了复杂的数学函数和Gaussian Copula概率理论。因此,很容易理解算法能够处理的数据的复杂程度。这项技术也在比赛中获了奖。

  机器学习可能取代工作

  全世界都在讨论,机器学习可能会取代许多工作,因为它在以人脑的效率来执行任务。事实上,有人担心机器学习会取代数据科学家,而这种担心似乎有据可依。

  对于那些不具备数据分析技能,但在日常生活中还需要不同程度分析的普通用户来说,拥有能够分析海量数据并提供分析的计算机是远远不可的。但是自然语言处理(NLP)技术可以通过教计算机接受和处理人类的自然的、口头的语言来打破这一限制。这样,普通用户就不需要拥有任何复杂的分析能力或技能了。

  IBM认为,有了其产品——Watson自然语言分析平台,可以最大限度地减少或消除人们对数据科学家的需求。根据Watson Analytics和Business Intelligence的副总裁Marc Atschuller的说法:“有了Watson这样的认知系统,您只需要提出问题。或者如果您没有问题,您只需要上传数据,Watson就可以查看并推断出您可能想知道的内容。”

  结论

  毋庸置疑,自动化是机器学习的下一个阶段,我们已经在电子商务网站、Facebook好友建议、LinkedIn网络建议和Airbnb搜索排名等方面体验到了它对我们日常生活的影响。考虑到上述例子,毫无疑问,它们可以对自动机器学习系统产生的输出质量进行检验。尽管机器学习带来了种种好处,但说它导致了大量的失业问题,这似乎有点反应过度。几十年来,机器在我们生活的许多领域取代了人类,但是,人类已经进化并适应了在这个行业中保持相关性。从不同的角度来看,尽管机器学习具有破坏性,但这只是人们要适应的另一个潮流趋势。

网友评论
暂无评论!