本文转载自公众号“读芯术”(ID:AI_Discovery)
据麦肯锡全球研究院的研究,截至2030年,人工智能每年将额外创造13万亿美元的价值。
其实在今天,人工智能已经在创造收益了,但主要集中在软件领域。然而当到了2030年,在软件行业之外,人工智能也将创造巨大收益,尤其是在零售、旅游、交通、汽车、材料、制造等行业。不过,这样的预测也可能是炒作。人工智能的黄金法则指出,对于人工智能技术不能太乐观,也不能过于悲观。
人工智能、机器学习、深度学习这些热词近来被频繁使用。让承认人工智能将融于世界的现实期望固然很赞,但了解和揭秘人工智能同样意义重大。这篇文章将阐述人工智能的所有概念,全面理解人工智能,避免混淆这些概念。
话不多说,让我们开始吧!
缩小人工智能领域
人工智能是一个犹如银河系的庞大话题,拥有很多子类,如自然语言处理(NLP)、人工神经网络、计算机视觉、机器学习、深度学习、机器人等等。
人工智能的正式定义如下:“可执行通常需要人类智能(如视觉感知、语音识别、决策和语言之间的翻译)的任务的计算机系统的理论和发展。”在开始深入研究其他领域之前,人工智能可以缩小到以下两个更广泛的领域:
狭义人工智能——按照编程执行一个或几个特定任务。例如自动驾驶汽车、下词预测、自动更正等。这是我们要关注的主要概念。 广义人工智能——执行类似人类的活动和任务。通用人工智能是一种可以像人类一样高效执行任何智力任务的智能,在这个领域我们还有很多路要走。
还有另一个词是超级人工智能或强人工智能,被认为是可以超越人类的人工智能。然而,目前这只是个假设,本文将不对此展开讨论,在未来几年内达到这种智能水平还很难。
为了理解人工智能的概念以及人工智能相关的各个方面,可以以宇宙为例做一个简单的类比。
庞大的银河系类似于广阔的AI领域,它包含了数十亿个太阳系,就像AI由众多子领域组成。太阳系就如同人工智能中的一个子领域,即“机器学习”。地球是太阳系中唯一的宜居星球,可以称为“深度学习”。为更好地理解这个类比,下面有一个简单的等式:
人工智能=银河系;机器学习=太阳系;深度学习=地球
机器学习
机器学习是指程序在没有被明确编程的情况下,自动学习并提高其效率的能力。即给定一个训练集,训练机器学习模型,模型将理解其工作原理。经过测试集、验证集或任何其他看不见的数据测试后,模型仍然能够评估特定的任务。
用一个简单的例子来解释,假设有一个包含30000封邮件的数据集,其中一些被归类为垃圾邮件,一些被归类为非垃圾邮件。机器学习模型将在数据集上进行训练。训练过程完成后,就可以用训练数据集外的邮件来测试。机器学习模型可以对后面的输入进行预测,并对输入的邮件是否为垃圾邮件进行正确分类。
机器学习主要有以下三种类型:
监督学习——这是用特定标记的数据集训练模型的方法。这些数据集可以是二分类或多分类,它们将有标记的数据,指定正确和不正确的选项或选项的范围。在监督下,即在标记数据的帮助下,对模型进行预训练。 无监督学习——无监督学习是指在未标注的数据集上训练模型。这意味着模型没有任何先验信息,它通过将相似的特征和模式分组在一起进行自我训练,区分狗和猫就是无监督学习的例子。 强化学习——强化学习是一种尝试方法模型。这种模型通过反复失败来学习。没有达到预期的结果时,该模型将重新训练。这可以应用于像下棋这样的概念中,在下了几百万盘棋后,模型将学会正确的模式和步骤。
数据
数据可以是任何有用的资源或可用的信息,适用于机器学习或深度学习任务。你想要构建的每个模型都有大量的数据可用,重要的是,找到完成评估所需的有价值的数据。
数据集是一个数据的集合。对于表格数据,一个数据集对应一个或多个数据库表,表中的每一列代表特定的变量,每一行对应相关数据集的给定记录。
当今,人工智能的普及速度比以往任何时候都要快,这要感谢数据在不断丰富和增加。数据越多,机器学习或深度学习模型得到的训练更好,因为能够在更大的数据集上训练模型,有助于模型在训练过程中更好地学习,从而更好地执行当前的任务。
数据科学是关于数据的。这个词有时可能会被忽视,可它却是所有项目最宝贵的资源。大数据、数据科学和数据分析的领域正在极大地增长,科技巨头们正在加大对收集有用数据的投入。数据收集是在一个既定的系统中收集和测量目标变量信息的过程,然后使人们能够回答相关问题和评估结果。
深度学习
深度学习是机器学习的一个子领域,基于人工神经网络的概念来执行特定任务。人工神经网络的灵感来源于人脑。然而,理论上深度学习的运转并不像大脑。之所以将其命名为人工神经网络,是因为它们可以完成精确的任务,同时达到理想的精确度,不需要根据任何特定规则来编程。
几十年前,深度学习非常流行,但由于缺乏数据和无法进行复杂计算,最终失去了热度。过去几年,情况大有改观。每天都有大量丰富的数据,大型科技巨头和跨国公司都在投资这些数据。有了强大的图形处理单元(GPU),计算能力也不再是什么大问题。
深度学习如今非常流行,并且具有超越现代大多数机器学习算法的巨大潜力。
人工智能是当下发展最快的领域。据《财富》统计,在过去4年里,人工智能专家的招聘人数增长了74%,被认为是当下“最火爆”的工作。经验丰富的人工智能专家的需求量正在以前所未有的速度增长。机器学习、深度学习、计算机视觉、统计学和自然语言处理等人工智能子领域的专家需求和空缺职位每天都在激增。
我们很幸运能处于人工智能崛起的时代。我们周围到处是人工智能,身边有很多机会。我非常期待未来的新技术和人工智能的崛起!