人工智能(二)

Russell 和 Norvig(1995、2002、2009)在他们前面提到的 AIMA 文本中,为“什么是 AI?”这个问题提供了一组可能的答案。这个问题在该领域本身具有相当大的流行度。这些答案都假设人工智能应该根据其目标来定义:因此,候选定义的形式是“人工智能是旨在构建……的领域”,答案都属于沿二维放置的四重类型。一个维度是目标是匹配人类表现,还是理想理性。另一个维度是目标是构建推理/思考的系统,还是构建行动的系统。情况总结如下表:

以人为本的理想理性

基于推理:像人类一样思考的系统。理性思考的系统。

基于行为:像人类一样行事的系统。理性运作的系统。

AIMA 认为人工智能的四个可能目标

请注意,这四种可能性确实反映了(至少很大一部分)相关文献。例如,哲学家 John Haugeland (1985) 落入了人类/推理象限,他说人工智能是“令人兴奋的新努力,让计算机思考......具有思想的机器,从完整和字面意义上讲。” (到目前为止,这是大多数流行叙事所肯定和探索的象限。最近的《西部世界》电视剧就是一个有力的例子。)卢格和斯图布尔菲尔德(1993)似乎落入了理想/行动象限,他们写道:“计算机科学的一个分支,关注智能行为的自动化。”人类/行为的立场最突出的是图灵,只有那些能够充分像人类一样行动的系统才能通过图灵的测试。温斯顿(Winston,1992)捍卫了“理性思考”的立场。虽然断言这里给出的四个分类是详尽无遗的可能并非完全没有争议,但即使仔细研究了迄今为止的文献,这种断言似乎也是相当合理的。

重要的是要知道,对思考/推理系统与行动系统的关注之间的对比,虽然正如我们所见,是 AIMA 文本的核心,也是人工智能本身的核心,但不应被解释为这意味着人工智能研究人员认为他们的工作全部且仅属于这两个部分之一。或多或少专注于知识表示和推理的研究人员也很愿意承认,他们正在研究(他们认为的)跨越推理/行为的大型系统家族中任何一个的核心组件或功能。区别。最明显的例子可能来自规划工作——传统上集中使用表示和推理的人工智能领域。无论好坏,大部分研究都是在抽象中完成的(体外,而不是体内),但参与的研究人员当然打算或至少希望他们的工作结果可以嵌入到实际做事的系统中,例如,执行计划。

拉塞尔和诺维格本人呢?他们对什么是人工智能?的答案是什么?问题?他们坚定地站在“理性行事”阵营。事实上,可以肯定地说,他们既是这个答案的主要支持者,也是非常成功的传播者。他们极具影响力的AIMA系列可以被视为理想/行动类别的一本书长的辩护和规范。稍后我们将看看 Russell 和 Norvig 如何用智能代理来布局所有人工智能,这些智能代理是按照各种理想理性标准行事的系统。但首先让我们仔细看看 AIMA 文本背后的情报观点。我们可以通过转向 Russell (1997) 来做到这一点。罗素在这里重新审视了“什么是人工智能?”问题就像“什么是智力?” (大概假设我们很好地理解了人工制品是什么),然后他将智能与理性等同起来。更具体地说,拉塞尔将人工智能视为致力于构建智能代理的领域,智能代理是将来自外部环境的感知元组作为输入元组,并根据这些感知产生行为(动作)的函数。拉塞尔的总体情况是这样的:

“感知历史”到“代理功能”到“行为”到“环境”到“感知历史”;也可以从“环境”到“国家历史”到“绩效衡量标准”

罗素关于智力/理性的解释的基本图景

让我们稍微解开这个图,首先看一下可以从中导出的完美理性的解释。环境中代理的行为

(来自一个班级

环境)产生该环境的一系列状态或快照。绩效衡量标准

U

评估这个序列;请注意上图中标有“绩效衡量”的框。我们让

V

f

,

,

U

,

,

表示预期效用

U

代理函数的

f

操作于

[16] 现在我们用代理函数确定一个完全理性的代理:

(1)

f

p

t

=

精氨酸

最大限度

f

V

f

,

,

U

(1)

p

t

=

精氨酸

最大限度

,

,

根据上式,完全理性主体可以被视为函数

f

p

t

它在所考虑的环境中产生最大的预期效用。当然,正如拉塞尔指出的那样,通常不可能真正构建出完全理性的智能体。例如,虽然指定一个下无敌棋的算法很容易,但实现这个算法是不可行的。人工智能中传统上发生的情况是,用罗素的恰当术语来说,构建的是计算理性的程序:这些程序如果无限快地执行,将导致完全理性的行为。就国际象棋而言,这意味着我们努力编写一个程序,该程序运行的算法原则上能够找到完美的走法,但我们添加了截断对该走法的搜索的功能,以便在可消化的时间间隔内下棋。期间。

罗素本人倡导人工智能的新智能/理性品牌;他称这个品牌为有限最优性。为了理解罗素的观点,首先我们跟随他引入一个区别:我们说代理有两个组成部分:一个程序和一个运行该程序的机器。我们写

一个

e

n

t

,

中号

,

表示程序实现的代理功能

在机器上运行

中号

。现在,让

中号

表示所有程序的集合

可以在机器上运行

中号

。有界最优规划

p

t

,

中号

p

t

,

那么就是:

p

t

,

中号

=

精氨酸

最大限度

ε

中号

V

一个

e

n

t

,

中号

,

,

U

p

t

,

=

精氨酸

最大限度

ε

,

,

,

您可以根据标准计算的任何数学理想化来理解该方程。例如,机器可以用图灵机减去指令来识别(即,TM在这里仅从架构上来看:将磁带分成可以在其上写入符号的正方形,读/写头能够在磁带上上下移动以写入和写入数据。擦除,以及随时处于有限数量状态之一的控制单元),并且可以使用图灵机模型中的指令来识别程序(告诉机器写入和擦除符号,具体取决于机器所处的状态)在)。因此,如果您被告知必须在 22 状态图灵机的约束内“编程”,您可以在给定这些约束的情况下搜索“最佳”程序。换句话说,您可以努力在 22 状态架构的范围内找到最佳程序。因此,Russell (1997) 的观点是,人工智能是致力于在执行这些程序的机器的时间和空间限制下为智能代理创建最佳程序的领域。 [17]

读者一定已经注意到,在方程中

p

t

,

中号

p

t

,

我们还没有详细说明

U

以及如何方程

(1)

(1)

如果环境类别可用于构建代理

比较一般,或者如果真实环境

根本就是未知的。根据构建人工智能体的任务,

U

会有所不同。环境的数学形式

和实用程序功能

U

从国际象棋到危险!当然,如果我们要设计一个全球智能的代理商,而不仅仅是一个棋子的代理商,我们可以摆脱只有一对

U

。什么会

看起来我们是否正在建立一个普遍智能的代理,而不仅仅是一个擅长单个任务的代理商?

将不仅是单个游戏或任务的模型,而且是由许多游戏,任务,情况,问题等组成的整个物理社会活动宇宙。我们远没有这样的全面理论模型。有关为此问题提出的理论架构的进一步讨论,请参见Aixi Architecture上的补充。

应该提到的是,“什么是AI?”有一个不同的,更直接的答案。问题。这个答案可以追溯到原来的达特茅斯会议的时代,由纽厄尔(Newell)(1973年)表达,这是现代AI的祖父之一(回想一下他参加了1956年的会议);这是:

AI是致力于建立智能工件的领域,其中“智能”是通过智能测试(例如Wechsler成人智能量表)和其他精神能力测试(包括机械能力,创造力和创造力的测试)来实现的。很快)。

上面的定义可以看作是完全指定罗素和诺维格的四个可能目标的具体版本。尽管现在很少有人意识到这一点,但这个答案被一段时间被认真对待,实际上是AI历史上最著名的节目之一:Evans的类比计划(1968年),该程序解决了一个几何比喻问题在许多智能测试中看到的类型。 Bringjord和Schimanski(2003)提供了严格定义AI的这种被遗忘的形式(作为他们的心理测量AI),并从纽维尔和埃文斯的时代复活。 (Bringsjord 2011)]。在正在进行的尝试(现在称为Aristo项目)的持续尝试中,已经进行了大量的私人投资,以能够在美国高中生(美国高中生(美国高中生)进行的AP考试(例如AP考试)上表现出色的机器的形式( Friedland等。 (今天朝这个方向朝着这个方向充满活力的工作继续在艾伦人工智能研究所继续进行。)[18]此外,西北地区的研究人员在AI和机械能力测试之间建立了联系(Klenk等,2005)。

最后,与任何学科一样,要真正知道该学科的确需要您至少在某种程度上潜入和做,或者至少潜入和阅读。二十年前,这样的潜水非常易于管理。今天,因为构成AI的内容已经刺激了,因此潜水(或至少在其之后游泳)的要求更高。

3。

有多种“雕刻” AI的方法。迄今为止,总结该领域的最谨慎和富有成效的方式是,鉴于其对该领域的全面概述,再次转向AIMA文本。

3.1智能代理连续体

正如Russell和Norvig(2009)在AIMA的序言中告诉我们的那样:

主要的统一主题是智能代理的想法。我们将AI定义为对从环境接收感知并执行行动的代理的研究。每个这样的代理都实现了将感知序列映射到动作的函数,我们涵盖了代表这些功能的不同方式……(Russell&Norvig 2009,vii)

因此,基本图片在此图中总结了:

具有传感器和执行器的代理人接受感知和执行动作

智能代理的印象派概述

AIMA的内容本质上是从散开这张图片中得出的。也就是说,上图对应于表示智能代理实施的整体功能的不同方式。而且从最不重要的代理到更强大的代理人的进展。下图给出了本书早期讨论的一种简单的代理人的高级视图。 (尽管很简单,但这种代理对应于Rodney Brooks,1991年设计和实施的无代理构建。)

没有世界内部模型与环境互动的简单反射代理

简单的反射剂

随着这本书的进展,代理人变得越来越复杂,其代表的功能的实施从AI当前越来越多的内容中得出。下图给出了比简单反射代理更聪明的代理的概述。这种聪明的代理具有内部对外界建模的能力,因此不仅仅是直接感觉到的东西。

与环境互动的世界模型的反射代理

更复杂的反射剂

AIMA有七个部分。当读者通过这些部分时,她被介绍给掌握每个部分讨论的权力的代理商。第一部分是对基于代理的视图的介绍。第二部分关心的是让智能代理在明确定义的环境中前进几个步骤的能力。此处的示例包括能够成功玩完美信息游戏的代理,例如国际象棋。第三部分与具有声明性知识的代理商打交道,并且可以以大多数哲学家和逻辑学家非常熟悉的方式进行推理(例如,基于知识的代理商推断应采取哪些行动来确保其目标)。该书的第四部分使代理商有能力通过以概率方式进行推理来处理不确定性。[19]在第五部分中,代理人具有学习能力。下图显示了学习代理的整体结构。

可以学习与环境互动的代理商

学习代理

给出了最终的权力代理,可以使他们进行交流。这些权力在第六部分中涵盖。

耐心地旅行日益聪明的代理商的整个进展的哲学家无疑会问,在第七部分的结束时,是否缺少任何东西。通常,我们有足够的人来建立一个人造人,还是只有足够的东西来建造一个动物? Charniak和McDermott(1985)的以下内容隐含了这个问题:

AI的最终目标(我们远非实现)是建立一个人,或者更谦卑的动物。 (Charniak&McDermott 1985,7)

值得称赞的是,罗素(Russell&Norvig)在AIMA的第27章“ AI:现在和未来”中,至少在某种程度上考虑了这个问题。 R&N描述了这些挑战之一,如下所示:

[M] Achine学习在以高于输入词汇量高的抽象水平构建新表示的重要问题上几乎没有取得进展。例如,在计算机视觉中,如果代理商被迫从像素作为输入表示形式工作,那么学习复杂的概念,例如课堂和自助餐厅将变得不必要。取而代之的是,代理需要能够首先形成中间概念,例如桌子和托盘,而无需明确的人类监督。类似的概念适用于学习行为:haveAcupoftea是许多计划中非常重要的高级步骤,但是它如何进入一个最初包含更简单的动作(例如Raisearm and Swallow)的动作库?也许这将结合深度信念网络 - 像Hinton等人的工作一样,具有多层隐藏变量的贝叶斯网络。 (2006年),Hawkins和Blakeslee(2004)以及Bengio和Lecun(2007)。 …除非我们理解此类问题,否则我们将面临着艰巨的任务,即手工构建大型常识性知识基础,以及迄今为止还没有很好的方法。 (Russell&Norvig 2009,第27.1章)

尽管在应对这一挑战(以深度学习或代表性学习的形式)方面有所进步,但这种具体的挑战实际上只是一个山麓,而在AI最终必须以某种方式设法攀登的一系列令人眼花hige乱的高山之前。简而言之,其中之一是阅读。[21]尽管事实是,如前所述,AIMA的V部分专门用于机器学习,但AI却几乎可以通过阅读来进行学习机械化。但是,当您考虑它时,阅读可能是您在生活中的这个阶段学习的主要方式。考虑一下此刻您在做什么。您正在阅读这句话,这是一个很好的选择,因为您以前您设定了了解AI领域的目标。然而,AIMA第四部分中提供的正式学习模型(这是AI中的所有模型)不能通过阅读应用于学习。[22]这些模型都从基于功能的学习视图开始。根据这种观点,学习几乎总是产生潜在的功能

f

基于一组受限的对

{

x

1

,

f

x

1

,

x

2

,

f

x

2

,

……

,

x

n

,

f

x

n

}

{

1

,

1

,

2

,

2

,

……

,

,

}

例如,考虑接收由1、2、3、4和5组成的输入,以及1、4、9、16和25的相应范围值;目的是“学习”从自然数到自然数量的基础映射。在这种情况下,假设基础函数是

n

2

2

,并且您确实“学习”了它。尽管这种狭窄的学习模型可以有效地应用于许多过程,但阅读过程并不是其中之一。通过阅读学习不能(至少在可预见的将来)被建模为分散产生参数值对的函数。取而代之的是,您对AI的阅读只有以正确的方式增加了您的知识增加,并且如果这些知识使您有望能够产生以确认对主题领域足够掌握的行为。此行为可以从正确回答和证明有关AI的测试问题,到制作信号您成就的强大,引人注目的演示文稿或纸张。

(本章完)

相关推荐