人工智能(Artificial Intelligence, 简称AI)的历史源远流长。在古代的神话传说中,技艺高超的工匠可以制作人造人,并赋予其智能或意识。现代意义上的AI始于古典哲学家用机械符号处理的观点解释人类思考过程的尝试。20世纪40年代计算机的发明使一批科学家开始严肃地探讨构造一个电子大脑的可能性。
1956年,在达特茅斯学院举行的一次会议上正式确立了人工智能的研究领域。会议的参加者在接下来的数十年间都是AI研究的领军人物。同时,上千万美元被投入到AI研究中,以期实现会议所指定的目标,但最终没能实现,人工智能也进入了第一次低潮。
人工智能史上共出现过好几次低潮,尽管经历了大起大落,AI领域仍在取得进展。某些在20世纪70年代被认为不可能解决的问题今天已经圆满解决并成功应用。但与第一代AI研究人员的乐观估计不同,具有与人类同等智能水平的机器至今仍未出现。
一、理论源起
古希腊神话
古希腊神话中就出现了有智慧的机械的形象:“工匠之神赫菲斯托斯曾制作了一组金制的女机器人,能开口说话,并接手他的高难度工作;他还有一套三脚桌,围在铁匠铺外面,能自行跑去供诸神聚会,之后再自己跑回来。”
形式推理
公元前4世纪,古希腊的亚里士多德开创三段论,被视为人工智能编程逻辑的起源。人工智能的基本假设是人类的思考过程可以机械化和程序化。
哲学家拉蒙•柳利(1232-1315)开发了“逻辑机”,试图通过逻辑方法获取知识。他的理论影响了后来的莱布尼茨。
17世纪,莱布尼茨,托马斯•霍布斯和笛卡儿尝试将理性的思考系统转化为代数学或几何学体系。莱布尼茨认为“人类的思想可以简化成某种运算”。霍布斯在《利维坦》中有一句名言:“推理就是计算。” 这些哲学家已经开始明确提出形式符号系统的假设,而这一假设将成为AI研究的指导思想。
20世纪初,大卫•希尔伯特向当时的数学家提出了一个基础性的难题:“能否将所有的数学推理形式化?”这个问题的最终回答由哥德尔不完备定理,图灵机和λ演算给出。它们隐含地证明了任何形式的数学推理都能在一定的限制之下被机械化的可能性。邱奇-图灵论题指出,一台仅能处理0和1这样简单二元符号的机械设备能够模拟任意数学推理过程。
计算机科学
19世纪初,查尔斯•巴贝奇设计了一台可编程计算机(“分析机”)。历史上第一位程序员爱达•勒芙蕾丝预言,这台机器“将创作出无限复杂,无限宽广的精妙的科学乐章”。
二战期间,第一批现代计算机诞生。为制造“思维机器”提供了硬件基础。
1968年,小说《2001太空漫游》预言了很多未来的技术,包括地球卫星、互联网等。其中的哈尔9000型电脑,则是对于人工智能早期设想的集中体现。
二、AI诞生
在20世纪40年代和50年代,来自不同领域(数学,心理学,工程学,经济学和政治学)的一批科学家开始探讨制造人工大脑的可能性。1956年,人工智能被确立为一门学科。
早期理论与实践
最初的人工智能研究是30年代末到50年代初的一系列科学进展交汇的产物。神经学研究发现大脑是由神经元组成的电子网络,其激励电平只存在“有”和“无”两种状态,不存在中间状态;诺伯特•维纳的控制论描述了电子网络的控制和稳定性。克劳德•香农提出的信息论则描述了数字信号(即高低电平代表的二进制信号)。图灵的计算理论证明数字信号足以描述任何形式的计算。这些密切相关的想法暗示了构建电子大脑的可能性。
沃伦•麦卡洛克和沃尔特•皮茨分析了理想化的人工神经元网络,并且指出了基本的运行机制。他们的学生马文•明斯基(在接下来的五十年中都是AI领域最重要的领导者和创新者之一)在1951年建造了第一台神经网络机SNARC。
1950年,图灵发表了一篇划时代的论文,文中预言了创造出具有真正智能的机器的可能性。由于注意到“智能”这一概念难以确切定义,他提出了著名的图灵测试:如果一台机器能够与人类展开对话而不能被辨别出其机器身份,那么称这台机器具有智能。这一简化使得图灵能够令人信服地说明“思考的机器”是可能的。
50年代中期,随着数字计算机的兴起,一些科学家直觉地感到可以进行数字操作的机器也应当可以进行符号操作,而符号操作可能是人类思维的本质。这是创造智能机器的一条新路。1955年,根据该理论开发的程序“逻辑理论家(Logic Theorist)”问世,它能够证明《数学原理》中前52个定理中的38个。开发者之一赫伯特•西蒙认为他们已经“解决了神秘的心/身问题,解释了物质构成的系统如何获得心灵的性质。”
1956年达特茅斯会议:AI的诞生
1956年达特茅斯会议的组织者是马文•明斯基,约翰•麦卡锡和另两位资深科学家克劳德•香农以及内森•罗彻斯特,后者来自IBM。会议提出的断言之一是“学习或者智能的任何其他特性的每一个方面都应能被精确地加以描述,使得机器可以对其进行模拟。”与会者中的每一位都将在AI研究的第一个十年中做出重要贡献。会上讨论了“逻辑理论家”,麦卡锡则说服与会者接受“人工智能”一词作为本领域的名称。1956年达特茅斯会议上AI的名称和任务得以确定,同时出现了最初的成就和最早的一批研究者,因此这一事件被广泛承认为AI诞生的标志。
图中是七个微笑的年轻男人坐在草坪上的黑白照片特写,其中有发起和出席会议的几位主要代表人物,这7人都为人工智能、计算机科学或相关领域做出了贡献。他们是(从左到右):
奥利弗·塞尔弗里奇:MIT数学家;
纳撒尼尔·罗切斯特:BM信息研究主管,会议发起人之一;
雷·所罗门诺夫:美国数学家;
马文·闵斯基:哈佛大学数学与神经学研究员,会议发起人之一;
米尔纳:蒙特利尔麦吉尔大学神经心理学教授;
约翰·麦卡锡:达特矛斯学院数学助理教授,会议发起人之一;
克劳德·香农:贝尔电话实验室数学家,会议发起人之一。
三、黄金年代
达特茅斯会议之后的数年是大发现的时代。这一阶段开发出的程序堪称神奇:计算机可以解决代数应用题、证明几何定理、学习和使用英语。当时大多数人几乎无法相信机器能够如此“智能”。研究者们在私下的交流和公开发表的论文中表达出相当乐观的情绪,认为具有完全智能的机器将在二十年内出现。DARPA(美国国防高等研究计划署)等政府机构向这一新兴领域投入了大笔资金。下面列举这些研究中最具影响的几个
搜索式推理
为实现一个目标(例如赢得游戏或证明定理),它们一步步地前进,就像在迷宫中寻找出路一般;如果遇到了死胡同则进行回溯。这就是“搜索式推理”。这一思想遇到的主要困难是,在很多问题中,“迷宫”里可能的线路总数是一个天文数字(即“指数爆炸”)。研究者使用启发式算法去掉那些不太可能导出正确答案的支路,从而缩小搜索范围。1957年,应用此理论的程序“一般问题解决器”(General Problem Solver)诞生。1966年,历史上第一代能够自主“思考和行动”的机器人“摇摇”(Shakey)的开发项目启动。这是人类首次严肃地尝试制造一台自主机器人。
自然语言
AI研究的一个重要目标是使计算机能够通过自然语言(例如英语)进行交流。1964年,第一个聊天机器人ELIZA诞生。与ELIZA“聊天”的用户有时会误以为自己是在和人类,而不是和一个程序,交谈。但是实际上ELIZA根本不知道自己在说什么。它只是按固定套路作答,或者用符合语法的方式将问题复述一遍。
微世界
60年代后期,麻省理工大学AI实验室的马文•明斯基和西摩尔•派普特建议AI研究者们专注于被称为“微世界”的简单场景。他们指出在成熟的学科中往往使用简化模型帮助基本原则的理解,例如物理学中的光滑平面和完美刚体。许多这类研究的场景是“积木世界”,其中包括一个平面,上面摆放着一些不同形状,尺寸和颜色的积木。在这一指导思想下,1968年,能与人简单交流、决策,并执行的SHRDLU程序诞生,它能用普通的英语句子与人交流,还能作出决策并执行操作。
专家系统
早期的另一个里程碑是始于1965年的DENDRAL项目,它启动了一个全新的行业:专家系统。DENDRAL把专业领域知识(本例中为分子化学)编码到计算机程序里,利用自己的化学知识库,提出有可能加以影响的化学结构。它在专业领域的成功表明,在狭窄主题上,把人类的专业知识进行明确编码,计算机程序能够以专家级的绩效来完成特定任务。
四、首次低谷
到了70年代,AI开始遭遇批评,随之而来的还有资金上的困难。AI研究者们对其课题的难度未能做出正确判断:此前的判断过于乐观使人们期望过高,当承诺无法兑现时,对AI的资助就缩减或取消了。同时,由于马文•明斯基对感知器的激烈批评,联结主义(即神经网络)销声匿迹了十年。70年代后期,尽管遭遇了公众的误解,AI在逻辑编程,常识推理等一些领域还是有所进展。
AI领域的难题
70年代初,AI遭遇了瓶颈。即使是最杰出的AI程序也只能解决它们尝试解决的问题中最简单的一部分,也就是说所有的AI程序都只是“玩具”。AI研究者们遭遇了无法克服的基础性障碍。尽管某些局限后来被成功突破,但许多至今仍无法满意地解决:
- 计算机的运算能力。当时的计算机的内存和处理速度有限。
- 计算复杂性和指数爆炸。很多问题的解决需要近乎无限长的时间。
- 常识与推理。许多重要的AI应用需要大量对世界的认识信息。
- 莫拉维克悖论。证明定理和解决几何问题对计算机而言相对容易,而一些看似简单的任务,如人脸识别或让机器人穿过屋子,实现起来却极端困难。
- 框架和资格问题。如果不对逻辑的结构进行调整,AI就无法对常见的涉及自动规划的推理进行表达。
停止拨款
由于缺乏进展,对AI提供资助的机构(如英国政府,DARPA和NRC)对无方向的AI研究逐渐停止了资助。早在1966年ALPAC(Automatic Language Processing Advisory Committee,自动语言处理顾问委员会)的报告中就有批评机器翻译进展的意味,预示了这一局面的来临。NRC(National Research Council,美国国家科学委员会)在拨款二千万美元后停止资助。DARPA则对CMU的语音理解研究项目深感失望,从而取消了每年三百万美元的资助。到了1974年已经很难再找到对AI项目的资助。
五、重获繁荣
在80年代,专家系统开始为全世界的公司所采纳,“知识处理”成为了主流AI研究的焦点。日本政府在同一年代积极投资AI以促进其第五代计算机工程。约翰•霍普菲尔德(John Hopfield)在联结主义获得新突破。AI再一次获得了成功。
专家系统获得赏识
专家系统是一种程序,能够依据一组从专门知识中推演出的逻辑规则在某一特定领域回答或解决问题。1965年起设计的Dendral能够根据分光计读数分辨混合物。1972年设计的MYCIN能够诊断血液传染病。它们展示了这一方法的能力。
专家系统仅限于一个很小的知识领域,从而避免了常识问题;其简单的设计又使它能够较为容易地编程实现或修改。总之,实践证明了这类程序的实用性。使得AI开始变得实用起来。
1980年CMU为DEC(Digital Equipment Corporation,数字设备公司)设计了一个名为XCON的专家系统,这是一个巨大的成功。在1986年之前,它每年为公司省下四千万美元。至此,全世界的公司都开始研发和应用专家系统,到1985年它们已在AI上投入十亿美元以上。
重获拨款:第五代工程
1981年,日本经济产业省拨款八亿五千万美元支持第五代计算机项目。其目标是造出能够与人对话,翻译语言,解释图像,并且像人一样推理的机器。
其他国家纷纷作出响应。英国开始了耗资三亿五千万英镑的Alvey工程。美国一个企业协会组织了MCC(Microelectronics and Computer Technology Corporation,微电子与计算机技术集团),向AI和信息技术的大规模项目提供资助。DARPA也行动起来,组织了战略计算促进会(Strategic Computing Initiative),其1988年向AI的投资是1984年的三倍。
联结主义的重生
1982年,物理学家约翰•霍普菲尔德证明一种新型的神经网络(现被称为“Hopfield网络”)能够用一种全新的方式学习和处理信息,这项发现使1970年以来一直遭人遗弃的联结主义重获新生。1986论文集《分布式并行处理》问世。90年代神经网络获得了商业上的成功,它们被应用于光字符识别和语音识别软件。
六、AI寒冬
80年代中商业机构对AI的追捧与冷落符合经济泡沫的经典模式,泡沫的破裂也在政府机构和投资者对AI的观察之中。尽管遇到各种批评,这一领域仍在不断前进。
第二次AI低谷 1987-1993
从80年代末到90年代初,AI遭遇了一系列财政问题。变天的最早征兆是1987年AI硬件市场需求的突然下跌。Apple和IBM生产的台式机性能不断提升,到1987年时其性能已经超过了Symbolics和其他厂家生产的昂贵的旧机型。老产品失去了存在的理由:一夜之间这个价值五亿美元的产业土崩瓦解。
XCON等最初大获成功的专家系统维护费用居高不下。它们难以升级,难以使用,成了以前已经暴露的各种各样的问题的牺牲品。专家系统的实用性仅仅局限于某些特定情景,不再能满足普遍的需求。
到了80年代晚期,战略计算促进会大幅削减对AI的资助。DARPA的新任领导认为AI并非“下一个浪潮”,拨款将倾向于那些看起来更容易出成果的项目。
直到1991年,日本“第五代工程”并没有实现,事实上其中一些目标,比如“与人展开交谈”,直到2010年也没有实现。与其他AI项目一样,期望比真正可能实现的要高得多。从80年代末到90年代初,AI遭遇了一系列财政问题。
躯体的重要性:Nouvelle AI与嵌入式推理
一些研究者提出全新的人工智能方案。他们相信,为了获得真正的智能,机器必须具有躯体——它需要感知、移动、生存、与这个世界交互。
在发表于1990年的论文《大象不玩象棋(Elephants Don’t Play Chess)》中,机器人研究者罗德尼•布鲁克斯提出了“物理符号系统假设”,认为符号是可有可无的,因为“这个世界就是描述它自己最好的模型”。
七、新的发展
现已年过半百的AI终于实现了它最初的一些目标。它已被成功地用在技术产业中,不过有时是在幕后。这些成就有的归功于计算机性能的提升,有的则是在高尚的科学责任感驱使下对特定的课题不断追求而获得的。“实现人类水平的智能”这一最初的梦想曾在60年代令全世界的想象力为之着迷,其失败的原因至今仍众说纷纭。各种因素的合力将AI拆分为各自为战的几个子领域,有时候它们甚至会用新名词来掩饰“人工智能”这块被玷污的金字招牌。虽然AI比以往的任何时候都更加谨慎,但也更加成功。
幕后的AI
AI研究者们开发的算法开始变为较大的系统的一部分。AI曾经解决了大量的难题,这些解决方案在产业界起到了重要作用。应用了AI技术的领域有例如:数据挖掘,工业机器人,物流,语音识别,银行业软件,医疗诊断和Google搜索引擎等。
AI领域并未从这些成就之中获得多少益处。AI的许多伟大创新仅被看作计算机科学工具箱中的一件工具。牛津大学哲学家Nick Bostrom解释说,“很多AI的前沿成就已被应用在一般的程序中,不过通常没有被称为AI。这是因为,一旦变得足够有用和普遍,它就不再被称为AI了。”
深度学习
深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。深度学习的概念源于人工神经网络的研究。
深度学习已经在计算机视觉、语音识别和自然语言处理等其他领域产生了诸多成功应用。谷歌和百度公司利用深度学习的语音识别软件在语音转换为文本方面已经可以跟人类一较高下;利用了深度学习技术的AlphaGo在2016年初击败了世界顶尖围棋选手。
游戏里程碑和摩尔定律
游戏AI一直被认为是评价AI进展的一种标准。1997年5月11日,IBM深蓝(DeepBlue)战胜国际象棋世界冠军卡斯帕罗夫。
2005年,斯坦福大学开发的一台机器人在一条沙漠小径上成功地自动行驶了131英里。
2011年,IBM沃森计算机(Watson)参加综艺问答节目危险边缘(Jeopardy!)来测试它的能力,这是该节目有史以来第一次人机对决,在3集节目的对决中最终打败了节目最高奖金得主布拉德•鲁特尔和节目历史连胜纪录保持者肯•詹宁斯。在比赛中,Watson没有连接到互联网,而是运用了先进的自然语言处理、信息检索、知识表达和推理和机器学习技术,在包含200万页结构化和非结构化的信息的4TB磁盘内进行处理。
一般认为,计算机要在围棋中取胜比在国际象棋等游戏中取胜要困难得多,因为围棋的下棋点极多,分支因子大大多于其他游戏。但2016年3月,由Google DeepMind团队开发的AlphaGo以4:1击败顶尖职业棋手李世石;其加强版随后又在2017年乌镇围棋峰会上三比零完胜世界第一棋手柯洁,自此因没有人类对手而宣布退役。
上述计算机性能上的迅速增长,可以由摩尔定律解释:“计算速度和内存容量每两年翻一番。”计算性能上的基础性障碍已被逐渐克服。
人声交互技术
如果你曾经使用过Siri、Cortana、Alexa或者各类语音搜索功能,那么你就已经接触过人声交互技术了。人声交互的基础理论是人工智能研究的子领域之一——自然语言理解。近年得益于深度学习和大数据等新技术的发展和计算机运算能力的提高,人声交互技术已经逐步成熟。
八、新突破
受聊天机器人ChatGPT于2022年11月推出加持,2023年成为了AI(人工智能)发展史的一个转折点,活跃的开源环境和多模态模型一同推动了AI研究的进步。
随着生成式AI持续从实验室走入现实,人们对这项技术的态度正在变得越来越成熟。对于2024年的AI发展趋势,行业专家们也给出了一些展望。在此澎湃新闻记者综合相关分析,总结出了AI在2024年中的五大发展趋势:
生成式AI将继续快速发展
2022年下半年,AI文生图软件首先点燃了生成式AI的热度,而这股热潮随着ChatGPT的发布达到了巅峰。
“生成式AI”的搜索量在2023年出现激增。来源:Exploding Topics
在生成式AI受到瞩目之前,大多数AI应用都使用了预测式AI。顾名思义,预测式AI会根据现有数据进行趋势的预测或提供见解,而不会生成全新的内容。相比之下,生成式AI会利用机器学习,从训练数据中学到“思考”的模式,以此创造具有原创性的输出。
生成式AI和Deepfake研究专家Henry Adjer指出:“我们仍处于这场生成式革命的初期阶段;未来,合成介质和内容将在日常生活中无处不在,并且实现民主化。这不仅仅是一个简单的新奇事物,而是将在娱乐、教育和供给方面推动突破性的进步。”
AI模型将从单一模式转向多模态
传统的AI模型专注于处理来自单一模态的信息。而现在,通过多模态深度学习,我们能够训练模型去发现不同类型模态之间的关系,意味着这些模型可以将文本“翻译”成图像,以及让图像变成视频、让文本变成音频等等。
多模态模型自去年以来受到了热烈的关注,让用户与AI的互动变得更高效。这也就是为何谷歌在去年12月发布的大模型Gemini的宣传片引起了轰动:在片中,Gemini似乎能够实时识别图片,还会生成音频和图片来辅助回答。
谷歌Gemini宣传片截图
不过,谷歌在事后承认,该宣传片经过一些剪辑。但是,它至少向我们展示了多模态AI在未来可能会发展出的模样。
AI将进一步融入各行各业的工作
相信许多人在进行工作时,都已经会习惯性地打开ChatGPT等AI工具,让其作为“秘书”来随时辅助自己的工作。
ChatGPT正在成为最受欢迎的“办公伙伴”。
在今年一月的达沃斯论坛上,AI新锐巨头OpenAI的创始人CEO萨姆·奥特曼强调,AI带来的技术革命不同于以往,但AI不会像人们担心的那样取代掉许多工作,而是成为了一种“提高生产力的不可思议的工具”。
对于这样的未来,有一件事是肯定的:作为“打工人”,我们将需要适应并获取与AI相关的新技能。
AI将放大和增强个性化
近几年来,用户都感受到了“个性化推送”的魅力:从社交媒体到视频网站,越来越复杂的算法似乎总能知道用户想看什么,并在合适的时间展示合适的内容。AI正在加速让各类媒介从“大众化”转变为“小众化”,最终目标是真正实现一对一的互动。
AI初创企业Synthesia的首席执行官Victor Riparbelli表示:“我们预测:在不远的将来,大众传播将越来越成为过去式。合成媒介和内容将创造新的、个性化的通讯形式,而(传统的)媒体景观将彻底改变。”
AI监管问题将受到重视
最后,不出所料的是,2024年会成为AI监管的关键一年。逐渐变强的AI也为监管部门带来许多全新挑战,就如同漫威《蜘蛛侠》中的经典台词:“能力越大,责任越大。”
德勤(Deloitte)的风险咨询主管兼全球技术部门负责人Gillian Crossan认为,AI令“被遗忘的权利”再次受到重视:“当这些大模型利用大量数据进行学习时,你如何保证它们是可控的,以及自己的信息能够被它们遗忘?”
欧盟在AI监管方面可谓是取得了领先地位。据报道,欧洲议会和欧盟国家的谈判代表于去年12月已经就AI监管达成了协议。未来,AI系统将被划入不同的风险组:一个应用的潜在风险越高,对它的要求就应该越高。欧盟希望,这些规则会在全世界范围内得到复制。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...