MCP 和 Function-Calling 的联系和区别

type

Post

status

Published

date

Apr 27, 2025

slug

function-calling-and-mcp

summary

函数调用和 MCP 在 LLM 智能 Agent 体系中既相关又有区别，只有了解了这些概念，才能在构建智能 Agent 的时候做出明智的决策

引言

让我们给现在的各种 LLM（如 GPT，Gemini，Claude，DeepSeek 等）画一个自画像，我会描述为一个装在罐子里的超级智能大脑，它从阅读过的所有书籍和网站中学到了很多知识，像一个全知全能的超级智囊，但如果你问它今天的天气，或者想让它查看你最新的邮件，甚至访问你开发的某个工具呢？他只能果断的拒绝你，因为这个罐子里的大脑无法自行接触外部世界。

于是我们开始思考：如何为这个"罐中大脑"装上四肢，让它不仅能思考，还能行动？这便是 Function Calling 和模型上下文协议（Model Context Protocol，简称 MCP）诞生的背景。Function Calling 使得模型能够在理解用户意图后，调用外部定义的函数，执行特定任务。而 MCP 则提供了一个标准化的接口，允许模型与外部数据源和工具进行交互，获取实时信息或执行操作。

通过这两者的结合，原本封闭的语言模型得以突破限制，成为真正的智能代理——它们就像为模型装上了感官和四肢，使其不仅能"思考"，还能"感知"和"行动"。

在接下来的内容中，我们将深入探讨函数调用与 MCP 的原理、区别与联系，以及它们在构建智能代理系统中的实际应用。

💡

函数调用在很多时候和现在的 Tool Calling 是可以互换的，所以本文不在进一步区分这两者

Function calling（函数调用）

定义与目的

函数调用指的是让大语言模型在生成文本时，自动识别需要调用外部工具或 API，并输出结构化信息（如 JSON）来执行该函数的能力。通过函数调用，LLM 能够突破静态训练数据的限制，实时查询外部数据源、执行命令或调用各种服务，从而完成更复杂、动态的任务。换言之，函数调用让 AI 不仅能“说”，还能“做”：当模型遇到无法直接回答的问题（如天气查询、数据库查询、设备控制等）时，它可以生成一个预定义的函数名和参数列表，请外部系统执行，并将结果带回给模型。

典型使用场景

函数调用常用于对话机器人和智能体中，为它们提供调用外部工具的能力。例如，对于问题“北京现在天气如何？”，模型会通过函数调用产生类似 get_current_weather(location="Beijing") 的输出，由后端代码接管该请求并调用真实的天气 API，最后将返回的天气信息反馈给模型，由模型生成自然语言回复。又如智能家居场景中，用户说“打开客厅灯”，模型可以输出调用智能家居接口的函数调用指令。函数调用还能应用于数据处理：模型可将“从数据库检索订单总数”转化为调用执行 SQL 查询的函数，从而实时获取所需数据。只要任务可以通过一个明确的函数接口完成，函数调用机制就能使 LLM 轻松完成信息检索、指令执行、API 交互等操作。

特点

增强 LLM 的实时性和功能性：通过函数调用，模型可以查询最新数据或执行实时运算，例如调用股票行情、计算器、地图导航等服务，使回答更加准确和实用

简化功能扩展的开发流程：开发者只需向模型注册可用的函数及其接口描述，模型即可在需要时调用它们，许多现代 LLM（如 GPT-4、Gemini）已经针对函数调用进行了专门优化，模型能够自动判定何时调用哪个函数

高效交互：函数调用将自然语言请求转化为结构化指令，使得对外部系统的访问更加可靠和准确，避免模型直接生成不可靠的答案

MCP（多调用协议 / Model Context Protocol）

定义与目的

MCP（Model Context Protocol，多模型上下文协议，有时称为多调用协议）是一套针对 LLM 与工具/服务器通信的开放协议标准。它在函数调用的基础上引入客户端-服务器架构，规定了如何发现可用工具、如何发起调用请求、如何管理会话上下文以及如何格式化响应等细节。简单地说，MCP 将 LLM 与任意兼容的工具服务器之间的交互进行了标准化，从而使得不同模型和不同工具之间可以“无缝对接”。

典型使用场景

MCP 适用于需要跨多个工具或多轮交互的复杂任务，例如，构建多步计划型智能体（Plan-and-Execute Agent）时，MCP 可用于承载规划器和执行器之间的通信。在此类系统中，模型先生成一系列子任务的计划（多步思维链），然后依次调用不同工具逐步执行（如飞行预订、酒店查询、路线规划等），MCP 协议保证了整个过程的有序进行并维护了上下文状态。此外，MCP 也可用于企业级应用中连接现有系统：例如统一接入 CRM、财务系统或内部数据库，避免为每个 LLM 和系统单独编码对接逻辑。

流程

MCP 协议的工作流程大致包括以下几个阶段

初始化（Handshake）：在宿主应用启动时，创建 MCP 客户端并与相应的 MCP 服务器建立握手，双方交换能力信息和协议版本，确认可用的工具列表及其接口格式。

发现（Discovery）：客户端请求服务器公布可用的能力（包括工具、资源、预设的提示模板等），服务器返回一个带有名称和描述的工具清单供客户端参考。

上下文准备（Context Provisioning）：宿主应用可以将用户输入以及任何必要的资源（如用户数据、提示模板）整合到上下文中，同时可将 MCP 工具描述转换为 LLM 可识别的格式（例如转换为 JSON 函数调用签名）。

调用（Call）：当 LLM 在生成回答时判断需要调用某个工具（例如基于用户请求“查询邮件列表”），MCP 客户端会向相应的 MCP 服务器发出调用请求，请求指定工具执行任务，此请求按照统一的 MCP 格式封装工具名和参数。

响应（Response）：MCP 服务器接收请求后执行对应操作（可能是真实 API 调用或本地计算），得到结果后按 MCP 协议的格式将结果返回给客户端。

结果整合（Output Integration）：MCP 客户端将服务器返回的结果融合回 LLM 的对话上下文，接着模型可以利用这些新获取的信息生成最终回复。

通过以上流程，MCP 协议使得 LLM 与外部能力的交互不再是一次性的“问-答”调用，而是一种持续的、可追踪的会话流程。这种架构可以灵活支持多步任务和多工具协作。例如，在自动驾驶、游戏开发、设计创作等复杂场景中，用户一句话指令就可以通过 MCP 调用多个协同工具来完成复杂任务

Function Call 与 MCP 的关联

MCP 建立在函数调用基础之上

由于 MCP 的目标是支持 LLM 调用工具，函数调用技术仍然是其内部重要机制之一。在 MCP 客户端的实现中，向工具发起的调用往往仍然以函数调用的形式体现：模型决定要调用某个工具时，可以生成一个 JSON 格式的函数调用指令，然后由 MCP 框架将其发送给正确的服务器，换言之，函数调用是模型“向外要工具”的手段，而 MCP 则规定了整个调用流程和格式。你可能会在 MCP 客户端应用中使用 GPT 或 Gemini 的函数调用，但 MCP 本身是 LLM 与外部 MCP 服务器之间更广泛的通信框架。

多步思维链规划的体现

在多步任务执行中，模型往往需要先进行“思考”（生成执行步骤），再逐步调用工具。这个过程通常被称为多步思维链规划（Plan-and-Execute 模式）。MCP 协议正好支持这样的多轮交互：模型可以在生成的上下文（Context）中一次调用一个工具，然后根据返回结果更新状态，再决定下一步调用哪个工具，直到任务完成。这种多轮调用过程本质上就是链式的函数调用，只是由 MCP 进行统一管理。例如，一个计划型智能 Agent 会先调用 MCP 中的规划器工具生成步骤列表，然后再通过 MCP 客户端逐个调用执行工具来完成每一步。因此，可以认为 MCP 既是多步思维链规划的“支撑协议”，也是在每个步骤中实际调用函数的机制。

工具生态与集成

使用函数调用时，开发者需手动将函数定义嵌入到模型的提示词中，这会导致不同模型平台使用不同格式，维护成本高。而 MCP 则通过标准协议统一了这一过程：模型只需知晓 MCP 协议和工具能力，MCP 客户端就能自动发现和加载适配于各种模型的工具接口，简化了跨模型和跨平台的对接工作。可以说，函数调用关注单次对接，MCP 则关注建立长期稳定的对接方案，两者在体系上互为补充。

Function Call 和 MCP 的区别

两者在抽象层次、应用范围和复杂度等方面存在明显不同

抽象层次

函数调用是一种较低层次的机制，聚焦于“在当前对话生成中调用一个函数”，类似于给模型一个明确的“工具箱”并让它选取工具。而 MCP 是一个更高层次的通信协议，它不仅包含具体的调用指令，还规定了发现工具、管理上下文、维护会话等流程。可以理解为：函数调用相当于向下的 API 请求，而 MCP 则是一整套协议和中间层，负责协调多个函数调用和数据流。

调用流程

在传统的函数调用中，一次用户请求对应一次模型调用，然后一次函数调用（或多个函数依次调用）并返回结果，通常是“单阶段（一问一答式）”的交互。若函数调用失败，流程就终止。相比之下，MCP 支持多阶段、状态化的任务执行：任务可以分解为多个子任务，模型和工具之间可以交互多轮，每轮都在 MCP 协议下有明确的请求和响应。这一特性使 MCP 更适合处理长时间运行或需要检查进度、调整策略的任务。

工具发现与描述

函数调用需要在对话上下文中预先定义函数签名，模型才能识别并调用；这些定义通常是静态的、与具体模型平台绑定的，而 MCP 引入了工具发现机制，客户端可以查询服务器获取可用工具列表和描述。这样，模型不必事先知道所有工具的细节，只需在对话中按照 MCP 协议询问合适的功能即可，从而大大降低了跨平台对接的复杂度。

数据流与上下文管理

函数调用往往是一种“写死”的调用逻辑，模型生成调用请求后，大部分与工具的交互不再体现在对话文本中。MCP 则支持更动态的数据交互：工具运行的状态和结果可以实时反馈到对话中，并被模型利用，进而影响后续决策，此外，MCP 客户端会维护对话历史和中间变量，使模型能够将外部工具的返回结果无缝纳入自身的推理过程。

安全和隐私

函数调用通常依赖云端服务，一些敏感数据需要上传到远程 API，存在隐私风险。而 MCP 协议设计允许在本地或受控环境下运行工具：很多 MCP 服务可以部署在本地内部网，调用结果不经过公有云，这对企业场景尤为重要，因为可以在保证数据不外泄的前提下，让模型安全地访问内部系统。

适用任务复杂度

对于轻量级、高频的任务（如调用计算器、简单天气查询），直接使用函数调用往往更快速简便，而对于需要跨多个步骤协调和大量工具协作的复杂任务，MCP 提供了更完整的支撑。从实现角度看，函数调用体系在设计上较为简单，但在规模化和多样化任务场景下的可扩展性有限；MCP 则专为规模化、多模型和多工具场景设计，虽然引入了更多复杂度（如握手、发现等步骤），但能够显著提升工程效率与系统可靠性。

总结

综上所述，函数调用和 MCP 在 LLM 智能体体系中既相关又有区别：函数调用是实现外部功能访问的基础手段，偏向于单次、确定的操作；而 MCP 则是一整套支持多步、多工具协作的开放协议框架，通过统一标准使多模型、多工具的集成更加高效可靠。两者结合可以发挥各自优势，在简单任务中快速调用函数，在复杂任务中利用 MCP 协调多次调用，以构建功能强大、灵活智能的 Agent 系统。

我一向推崇”奥卡姆剃刀原理“，如果没有必要，千万不要引入额外的复杂度到系统中，构建智能 Agent 系统也同样遵循这样的原则，保持涉及的简单性原则，选取最经济的方案来实现即可。