让数据查询又快又准,瓴羊Dataphin MCP保姆级教程来了
发表于 2025-05-22 10:50:17

在AI Agent蓬勃发展的当下,优质数据资产已然成为释放AI生产力的关键因素。Dataphin作为瓴羊旗下一站式数据建设和治理工具,拥有庞大的元数据知识,包括逻辑模型、资产元数据信息、业务知识(标准、指标、码表)等。为了帮助企业更好地挖掘数据资产,Dataphin推出MCP服务,助力Agent高效获取数据。

什么是MCP?

MCP(Model Context Protocol)是由 Anthropic 公司提出的开源协议,旨在解决AI应用程序与外部数据源、应用的集成问题。在没有MCP之前,AI应用程序的开发者普遍通过Function Call的方式来与外部应用进行集成,普遍面临着如下困境:

1、开发复杂度高:需要在应用中通过硬编码的方式适配不同平台的API,每一个任务都需要单独开发和维护;

2、复用性低:每个集成模块通常是为特定任务定制的,缺乏通用性和可移植性,难以在其他项目中复用;

MCP定义了为大模型提供上下文的接口标准,使其能够无缝连接各种外部应用的数据,可以通过插拔式的配置决定AI应用是否集成某个应用,大大降低了开发成本,提高了可复用性。

Dataphin MCP

Dataphin MCP采用SSE(Server-Sent Events)协议,如下是对应的JSON配置:

Dataphin MCP目前提供两个与数据服务相关的Tools,分别为:

1、listDataServiceAPI: 根据所提供的应用,获取有权限调用的数据服务API信息,包括API ID、输入和输出参数、API调用文档等

2、invokeDataServiceAPI:调用数据服务API来获取数据

场景举例

作为行业360的开发人员,您通过Dataphin数据服务API来获取商品、用户、订单等数据。现在公司期望您能开发一款移动端的信息查询工具,让运营同学可以随时随地查询用户信息、订单数据等。

您可以通过“大模型”+“Dataphin MCP”的方式,快速构建数据查询助手。演示如下:

1、创建一个“智能查询助手”,关联Dataphin MCP服务,图中以百炼为例;

2、在右侧输入您的问题测试模型效果,以“帮我查询今年所有品类的销售额,同时查询销售额第一的品类中单品销量TO1”问题为例。

首先,模型会调用listDataServiceAPI这个Tool以查询所有可调用的API;

然后,模型会根据可用的API名称、描述、入参等信息,规划出为了解决当前用户问题需要调用哪些API。在本问题中,模型从众多API中选择了两个API进行调用,并将调用结果呈现给用户,分别是:QueryTransactionByProductCategory(根据产品品类查询总交易额)和QueryProductSaleInCat(查询指定品类下每个商品的销售额)

结语

未来瓴羊Dataphin将持续丰富和迭代MCP Server的工具集,包括数据研发、任务运维、数据治理等,有了这些工具您可以通过自然语言体验更多的场景,例如:

1、查询项目A中的任务运行状态,并对失败实例进行批量重跑;

2、在项目A中创建一个集成任务,其中数据来源于MySQL数据库的表,同步到项目计算源中,并一键建表;

3、创建一个规则强度为弱的质量规则,要求被监控字段需要满足国内有效的电话号码格式,同时将表的字段 作为监控对象;

目前Dataphin MCP处于公测阶段,联系瓴羊进行尝鲜体验!

CSDN官方微信
扫描二维码,向CSDN吐槽
微信号:CSDNnews
微博关注
【免责声明:CSDN本栏目发布信息,目的在于传播更多信息,丰富网络文化,稿件仅代表作者个人观点,与CSDN无关。其原创性以及文中陈述文字和文字内容未经本网证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本网不做任何保证或者承诺,请读者仅作参考,并请自行核实相关内容。您若对该稿件有任何怀疑或质疑,请立即与CSDN联系,我们将迅速给您回应并做处理。】