DataFinder DataFinder
Agent 原生 · 一站式 · 端到端

发现数据价值,
让 DataAI 回归简单

DataFinder 是 Agent 原生的智能数据分析平台, 把数据接入、问答、可视化、定时巡检与 IM 推送,一站交付。

3 层
模型分级 · 自动降级
5+
数据源原生支持
3
企业 IM 双向打通
cron
定时巡检 · 失败告警

PRODUCT PHILOSOPHY

把分析师,装进每一次对话

DataFinder 不是又一个 BI。它把数据接入、语义沉淀、问答与推送的全过程,交给一套真正能干活的 Agent。

一体化

数据与对话,
没有墙

数据接入、问答、可视化、巡检、推送,统一在同一个 Space、同一份元数据、同一条会话之上。告别在 BI、SQL 工具和消息平台之间来回切换。

AI 就绪

Agent 听得懂的
语义层

把表关系、口径、字段含义沉淀进 Space 指令;多模型协同、三层降级,让 Agent 真正理解业务,生成准确 SQL,回答可追溯、可纠错。

Agent 原生

让 Agent 把
活儿做完

从问题理解、SQL 生成,到图表展现与定时巡检,全程由 Agent 闭环交付。不止 Copilot 协同,更能 Autopilot 自治,按时把答案推到团队群里。

CORE CAPABILITIES

从一句话,到一张图

DataFinder 把数据连接、语义理解、SQL 生成、可视化、推送串成一条线,让团队从「排期等数据」变成「对话拿答案」。

01

数据接入

MySQL · PostgreSQL · ClickHouse · CSV · Excel

数据库一键连接,文件直接上传。所有连接信息使用 Fernet 加密,密钥写入后只回显掩码,永不返回明文。

02

智能问答

表关系理解 · SQL 生成 · 多轮追问

Agent 阅读 schema、样本与你写下的业务说明,把「上周 GMV 同比怎么样」翻译成可执行 SQL,并附上表格、图表与业务解读。

03

自动可视化

柱图 · 折线 · 占比 · KPI · 自动选型

Agent 根据查询结果与业务问题自动选择图表类型,团队不需要再为「这数据该画成什么」纠结,更不需要拖拉拽。

04

定时巡检

Cron 调度 · 失败告警 · 历史回放

用 cron 配置任意频率的指标巡检,DataFinder 自动跑批、出图、推送。失败时记录详细错误,方便快速排查。

05

IM 双向打通

飞书 · 钉钉 · 企业微信 · 群机器人

在群里 @Bot 直接问数;定时任务的结果也能直接推送到日报群、值班群、运营群——数据回到团队最高频的工作场景。

06

效果可评测

Benchmark · 准确率打分 · 模型对比

维护一组业务问答对,DataFinder 自动跑批评测 SQL 准确率。指令、模型、Prompt 每次迭代都能量化对比,把控 Agent 的回答质量。

QUICK START

四步开始,让数据需求自动化

一杯咖啡的时间,把团队最高频的数据问题接进 DataFinder,从此不再排队等排期。

1
STAGE

连接数据

添加数据库连接或上传 CSV / Excel 数据集,DataFinder 自动读取 schema 与样本数据。

2
STAGE

沉淀语义

把相关数据集挂到一个 Space,写下业务说明:表关系、指标口径、字段含义。

3
STAGE

开始对话

用自然语言提问,看到 SQL、表格与图表。结果不对?追问一句,Agent 自动修正。

4
STAGE

订阅推送

把高频问题做成定时任务,每天 9 点结果直接出现在飞书 / 钉钉 / 企业微信群里。

USE CASES

让团队的每个角色,都能查数据

运营、数据、研发——三个最高频的数据使用场景,DataFinder 都能一站覆盖。

SCENARIO 01

业务巡检 / 经营日报

每天早上的 GMV、日活、转化漏斗,做成定时任务推到群里。看到异常,一句话追问,分钟级定位原因。

  • ·每日 9 点自动出报告
  • ·推送到飞书 / 钉钉 / 企微群
  • ·失败自动告警
SCENARIO 02

数据自助分析

把「业务每天都来问的同样问题」自动化掉,把数据团队的时间留给真正复杂的分析与建模。

  • ·SQL 模板在 Space 内复用
  • ·问答对评测 Agent 准确率
  • ·口径写一次,处处生效
SCENARIO 03

研发 / 产品自助查数

自助查埋点、看异常率、巡检关键指标,无需打扰数据团队。沉淀下来的 SQL 模板,全员复用。

  • ·无需依赖数据排期
  • ·埋点表变化自动感知
  • ·Space 维度成本可控

ECOSYSTEM

在团队已有的工具里,直接使用

不需要再为数据问题切上下文。在飞书、钉钉、企业微信里 @ 机器人就能问数;定时巡检的结果直接推到日报群、值班群、运营群。

  • 飞书 / 钉钉 / 企业微信,三大主流 IM 全覆盖
  • Inbound:群里 @Bot 直接提问,回复即时返回
  • Outbound:定时任务结果推送到指定群机器人
  • 所有密钥加密存储,连接测试可一键验证
飞书 Bot
事件订阅 · 群推送
钉钉 Bot
Outgoing · 加签
企业微信
应用回调 · 群机器人

PLATFORM ESSENTIALS

企业级底座,安全 · 可观测 · 可控

三层模型自动降级

Flagship / Standard / Lite 分级调度,主模型异常时按链路自动切换,保证回答可用、成本可控。

用量与成本透明

每条对话、每次巡检的输入 / 输出 token、延迟、模型、估算成本都记录在案,用量与配额一目了然。

多租户与权限

Space 维度的数据隔离,连接信息加密存储,跨用户访问严格 404,企业内部部署放心。

FAQ

常见问题

DataFinder 会替代 BI 工具吗? +

不会。BI 适合做长期固定的看板,DataFinder 适合解决「临时但高频」的数据问题——尤其是那些不值得做仪表盘、又每天都要问的问题。两者互补。

数据会被发到外部模型吗? +

仅 schema、字段说明与你提的问题会进入 LLM,原始数据行不会发送到外部。所有 SQL 都在你自己的数据库里执行,结果留在你侧。

支持哪些数据源? +

主流关系型数据库(MySQL、PostgreSQL、ClickHouse 等),以及上传的 CSV / Excel 文件。也支持把多个数据集挂到同一个 Space 做联合分析。

如何控制 Agent 回答的质量? +

在 Space 里写下表关系、口径、字段含义这些指令;用 Benchmark 维护一组业务问答对来评测 SQL 准确率;如果某次回答不对,对话里直接追问,Agent 会自动修正。

可以私有化部署吗? +

可以。后端是 FastAPI + SQLAlchemy,前端是 Vite + React,能直接跑在你自己的服务器上。LLM 也支持替换为内部网关或自托管模型。

现在就开始,跟数据对话

注册账号 → 连接数据库 → 创建 Space。整个过程不到 5 分钟,团队当天就能用上。