PRODUCT PHILOSOPHY
DataFinder 不是又一个 BI。它把数据接入、语义沉淀、问答与推送的全过程,交给一套真正能干活的 Agent。
数据接入、问答、可视化、巡检、推送,统一在同一个 Space、同一份元数据、同一条会话之上。告别在 BI、SQL 工具和消息平台之间来回切换。
把表关系、口径、字段含义沉淀进 Space 指令;多模型协同、三层降级,让 Agent 真正理解业务,生成准确 SQL,回答可追溯、可纠错。
从问题理解、SQL 生成,到图表展现与定时巡检,全程由 Agent 闭环交付。不止 Copilot 协同,更能 Autopilot 自治,按时把答案推到团队群里。
CORE CAPABILITIES
DataFinder 把数据连接、语义理解、SQL 生成、可视化、推送串成一条线,让团队从「排期等数据」变成「对话拿答案」。
数据库一键连接,文件直接上传。所有连接信息使用 Fernet 加密,密钥写入后只回显掩码,永不返回明文。
Agent 阅读 schema、样本与你写下的业务说明,把「上周 GMV 同比怎么样」翻译成可执行 SQL,并附上表格、图表与业务解读。
Agent 根据查询结果与业务问题自动选择图表类型,团队不需要再为「这数据该画成什么」纠结,更不需要拖拉拽。
用 cron 配置任意频率的指标巡检,DataFinder 自动跑批、出图、推送。失败时记录详细错误,方便快速排查。
在群里 @Bot 直接问数;定时任务的结果也能直接推送到日报群、值班群、运营群——数据回到团队最高频的工作场景。
维护一组业务问答对,DataFinder 自动跑批评测 SQL 准确率。指令、模型、Prompt 每次迭代都能量化对比,把控 Agent 的回答质量。
QUICK START
一杯咖啡的时间,把团队最高频的数据问题接进 DataFinder,从此不再排队等排期。
添加数据库连接或上传 CSV / Excel 数据集,DataFinder 自动读取 schema 与样本数据。
把相关数据集挂到一个 Space,写下业务说明:表关系、指标口径、字段含义。
用自然语言提问,看到 SQL、表格与图表。结果不对?追问一句,Agent 自动修正。
把高频问题做成定时任务,每天 9 点结果直接出现在飞书 / 钉钉 / 企业微信群里。
USE CASES
运营、数据、研发——三个最高频的数据使用场景,DataFinder 都能一站覆盖。
每天早上的 GMV、日活、转化漏斗,做成定时任务推到群里。看到异常,一句话追问,分钟级定位原因。
把「业务每天都来问的同样问题」自动化掉,把数据团队的时间留给真正复杂的分析与建模。
自助查埋点、看异常率、巡检关键指标,无需打扰数据团队。沉淀下来的 SQL 模板,全员复用。
ECOSYSTEM
不需要再为数据问题切上下文。在飞书、钉钉、企业微信里 @ 机器人就能问数;定时巡检的结果直接推到日报群、值班群、运营群。
PLATFORM ESSENTIALS
Flagship / Standard / Lite 分级调度,主模型异常时按链路自动切换,保证回答可用、成本可控。
每条对话、每次巡检的输入 / 输出 token、延迟、模型、估算成本都记录在案,用量与配额一目了然。
Space 维度的数据隔离,连接信息加密存储,跨用户访问严格 404,企业内部部署放心。
FAQ
不会。BI 适合做长期固定的看板,DataFinder 适合解决「临时但高频」的数据问题——尤其是那些不值得做仪表盘、又每天都要问的问题。两者互补。
仅 schema、字段说明与你提的问题会进入 LLM,原始数据行不会发送到外部。所有 SQL 都在你自己的数据库里执行,结果留在你侧。
主流关系型数据库(MySQL、PostgreSQL、ClickHouse 等),以及上传的 CSV / Excel 文件。也支持把多个数据集挂到同一个 Space 做联合分析。
在 Space 里写下表关系、口径、字段含义这些指令;用 Benchmark 维护一组业务问答对来评测 SQL 准确率;如果某次回答不对,对话里直接追问,Agent 会自动修正。
可以。后端是 FastAPI + SQLAlchemy,前端是 Vite + React,能直接跑在你自己的服务器上。LLM 也支持替换为内部网关或自托管模型。私有化部署,请联系 c@canmeng.net。