同花顺给你 K 线,雪球给你大 V,研报给你一份 PDF — 但没人告诉你「另一面会怎么反驳」。 机构投委会的真正价值不是数据,是 6 位风格不同的基金经理互相质疑,再由一个裁判仲裁。智研想把这件事压缩到 30 秒,搬到每个散户的口袋里。
过去 30 年,A 股散户和机构之间最大的鸿沟不是钱,是研究资源的不对等 — 机构有 6 位基金经理开投委会、有彭博终端、有卖方研究覆盖,而散户只有大 V 一句"梭哈"。智研用 AI 把这道墙拆掉:16 位 AI 合伙人 24 小时随时开会、120+ 数据接口实时接入、决议永久归档可复盘 — 这不是"又一个 ChatGPT 应用",这是AI 给金融行业带来的一次真正的能力平权。
把真投委会的流程(数据装配→多视角分析→投票→决议→复盘→对手盘辩论)每一步都给一个 AI 人格,流式渲染、剧场化叙事、可下载归档。

通用 AI(豆包/千问/ChatGPT)没有金融数据接入;传统证券工具(同花顺)没有 AI 多视角解读;社区平台(雪球)有立场但缺结构。智研在「金融垂直 × 多人格 决策剧场」这个交叉点上,目前是独家。
| 能力维度 | 豆包 / 千问 | ChatGPT | 同花顺 | 雪球 | 智研 |
|---|---|---|---|---|---|
| 实时 A股+港股数据 | ✗ 通用 AI 无 | ✗ 无 | ✓ 强 | ◐ 社区视角 | ✓ 理杏仁 A股、港股、宏观数据(120+ 接口) |
| 多 AI 人格 协作 | ✗ 单一 bot | ✗ 单一 bot | ✗ 无 AI | ✗ 真人大 V | ✓ 16 位独立人格 |
| 决策剧场化 / 流程化 | ✗ 聊天问答 | ✗ 聊天问答 | ✗ 数据展示 | ✗ 帖子瀑布 | ✓ 4 阶段剧场 |
| 结构化辩论 + 裁判矩阵 | ✗ | ✗ | ✗ | ◐ 大 V 互喷无结构 | ✓ 红蓝队 + JSON 矩阵 |
| 历史回测 + AI 归因 | ✗ | ✗ | ◐ 仅数字回测 | ✗ | ✓ 时光机(独家) |
| 情景沙盘推演 | ✗ | ✗ | ◐ 静态指标 | ✗ | ✓ 6 变量 + NL 解析 |
| 流式 markdown 渲染 | ✓ 单线 | ✓ 单线 | ✗ | ✗ | ✓ 多人格 并发流 |
| 投委会决议持久化 | ✗ | ✗ | ✗ | ◐ 帖子归档 | ✓ joint.db 永久 |
| 客户端原生(非 WebView) | ✓ | ✓ | ✓ | ✓ | ✓ Compose 100% |
| 立场对照(可解释性) | ✗ 一个观点 | ✗ 一个观点 | ✗ 不下结论 | ◐ 自己拼大 V | ✓ 6 派同框对照 |
为什么大厂没做这件事?
① 豆包/千问定位通用 AI,做金融垂直意味着要养专门的数据接入团队,ROI 算不过来 ;
② 同花顺是数据驱动的工具公司,AI 是"贴牌"功能,缺少 LLM 应用编排 know-how;
③ 雪球是社区平台,商业模式是流量广告,引入 AI 反而压制大 V 内容;
④ 智研恰好同时满足:小团队/快迭代/AI 编码红利,能在"垂直 + 多人格 + 剧场化"的薄交叉点上,做到大厂不愿做的精度。
不按模块干讲,我们走两个典型场景 — 一个互联网产品经理上班路上看到自己持仓暴跌,一个私募研究员准备投委会汇报。同一款智研,两条完全不同的动线 — 看完这一节,后面 3 节(16 合伙人 / 4 决策剧场 / 报告 + 新手层)的位置就全清楚了。
周一早 9:15,上班地铁里刷新闻看到「宁德时代盘前跌 7%,机构调研称四季度产能利用率不及预期」。她拿着手机心里发慌 — 是该立刻割肉,还是该补仓?雪球大 V 一半喊"跑",一半喊"上"。3 站地铁里能不能拿到一个让她不焦虑的答案?
| # | 她点了什么 / 屏幕看到什么 | 她的心里活动 / 解决了什么 | 对应核心功能 |
|---|---|---|---|
| 1 | 智研首页 「AI 智能搜索框」(提示语"输入股票代码 / 公司名 / 投资问题,AI 自动路由")— 直接打"宁德"或问题"宁德今天怎么了" → AI 听懂后 3 秒进对应分析模块 | "打字就行,不用学股票代码 — 还能直接问问题" | AI 智能搜索 |
| 2 | 研报顶部信息卡旁点 「✦ AI 大白话讲讲」:"别被『产能利用率不及预期』吓到 — 宁德本来一天能造 100 块电池,现在只造 65 块。不是机器坏了,是车厂没下那么多单。短期不是塌房,是订单变慢。" 旁边还有 「这份研报靠谱吗?」 按钮,告诉她"哪些是数据驱动的、哪些是模型推演、有什么不确定性" | "AI 一句话讲明白 + 会主动告诉我哪里不确定" | 研报顶部 AI 解读 + 透明度 |
| 3 | 研报顶部 7 个 tab(AI 研报 / 流派论战 / 事件雷达 / 公司画像 / 财务估值 / 资金风险 / 市场宏观) — 切到「事件雷达」看 「🚦 信号红绿灯」(警示 / 观察 / 正向 三档自动归类)+ 「📅 催化剂日历」(已发生 + 未来事件);研报里散布 14 张「新手指南」(杜邦 / 现金流 / 股权质押 / 主力资金…);不懂字段点 「✦ AI 解释」三秒翻译 | "有红有绿不是塌房;字段看不懂随时点小标签当字典" | 研报 7 tab + 新手指南 |
| 4 | 滑到「流派论战」tab 「六派独立推理」:6 位 AI 合伙人同台流式发言 + 「六派打分明细」;不过瘾 → 单开 「决策直播间」 大屏看 4 阶段:📊 数据装配 → 🧠 学派思辨 → 🗳 投票发布(「加权矩阵」可拖) → 📜 联席决议书 | "6 个人吵架 30 秒结束,4:2 持有不加仓" | 流派论战 + 决策直播间 |
| 5 | 不踏实 → 「红蓝队辩论」:蓝队"杀估值刚开始"对打红队"调研定价过头" → 系统出 「裁判矩阵」,从立场清晰度 / 数据扎实度 / 逻辑严密度 / 置信度 四维打分 | "看反方打脸自己的想法,心里才有底" | 红蓝队辩论 |
周四晚 22:00,准备周五投委会汇报「新能源板块是否加仓」。她做了 3 天基本面分析,结论"宁德加仓到 25%"。但深夜静下来,她担心自己被锂电池的"成长滤镜"框住 — 需要 3 个完全不同立场的对手盘视角,否则明天投委会被合伙人问死。
| # | 她点了什么 / 屏幕看到什么 | 她要的对手盘 / 解决了什么 | 对应核心功能 |
|---|---|---|---|
| 1 | 投委会前夜先打开 「📊 宏观分析 · 7 框架同时解读」(总览 / 价格通胀 / 增长动能 / 货币与利率 / 房地产 / 外部环境 / 情绪与高频)— 每框架都有「分维证据与分歧点 / 宏观立场与主线逻辑 / 情景分布 / 配置建议与信号跟踪」 | "先把宏观底盘看一遍 — 锂电池加仓决策不能脱离大势" | 宏观分析 · 7 框架 |
| 2 | 进 「🌐 宏观咨询」 — 5 位首席宏观合伙人(凯恩斯派 / 货币学派 / 奥地利学派 / 现代货币理论 / 新结构主义)+ 1 位主席,对当前宏观环境各自出独立判断,主席收口出综合决议 | "5 派同台 + 主席收口 — 还原宏观研究真实流程,看到自己漏掉的视角" | 宏观咨询 · 5 派合议 |
| 3 | 切到 「🎛 宏观推演 · 情景沙盘」,自然语言打字:"美联储突然降息 50bp,国内 LPR 跟随 10bp,油价回到 80 美元" — 系统解析成 6 个宏观变量(CPI / M2 / 5Y / USDCNY / 布伦特 / 出口),出「行业热力图 + Top3 受益 / 受损 + 行业影响拆解」+ AI 推演叙事 | "Python 算敏感度矩阵 × LLM 写推演叙事 — 不是闭门造车的情景假设" | 宏观推演 · 情景沙盘 |
| 4 | 宏观底盘 OK,落到选股层 — 在 「🔎 指标选股」 顶部 10+ 预设场景(价值派 / 成长派 / 质量派 / 红利派 / 宏观对冲派 / 港股蓝筹 / 经典默认 / 低估值党 / 质量价值党…)一键应用 + 市场 / 上限 / 排序二次过滤;「单股验证」可反查为什么某支没被选中 | "专业用户从一组候选池开始 — 节省手动初筛 2 小时" | 指标选股 |
| 5 | 用 「🥊 AI 选股 PK」 把宁德 / 比亚迪 / 阳光电源 三支并排,按估值 / 成长 / 资金 / 风险 四维度对照表 + 同业排名分位 | "不是看走势 PK,是四维度同口径对比 — 直接看出宁德估值最贵" | AI 选股 PK |
| 6 | 锁定宁德进 「个股分析」个股研报 — 7 tab(AI 研报 / 流派论战 / 事件雷达 / 公司画像 / 财务估值 / 资金风险 / 市场宏观)+ 16 张折叠新手指南 + 信号红绿灯;顶部「AI 大白话讲讲」「这份研报靠谱吗」两按钮主动给结论与置信度 — 数据驱动 vs 模型推演透明分层 | "反幻觉的「自报家门」— 给评委看哪些是硬数据、哪些是 AI 推演" | 个股分析 · 7 tab 研报 |
| 7 | 进 「个股研究 · 5 位合伙人并行尽调」 — 在 16 位合伙人卡片里勾选价值派 + 成长派 + 宏观派 + 对冲派 + 量化派,点开始尽调 → 5 位合伙人 SSE 并行流式输出 5 份独立尽调,4 分钟出齐;每段带真实基本面 / 资金流 / 行业景气 / 宏观数据引用 | "对冲派提到我没想到的:头部基金宁德持仓占比已 8%,边际买盘减弱" | 5 派个股尽调 |
| 8 | 最后做历史压测 — 打开 「时光机决策实验室」,把同一研究框架放到 2021 年 9 月(锂电池上次见顶前),系统给 AI 注入切到那一天的宏观数据 / 基本面 / 行业景气;AI 看不到 2021 年 9 月之后,在那时点出判断,系统快进真实涨跌做归因 | "AI 当年也被『成长滤镜』骗到 — 我现在的框架就是同样陷阱" | 时光机决策实验室 |
| 产品模块 | 小林(新手)用到了 | 王老师(专业)用到了 |
|---|---|---|
| § 16 位 AI 合伙人 | 默认 6 派直接上场,不需要她选 | 自选 5 派组合,故意避开自己的同温层 |
| § 4 决策剧场 | 流派论战(研报内嵌)· 决策直播间 · 红蓝队辩论 | 个股咨询报告 · 时光机决策实验室 · 情景沙盘 |
| § 个股研报(7 个 tab) | AI 大白话讲讲 · 这份研报靠谱吗 · 信号红绿灯 · 催化剂日历 · 新手指南 | 完整 7 tab(AI 研报 / 流派论战 / 事件雷达 / 公司画像 / 财务估值 / 资金风险 / 市场宏观)+ AI 选股 PK |
| § 宏观入口 | 默认看研报的「市场宏观」tab,不主动进宏观区 | 宏观分析 7 框架 · 宏观咨询 5 派合议 · 情景沙盘推演(三连击开局) |
| § 选股与个股 | AI 智能搜索 · 研报 7 tab(护栏层) · 红蓝队辩论 | 指标选股 · AI 选股 PK · 个股分析 7 tab · 5 派个股尽调 · 时光机 |
不是同一个模型换 prompt,是 16 套独立人格 —— 头像、口吻、关注点、强项、弱点都不同。模仿真实投委会的能力光谱覆盖。
LLM 一来就吐 800 字 markdown 是反人性的。我们把 AI 输出拆成有节奏的剧场:数据先亮、6 派轮流上场、流式打字、投票、裁判 — 像看一场圆桌辩论。下面 4 张卡片就是核心剧场的亮点速览。
决策剧场是吸睛点,日常使用主线是「报告 + 咨询」双层:个股 / 宏观各一份「研报式」结构化输出 + 一份「合议体」多 persona 咨询;底座之上铺一整层新手友好特性,让 0 基础也能看懂。
研报 hero 一键用人话讲 结论 / 为什么 / 风险 三件事。
14 张(杜邦 / 现金流 / 主力资金 / 股权质押…),不懂的随时展开。
几道题找出"哪派 AI 在替你看股",AI 回答按偏好自动调深浅。
警示 / 观察 / 正向 三档自动归类,小白一眼看红黄绿。
免开真账户在历史时点模拟下单,看 AI 当时怎么判 vs 真实涨跌。
研报里每个不懂的字段旁有 「让 AI 解释」三秒翻译。
16 位人格用短名 + 头像,把"风险合伙人"变"认识的人"。
每篇报告 hero 下固定免责声明 + 不给买卖点。诚实 + 合规。
在讲技术先进性之前,先用一张分层图把用户怎么进 → 服务怎么编排 → 数据怎么落讲清楚。智研是一套4 层架构:接入层 / 业务编排层 / AI 计算层 / 数据持久层。
架构最关键的事:4 层各司其职 + 边界清晰。L4 算数字、L3 编排 + 控幻觉、L2 把能力包装成产品模块、L1 给用户最舒服的入口。下面 2 节就是分别打开 L3 / L4:Agent 编排 + 技术内里。
2024 年的 AI 应用是「提示词工程 + 单 LLM」;2025 年起的赛点是Multi-Agent Orchestration。智研的核心 AI 工程价值,是把 16 个角色变成一支真正能分工 / 辩论 / 投票 / 仲裁的 Agent Team。
每个人格 = 独立 prompt + 独立工具偏好 + 独立角色;编排器 决定什么场景叫谁上场 · 谁先发言 · 谁裁判 · 输出怎么聚合。这套编排模式 2024 年只在 AutoGen / CrewAI / OpenAI Swarm 等学术框架里出现,智研把它第一次落进金融决策场景并真实上线。
智研的 编排器 同时支持 4 种 多 Agent 协作模式 — 串行 / 并行 / 对抗 / 投票仲裁,根据场景动态选择。
5 位咨询合伙人按战略→业务→市场→运营→风险顺序接力,后者基于前者的输出深化。最终 主席综合写决议书。
难点: 串行加共享上下文 — 后位人格 看得到前位的输出但 prompt 要避免被带歪。我们用结构化交接卡(每位输出固定 schema)。
类比: CrewAI 的 顺序流程
6 学派同时跑,SSE 多路流式,前端按 人格 id 分发 增量到对应卡片,边吐边渲染 markdown。
难点: 6 个 LLM 调用并发 + 单一 SSE 流的协议设计 — 我们用 {type, 人格, text} 三元组路由。前端 Compose / 浏览器都用同一 reducer。
类比: OpenAI Swarm 的 parallel 交接
2 位人格 多空对垒,N 轮强制【论点】【证据】【反驳】三段式。后轮可看到前轮全部内容,被要求直接驳斥对方上一论点。
难点: 防止"和稀泥"(LLM 倾向温和)。我们在 system prompt 里植入角色压力词("你是对方最严格的挑战者")+ 强制 marker 切段。
类比: AutoGen 的 对抗辩论范式
独立裁判 人格看完所有论点,强制输出 JSON 爆点矩阵:每个论点 成立/驳倒/悬而未决 三态 + 置信度 + 下一步要找的证据。
难点: JSON 解析失败的容错。我们做了三层兜底:(1) JSON 解析 → (2) 正则提取 → (3) 失败时显示 _parse_error + 原文。
类比: LLM 即裁判 / 约束 AI 的评判器范式
业界 Agent 框架(LangGraph / CrewAI / AutoGen)普遍不流式或只支持单一流。智研自研了一套 SSE 协议,支持 6 个 Agent 在单一 SSE 连接上并发输出,前端按 人格 id 路由。
name:"thinking" 让前端切换页面 + 进度条到对应阶段阶段 1 → 2 → 3 → 4persona:"value" 路由,前端按 id 找对应卡片追加文字 · 同时 6 派并发吐字高频事件立场:"bull/bear/neutral" + 置信度,触发卡片"立场胶囊"高亮工程难度:这套协议要在 6 个并发 LLM 调用 + 单 SSE 连接 + 前端聚合器 (Compose / 浏览器双端)三处都正确处理乱序、丢包、人格 id 路由、流式 markdown 增量渲染。市面上的 Agent 框架(CrewAI/AutoGen)都没解决这件事 — 因为他们的目标用户是开发者,不是终端用户,不需要"看着 6 个 AI 同框思考"的体验。
核心 AI 技术:防数据泄漏的反事实评估 + LLM 归因复盘。这是当前 LLM 应用学术界的开放问题(2024-2025 顶会反复讨论"LLM 怎么做可解释金融回测"),我们用工程手段解了:
LLM 训练数据见过未来,怎么让它"忘记"?
解法:注入 截止数据 + system prompt 双层约束;承认 LLM 模糊记忆但用逻辑可见替代"完全 blind"作为可信度标准
怎么用真实历史涨跌去打分 LLM 的判断?
解法:取决策日后 5/30/90 日真实交易数据 → 与 LLM 立场 匹配 → 算 命中率;不只看结果对错,看归因逻辑是否成立
谁判对了为什么?谁踩坑在哪个变量?
解法:归因 LLM 综合判断 + 真实结果 + 客观涨跌,流式输出 markdown,逐派 dissect。这是同业唯一的能力
多 Agent 对话框架,主打开发者用
学术友好,但缺垂直场景 + 缺端到端用户产品
声明式 agent 编排,有角色概念
本质是 后端,不流式,没有面向终端用户的体验层
轻量 agent 协作 + 交接
尚为实验框架,不带状态持久化,无金融数据接入
4 种协作模式(串行/并行/对抗/仲裁)同台
多 Agent SSE 流式前端边吐边渲染
金融垂直 + 16 人格具体场景闭环
关键差异:AutoGen/CrewAI/Swarm 是给开发者用的框架,目标是"让程序员构建 Agent 系统";智研的 编排器 是给散户用的产品,目标是"让用户看一场 16 个 AI 的辩论"。从「Agent 框架」到「Agent 体验产品」这一步,业界没有现成模板,智研做了第一个落地。
金融场景下幻觉的代价是用户真金白银的亏损。智研建立了一套由数据约束到产品层兜底的 8 层防御,层层把住 LLM 的自由发挥边界。
所有数字(PE / ROE / YoY / 涨跌幅)由 Python 从 Lixinger / 港股 vendor 拉取后注入 prompt。LLM 不能"编"数字,只能解读已知数字。
报告里客观数据卡(Python 算)与AI 解读(LLM 写)视觉分离。用户一眼能区分"这是事实"和"这是观点"。
裁判矩阵 / 投票 / 验收输出 JSON schema 强制;解析失败时三层 兜底:JSON.parse → 正则提取 → _parse_error 显原文。
估值 / 资金 / 趋势 / 质量等 4 维度Python 算分位数给灯,LLM 只能在"红黄绿"三态内 dissect,不能颠倒结论。
6 学派各自 立场 + 算法立场 双线投票。若 LLM 立场 与算法立场 严重背离,UI 显示背离警示提醒用户警惕。
多空两位人格 强制对抗,N 轮三段式。一边倒结论会被对方拷问,裁判矩阵把每个论点标 成立/驳倒/悬而未决。
把判断放回历史时点 + 真实涨跌,对每派算 命中率。准确率公开,LLM 的"自信"会被真实数据打脸。
报告 hero 下固定免责;智研不给"买入/卖出"具体行动建议,只产研究观点 + 决议书。决策由用户做,产品端守住合规红线。
核心理念:幻觉不是用"更强模型"消除的,而是用工程边界 + 多层验证 + 产品自律压缩到可接受范围。我们承认 LLM 会犯错,但通过 8 层防线让"犯错的代价"对用户透明、可对照、可质疑。
AI 应用最大的工程陷阱是"把所有事都丢给 LLM"。智研的核心工程哲学是:Python 做"事实层"(确定性、可验证),LLM 做"叙事层"(开放性、创造性)。这条分界线决定了产品的速度、成本、可信度。
分界线判断标准:能用公式 / 查表 / 算法解决的,绝不给 LLM(贵、慢、易错);需要语义理解 / 立场判断 / 开放叙事的,LLM 是最优解。判断错了会出现两种典型问题:把 LLM 当计算器 = 数字错;把 Python 当叙事器 = 干巴巴没人看。
"用什么模型"是 AI 应用最早要回答的问题。结论:开发(写代码 + 复杂推理验证)用顶配 · 生产(用户实时推理)用性价比 mini — 不混用。
为什么不一律用顶配?一次"决策直播间"触发 7 次 LLM 调用(6 persona + 1 主席),如果都走旗舰,免费层 3 票/天不可持续;切到 mini 后单次成本压到很低,规模化才有可能。开发用 Opus 是因为它把"4 周末做出大型上线产品"这件事变成可能 — 是开发者的杠杆;mini 是产品的运营成本基线。分账思路:省钱的地方往死里省,值钱的地方一分别省。
AI 应用 90% 卡在数据接入、冷启动慢、429 风暴 — 我们把这些都拆掉了。

100% 让 AI 写代码、产品经理只做产品决策 / prompt / 验收,听起来很美;真做下来踩了一堆非技术坑。诚实复盘 9 个真实痛点 + 解法 — 也是任何想搞 vibecoding 的人都会撞上的。
vibecoding 真正的难点不是"AI 会不会写代码",而是"产品经理能不能给出足够清晰的 spec + 验收"。代码 AI 写得很快,但验收路径没有人替你想。这 9 个挑战的本质就是:把传统软件团队的"代码 review + QA + DevOps + 文档"这些角色,压缩成 PM 一个人 + AI 的工作流。
骨架 + 报告生成 + 6 学派(MVP)
联席尽调 + 决议书 + 凌晨预跑
港股接通 + Lixinger 加速 + macro 并行化
16 人格 群聊 + 决策直播间 + 红蓝队 + 时光机 + 沙盘
Android 双端原生化(0.1.0 → 1.5.9) + 流式 markdown 全覆盖 + 自定义场景/滑块
Android 1.6.0 会员登录(与 web sessions 互通) + 两段渲染(冷启动 ~3s 首屏) + admin 优先调度 + 双 admin 看板(用户行为 + 系统健康度)
智研当前是 C 端免费产品,底层的 16 人格编排器 + 多市场数据底座 + 决议持久化 是一套可复用的「AI 投研中间件」。下一阶段路线:把 C 端做厚 → 跑通真实闭环 → 开放基础设施输出。
不写死季度日期 — 每个阶段「完成判据」清晰、迭代节奏由数据闭环驱动。
2024-2025 是 Multi-Agent + 流式 + 反事实回测 三件事从学术到产品的窗口期 — 学术 paper 满天飞,但没有产品级落地。智研抢的就是这 12-18 个月的结构性时间差:大厂(豆包 / 同花顺 / 雪球)受赛道定位拖累不会做、传统投研公司没有 AI 工程力,只有小团队 + AI 编码红利能填这个空白。
智研不是 PPT 产品 — Web 端 + 安卓双端已稳定运行。下面三个入口任选其一,现场就能验证。