支付宝中国产品部 · 智研小金库

智研 · 你的口袋 AI 投委会

让 AI 把机构级研究能力,平权到每个散户的口袋里 — 16 位 AI 合伙人 · 4 种决策剧场 · 30 秒一份决议
16独立 AI 人格
4决策剧场
~101K代码行 · 100% AI
4 周末1 PD + AI · 0 手写
Web · junming.fun Android · v1.6+ A 股 + 港股 + 宏观 30 天稳定上线
起源

散户的决策困境,不是缺信息,是缺立场

同花顺给你 K 线,雪球给你大 V,研报给你一份 PDF — 但没人告诉你「另一面会怎么反驳」。 机构投委会的真正价值不是数据,是 6 位风格不同的基金经理互相质疑,再由一个裁判仲裁。智研想把这件事压缩到 30 秒,搬到每个散户的口袋里。

⭐ 我们想做的事
让 AI 真正成为普通人的「技术普惠」 — 把过去只有专业机构才能拥有的研究能力,搬到每个人的口袋里

过去 30 年,A 股散户和机构之间最大的鸿沟不是钱,是研究资源的不对等 — 机构有 6 位基金经理开投委会、有彭博终端、有卖方研究覆盖,而散户只有大 V 一句"梭哈"。智研用 AI 把这道墙拆掉:16 位 AI 合伙人 24 小时随时开会、120+ 数据接口实时接入、决议永久归档可复盘 — 这不是"又一个 ChatGPT 应用",这是AI 给金融行业带来的一次真正的能力平权

⚠ 用户每天面对的真实痛点

  • 研报太长,读 30 页不知道结论
  • 大 V 立场单一,看完更焦虑
  • 历史复盘只给数字,没人讲「当时为什么对/错」
  • 宏观变量(CPI、油价、利率)和持仓影响说不清
  • 多支票要 PK,只能 Excel 列字段

✅ 我们的答卷

真投委会的流程(数据装配→多视角分析→投票→决议→复盘→对手盘辩论)每一步都给一个 AI 人格,流式渲染、剧场化叙事、可下载归档。

多 AI 协作示意
竞品对标

市场上没有第二个智研

通用 AI(豆包/千问/ChatGPT)没有金融数据接入;传统证券工具(同花顺)没有 AI 多视角解读;社区平台(雪球)有立场但缺结构。智研在「金融垂直 × 多人格 决策剧场」这个交叉点上,目前是独家。

📍 二维定位图

多人格 · 决策剧场
市场覆盖范围
↑ 多视角辩论
↓ 单一视角
通用 AI
金融垂直 →
(空白市场 · 通用 AI 没必要做多人格)
智研
豆包 千问 ChatGPT Kimi DeepSeek
同花顺 东方财富 雪球 Wind 通达信

🥊 头对头对照

能力维度 豆包 / 千问 ChatGPT 同花顺 雪球 智研
实时 A股+港股数据 通用 AI 无 社区视角 理杏仁 A股、港股、宏观数据(120+ 接口)
多 AI 人格 协作 单一 bot 单一 bot 无 AI 真人大 V 16 位独立人格
决策剧场化 / 流程化 聊天问答 聊天问答 数据展示 帖子瀑布 4 阶段剧场
结构化辩论 + 裁判矩阵 大 V 互喷无结构 红蓝队 + JSON 矩阵
历史回测 + AI 归因 仅数字回测 时光机(独家)
情景沙盘推演 静态指标 6 变量 + NL 解析
流式 markdown 渲染 单线 单线 多人格 并发流
投委会决议持久化 帖子归档 joint.db 永久
客户端原生(非 WebView) Compose 100%
立场对照(可解释性) 一个观点 一个观点 不下结论 自己拼大 V 6 派同框对照

🔍 各家做对了什么 / 漏了什么

豆包 / 千问

通用 AI · 聊天
模型能力强,流式 markdown 体验好
没有实时金融数据接入,无法做个股分析
单一回答,缺乏多视角对照,容易"一边倒"
没有金融工作流(报告/尽调/辩论/复盘)

同花顺 / Wind

传统证券工具
数据全、行情快、专业用户认可
研报是 PDF,普通散户读不懂
没有多视角 AI 解读,只给数字不给立场
回测工具只产数字,不给"为什么"

雪球

社区平台
大 V 多、立场多元、有互动
大 V 立场主观且情绪化,质量参差
没有结构化辩论,大 V 互喷不出结论
用户得自己拼凑视角,门槛高

智研

金融垂直 + 多人格
16 位 AI 合伙人,每个立场鲜明、口吻独立
4 种决策剧场,把流程做成可看的故事
时光机回测 + AI 归因,这条赛道唯一
实时 A股+港股数据,30 秒出完整决议

为什么大厂没做这件事?
豆包/千问定位通用 AI,做金融垂直意味着要养专门的数据接入团队,ROI 算不过来 ;
同花顺是数据驱动的工具公司,AI 是"贴牌"功能,缺少 LLM 应用编排 know-how;
雪球是社区平台,商业模式是流量广告,引入 AI 反而压制大 V 内容;
智研恰好同时满足:小团队/快迭代/AI 编码红利,能在"垂直 + 多人格 + 剧场化"的薄交叉点上,做到大厂不愿做的精度。

用户动线 · 场景化演示

两个典型用户的一天 · 把产品串成故事

不按模块干讲,我们走两个典型场景 — 一个互联网产品经理上班路上看到自己持仓暴跌,一个私募研究员准备投委会汇报。同一款智研,两条完全不同的动线 — 看完这一节,后面 3 节(16 合伙人 / 4 决策剧场 / 报告 + 新手层)的位置就全清楚了。

👩‍💻
案例 ① · 小林,28 岁,互联网产品经理
炒股 8 个月 · 持有宁德时代 200 股 · 成本 ¥250 · 不会看研报、看不懂 K 线、最怕一只票天天看心率上来
🎬 场景

周一早 9:15,上班地铁里刷新闻看到「宁德时代盘前跌 7%,机构调研称四季度产能利用率不及预期」。她拿着手机心里发慌 — 是该立刻割肉,还是该补仓?雪球大 V 一半喊"跑",一半喊"上"。3 站地铁里能不能拿到一个让她不焦虑的答案?

🚶‍♀️ 小林的 5 分钟动线(5 步,把核心功能串一遍)
# 她点了什么 / 屏幕看到什么 她的心里活动 / 解决了什么 对应核心功能
1 智研首页 「AI 智能搜索框」(提示语"输入股票代码 / 公司名 / 投资问题,AI 自动路由")— 直接打"宁德"或问题"宁德今天怎么了" → AI 听懂后 3 秒进对应分析模块 "打字就行,不用学股票代码 — 还能直接问问题" AI 智能搜索
2 研报顶部信息卡旁点 「✦ AI 大白话讲讲」:"别被『产能利用率不及预期』吓到 — 宁德本来一天能造 100 块电池,现在只造 65 块。不是机器坏了,是车厂没下那么多单。短期不是塌房,是订单变慢。" 旁边还有 「这份研报靠谱吗?」 按钮,告诉她"哪些是数据驱动的、哪些是模型推演、有什么不确定性" "AI 一句话讲明白 + 会主动告诉我哪里不确定" 研报顶部 AI 解读 + 透明度
3 研报顶部 7 个 tab(AI 研报 / 流派论战 / 事件雷达 / 公司画像 / 财务估值 / 资金风险 / 市场宏观) — 切到「事件雷达」看 「🚦 信号红绿灯」(警示 / 观察 / 正向 三档自动归类)+ 「📅 催化剂日历」(已发生 + 未来事件);研报里散布 14 张「新手指南」(杜邦 / 现金流 / 股权质押 / 主力资金…);不懂字段点 「✦ AI 解释」三秒翻译 "有红有绿不是塌房;字段看不懂随时点小标签当字典" 研报 7 tab + 新手指南
4 滑到「流派论战」tab 「六派独立推理」:6 位 AI 合伙人同台流式发言 + 「六派打分明细」;不过瘾 → 单开 「决策直播间」 大屏看 4 阶段:📊 数据装配 → 🧠 学派思辨 → 🗳 投票发布(「加权矩阵」可拖) → 📜 联席决议书 "6 个人吵架 30 秒结束,4:2 持有不加仓" 流派论战 + 决策直播间
5 不踏实 → 「红蓝队辩论」:蓝队"杀估值刚开始"对打红队"调研定价过头" → 系统出 「裁判矩阵」,从立场清晰度 / 数据扎实度 / 逻辑严密度 / 置信度 四维打分 "看反方打脸自己的想法,心里才有底" 红蓝队辩论
🎯 结果:小林 3 分钟看清局势,没有恐慌割肉,没有 FOMO 加仓,选择继续持有。她解决的是"焦虑",不是"赚钱" — 这才是散户最缺的东西。
👨‍💼
案例 ② · 王老师,35 岁,某私募基金研究员
5 年新能源研究 · 持证资深 · 自己有一套三因子打分表 · 缺的不是数据,是"自己看不见自己盲区"的对手盘
🎬 场景

周四晚 22:00,准备周五投委会汇报「新能源板块是否加仓」。她做了 3 天基本面分析,结论"宁德加仓到 25%"。但深夜静下来,她担心自己被锂电池的"成长滤镜"框住 — 需要 3 个完全不同立场的对手盘视角,否则明天投委会被合伙人问死。

🚶‍♂️ 王老师的 12 分钟动线(8 步,从宏观底盘到个股落地再到历史压测)
# 她点了什么 / 屏幕看到什么 她要的对手盘 / 解决了什么 对应核心功能
1 投委会前夜先打开 「📊 宏观分析 · 7 框架同时解读」(总览 / 价格通胀 / 增长动能 / 货币与利率 / 房地产 / 外部环境 / 情绪与高频)— 每框架都有「分维证据与分歧点 / 宏观立场与主线逻辑 / 情景分布 / 配置建议与信号跟踪」 "先把宏观底盘看一遍 — 锂电池加仓决策不能脱离大势" 宏观分析 · 7 框架
2 「🌐 宏观咨询」 — 5 位首席宏观合伙人(凯恩斯派 / 货币学派 / 奥地利学派 / 现代货币理论 / 新结构主义)+ 1 位主席,对当前宏观环境各自出独立判断,主席收口出综合决议 "5 派同台 + 主席收口 — 还原宏观研究真实流程,看到自己漏掉的视角" 宏观咨询 · 5 派合议
3 切到 「🎛 宏观推演 · 情景沙盘」,自然语言打字:"美联储突然降息 50bp,国内 LPR 跟随 10bp,油价回到 80 美元" — 系统解析成 6 个宏观变量(CPI / M2 / 5Y / USDCNY / 布伦特 / 出口),出「行业热力图 + Top3 受益 / 受损 + 行业影响拆解」+ AI 推演叙事 "Python 算敏感度矩阵 × LLM 写推演叙事 — 不是闭门造车的情景假设" 宏观推演 · 情景沙盘
4 宏观底盘 OK,落到选股层 — 在 「🔎 指标选股」 顶部 10+ 预设场景(价值派 / 成长派 / 质量派 / 红利派 / 宏观对冲派 / 港股蓝筹 / 经典默认 / 低估值党 / 质量价值党…)一键应用 + 市场 / 上限 / 排序二次过滤;「单股验证」可反查为什么某支没被选中 "专业用户从一组候选池开始 — 节省手动初筛 2 小时" 指标选股
5 「🥊 AI 选股 PK」 把宁德 / 比亚迪 / 阳光电源 三支并排,按估值 / 成长 / 资金 / 风险 四维度对照表 + 同业排名分位 "不是看走势 PK,是四维度同口径对比 — 直接看出宁德估值最贵" AI 选股 PK
6 锁定宁德进 「个股分析」个股研报 — 7 tab(AI 研报 / 流派论战 / 事件雷达 / 公司画像 / 财务估值 / 资金风险 / 市场宏观)+ 16 张折叠新手指南 + 信号红绿灯;顶部「AI 大白话讲讲」「这份研报靠谱吗」两按钮主动给结论与置信度 — 数据驱动 vs 模型推演透明分层 "反幻觉的「自报家门」— 给评委看哪些是硬数据、哪些是 AI 推演" 个股分析 · 7 tab 研报
7 「个股研究 · 5 位合伙人并行尽调」 — 在 16 位合伙人卡片里勾选价值派 + 成长派 + 宏观派 + 对冲派 + 量化派,点开始尽调 → 5 位合伙人 SSE 并行流式输出 5 份独立尽调,4 分钟出齐;每段带真实基本面 / 资金流 / 行业景气 / 宏观数据引用 "对冲派提到我没想到的:头部基金宁德持仓占比已 8%,边际买盘减弱" 5 派个股尽调
8 最后做历史压测 — 打开 「时光机决策实验室」,把同一研究框架放到 2021 年 9 月(锂电池上次见顶前),系统给 AI 注入切到那一天的宏观数据 / 基本面 / 行业景气;AI 看不到 2021 年 9 月之后,在那时点出判断,系统快进真实涨跌做归因 "AI 当年也被『成长滤镜』骗到 — 我现在的框架就是同样陷阱" 时光机决策实验室
🎯 结果:王老师原本要建议"加仓 25%",看完对手盘后改成"维持 20% + 5% 对冲头寸"。智研对她不是"AI 投顾",是"低成本对手盘工厂"

🔗 两条动线 → 三节产品介绍 的串联关系

产品模块 小林(新手)用到了 王老师(专业)用到了
§ 16 位 AI 合伙人默认 6 派直接上场,不需要她选自选 5 派组合,故意避开自己的同温层
§ 4 决策剧场流派论战(研报内嵌)· 决策直播间 · 红蓝队辩论个股咨询报告 · 时光机决策实验室 · 情景沙盘
§ 个股研报(7 个 tab)AI 大白话讲讲 · 这份研报靠谱吗 · 信号红绿灯 · 催化剂日历 · 新手指南完整 7 tab(AI 研报 / 流派论战 / 事件雷达 / 公司画像 / 财务估值 / 资金风险 / 市场宏观)+ AI 选股 PK
§ 宏观入口默认看研报的「市场宏观」tab,不主动进宏观区宏观分析 7 框架 · 宏观咨询 5 派合议 · 情景沙盘推演(三连击开局)
§ 选股与个股AI 智能搜索 · 研报 7 tab(护栏层) · 红蓝队辩论指标选股 · AI 选股 PK · 个股分析 7 tab · 5 派个股尽调 · 时光机
阵容

16 位 AI 合伙人,每人独立人格

不是同一个模型换 prompt,是 16 套独立人格 —— 头像、口吻、关注点、强项、弱点都不同。模仿真实投委会的能力光谱覆盖。

🎓 6 位投资学派 · 看个股

价值派(巴菲特风)·成长派(彼得林奇风)·质量派(芒格风)·红利派(债券风)·趋势派(技术派)·宏观对冲派

💼 5 位咨询合伙人 · 做尽调

战略合伙人 · 业务合伙人 · 市场合伙人 · 运营合伙人 · 风险合伙人(出决议书)

🌐 5 位宏观合伙人 · 看大势

宏观策略 · 产业传导 · 资产配置 · 政策执行 · 宏观风险(出宏观咨询)

🎓 投资学派

6 位 用在「决策直播间」「红蓝队辩论」「流派论战」 — 看个股
价值派
折扣买好公司
成长派
长坡厚雪
质量派
护城河 · ROIC
红利派
现金流 · 派息
趋势派
资金流 · 突破
宏观对冲派
利率 · 系统风险

💼 咨询合伙人

5 位 用在「个股咨询报告」 — 做合议尽调
战略合伙人
行业格局
业务合伙人
商业模式
市场合伙人
需求与竞品
运营合伙人
执行与组织
风险合伙人
合规与红线

🌐 宏观合伙人

5 位 用在「宏观咨询」「情景沙盘」 — 看大势
宏观策略
大势判断
产业传导
链条影响
资产配置
大类轮动
政策执行
监管视角
宏观风险
尾部情景
核心剧场

4 种决策剧场,把研究变成可看的故事

LLM 一来就吐 800 字 markdown 是反人性的。我们把 AI 输出拆成有节奏的剧场:数据先亮、6 派轮流上场、流式打字、投票、裁判 — 像看一场圆桌辩论。下面 4 张卡片就是核心剧场的亮点速览。

业内独家剧场化

01🎬决策直播间

6 学派 AI persona 同台演 4 阶段串行直播:📊 数据装配 → 🧠 学派思辨 → 🗳 投票发布 → 📜 联席决议书。一支股 30-45 秒完整跑完。
  • 4 阶段顶部进度条 · 每派头像 + 流式发言 + 立场 / 置信度
  • 投票阶段出现 「加权矩阵」 可拖权重,看决议如何翻盘
  • 决议书 永久持久化,可分享 / 下载
论点对错地图

02红蓝队辩论

任选两位人格 多空对决,1-4 轮强制 【论点】【证据】【反驳】 三段式 — 不能糊弄。最后裁判出 JSON 爆点矩阵。
  • 用户可注入 600 字关键证据(Q4 利润 / 新规 / 客户),每轮 prompt 自动带
  • 裁判矩阵逐条标 成立 / 驳倒 / 悬而未决 + 置信度 + 下一步要找的证据
  • 不是给一个观点,是给一张论点对错地图
赛道最稀缺能力

03时光机

把 LLM 放回过去某天,让它看不到未来地下判断,系统快进真实涨跌,AI 复盘谁判对了为什么。整个行业唯一一个「AI 历史校准」产品。
  • 预设拐点(疫情底 / 抱团顶 / 政策反转)或自定义穿越点
  • 注入切到决策日的 macro+fundamentals · 6 派当日判断 vs 真实涨跌
  • 教育 / 投顾杀手锏:验证「哪派像我」「什么情景下哪派最准」
Python × LLM 分工

04🎛情景沙盘

6 个宏观变量(CPI / M2 / 5Y / USDCNY / 布伦特 / 出口)拖滑块 → 综合分 + 行业热力图实时变 → AI 写 200 字推演叙事。
  • 支持自然语言一句话(如「美联储降息 50bp」)→ LLM 自动解析滑杆
  • 输出 「行业热力图 + Top3 受益 / 受损 + 行业影响拆解」
  • Python 算敏感度矩阵,LLM 写叙事 — Python × AI 分工范例
完整产品矩阵

报告 + 咨询 双层 · 新手友好层贯穿

决策剧场是吸睛点,日常使用主线是「报告 + 咨询」双层:个股 / 宏观各一份「研报式」结构化输出 + 一份「合议体」多 persona 咨询;底座之上铺一整层新手友好特性,让 0 基础也能看懂。

📊

个股 AI 研报

报告 · 研报式
输入一支代码,30-45 秒生成 7 个 tab 分组研报(AI 研报 / 流派论战 / 事件雷达 / 公司画像 / 财务估值 / 资金风险 / 市场宏观)。LLM 输出全部基于真实数据,客观与解读分离。
🚦 信号红绿灯 📅 催化剂日历 ✨ AI 大白话讲讲 🛡 这份研报靠谱吗 14 张新手指南 📑 归因复盘
亮点:整个行业唯一一个 hero 上有「这份研报靠谱吗」 chip 的 AI 产品 — 主动告诉用户哪些是数据驱动、哪些是模型推演。
🌐

宏观 7 框架解读

报告 · 研报式
7 个 tab 同时给宏观研判:总览 / 价格通胀 / 增长动能 / 货币与利率 / 房地产 / 外部环境 / 情绪与高频。每框架都有「分维证据与分歧点 / 立场与主线逻辑 / 情景分布 / 配置建议」。
🧠 宏观分析师研报 📊 情景分布 ⚡ 情绪与高频 🎯 配置建议 💬 内嵌 AI 问答
亮点:7 个宏观框架并行给研判 — 等于同时请 7 位首席经济学家,分歧点可见、立场可追溯。
💼

个股咨询

咨询 · 合议体
输入候选股票 → 5 位合伙人 + 1 位主席并行流式合议,4 分钟出齐 5 份独立尽调报告。还原投行真实流程:战略 / 业务 / 市场 / 运营 / 风险 五维同口径,主席综合判断。
5 位合伙人 SSE 并发 主席合议出结论 真实数据引用 归档可追溯 投委会对手盘材料
亮点:业界 Agent 框架(LangGraph / CrewAI / AutoGen)普遍不流式或只支持单一流,智研自研 SSE 协议支持 5 路并发同时流式渲染。
🗺

宏观咨询

咨询 · 合议体
用户提一个宏观问题(政策 / 利率 / 出海 / 板块轮动…)→ 5 位宏观合伙人 + 1 位主席合议体给出研判:宏观策略 / 产业传导 / 资产配置 / 政策执行 / 宏观风险 — 多视角不偏一隅。
5 位宏观合伙人 主席最终研判 每日 02:30 预生成 长期归档
亮点:凌晨 02:30 预跑 6 份咨询报告(5 合伙人 + 主席),用户白天打开秒回;未命中也只要 ~20s 流式补水。

🌱 新手友好层 · 8 道防线贯穿所有报告 / 咨询

✦ AI 大白话讲讲

研报 hero 一键用人话讲 结论 / 为什么 / 风险 三件事。

📖 新手指南折叠卡

14 张(杜邦 / 现金流 / 主力资金 / 股权质押…),不懂的随时展开。

🪞 投资人格测评

几道题找出"哪派 AI 在替你看股",AI 回答按偏好自动调深浅。

🚦 信号红绿灯

警示 / 观察 / 正向 三档自动归类,小白一眼看红黄绿。

🎮 历史决策模拟器

免开真账户在历史时点模拟下单,看 AI 当时怎么判 vs 真实涨跌。

✦ ai-chip 字段解释

研报里每个不懂的字段旁有 「让 AI 解释」三秒翻译。

🪪 PERSONA 短名头像

16 位人格用短名 + 头像,把"风险合伙人"变"认识的人"。

📜 内嵌免责条

每篇报告 hero 下固定免责声明 + 不给买卖点。诚实 + 合规。

系统总览

📐 整体架构 · 一张图看完智研

在讲技术先进性之前,先用一张分层图把用户怎么进 → 服务怎么编排 → 数据怎么落讲清楚。智研是一套4 层架构:接入层 / 业务编排层 / AI 计算层 / 数据持久层。

🖥

L1 · 接入层

用户入口
Web (FastAPI + Jinja2)主流入口 · 4 worker
Android (Compose)okhttp-sse 流式
AI 智能搜索首页路由 + Q&A 联想
Tour 导览2 条用户动线
▼ ▼ ▼ ▼
🎬

L2 · 业务编排层

产品模块
个股研报7 tab · AI 大白话 · 信号灯
4 决策剧场直播 / 辩论 / 时光机 / 沙盘
个股 / 宏观咨询5 合伙人 + 主席合议
持仓 18 月回测+ AI 风险评估
▼ ▼ ▼ ▼
🤖

L3 · AI 计算层

核心引擎
编排器 (自研)4 模式:串 / 并 / 对抗 / 仲裁
16 人格池独立 prompt + 工具偏好
SSE 多 Agent 流式协议单连接 N 并发
LLMClientN key 轮询 · 自动换
幻觉治理 8 层数据约束 → 产品兜底
反事实回测时光机切片 + AI 归因
NL → 滑杆解析沙盘自然语言入口
结构化 JSON裁判 / 投票 schema 兜底
▼ ▼ ▼ ▼
💾

L4 · 数据持久层

底座
理杏仁 (北京反代)0.58s · 120+ 接口
港股 vendorORC + 8 endpoint 接通
新浪 / 东财实时行情 + 异动
7 个 SQLite WAL报告 / 决议 / 选股 / 反馈
凌晨 02:30 预跑298 种子池 + 6 宏观咨询
Macro 7 ThreadPoolfan-out 60s→22s
TypeError SKIPvendor 熔断 5min TTL
L1+L2 双层缓存跨 worker 一致性
🎯

架构最关键的事:4 层各司其职 + 边界清晰。L4 算数字、L3 编排 + 控幻觉、L2 把能力包装成产品模块、L1 给用户最舒服的入口。下面 2 节就是分别打开 L3 / L4:Agent 编排 + 技术内里。

AI 技术先进性

从「调一个 LLM」到「编排一支 Agent Team」

2024 年的 AI 应用是「提示词工程 + 单 LLM」;2025 年起的赛点是Multi-Agent Orchestration。智研的核心 AI 工程价值,是把 16 个角色变成一支真正能分工 / 辩论 / 投票 / 仲裁的 Agent Team。

核心理念

🤖 不是 16 个聊天 bot,是一支有结构的 Agent Team

每个人格 = 独立 prompt + 独立工具偏好 + 独立角色;编排器 决定什么场景叫谁上场 · 谁先发言 · 谁裁判 · 输出怎么聚合。这套编排模式 2024 年只在 AutoGen / CrewAI / OpenAI Swarm 等学术框架里出现,智研把它第一次落进金融决策场景并真实上线

🧩 Agent Team 编排架构

智研的 编排器 同时支持 4 种 多 Agent 协作模式 — 串行 / 并行 / 对抗 / 投票仲裁,根据场景动态选择。

🤖
编排器 Core
场景 → 角色挑选 → 编排模式 → 流式聚合输出
SERIAL · 接力
串行模式
联席尽调:5 咨询接力
战略 → 业务 → 市场 → 运营 → 风险
PARALLEL · 并发
并行模式
决策直播间:6 派同时跑
SSE 多路流式
DEBATE · 对抗
对抗模式
红蓝队辩论:多 vs 空
N 轮三段式 + 裁判
ARBITRATION · 仲裁
仲裁模式
投票 / 决议
立场 + 置信度 + 主席综合
🧠 16 人格池独立 prompt + 独立工具偏好
价值 成长 质量 红利 趋势 宏观对冲 战略 业务 市场 运营 风险 宏观策略 产业传导 资产配置 政策执行 宏观风险
6 学派 · 5 咨询合伙人 · 5 宏观合伙人
LLMClient · N key 轮询 · 流式 SSE · 401/429/5xx 自动换 key

🎭 4 种 多 Agent 协作模式

01 SERIAL · 接力

串行协作 · 联席尽调

5 位咨询合伙人按战略→业务→市场→运营→风险顺序接力,后者基于前者的输出深化。最终 主席综合写决议书。

难点: 串行加共享上下文 — 后位人格 看得到前位的输出但 prompt 要避免被带歪。我们用结构化交接卡(每位输出固定 schema)。
类比: CrewAI 的 顺序流程

02 PARALLEL · 并发

并行协作 · 决策直播间

6 学派同时跑,SSE 多路流式,前端按 人格 id 分发 增量到对应卡片,边吐边渲染 markdown。

难点: 6 个 LLM 调用并发 + 单一 SSE 流的协议设计 — 我们用 {type, 人格, text} 三元组路由。前端 Compose / 浏览器都用同一 reducer。
类比: OpenAI Swarm 的 parallel 交接

03 对抗模式

对抗协作 · 红蓝队辩论

2 位人格 多空对垒,N 轮强制【论点】【证据】【反驳】三段式。后轮可看到前轮全部内容,被要求直接驳斥对方上一论点。

难点: 防止"和稀泥"(LLM 倾向温和)。我们在 system prompt 里植入角色压力词("你是对方最严格的挑战者")+ 强制 marker 切段。
类比: AutoGen 的 对抗辩论范式

04 仲裁模式

仲裁协作 · 裁判矩阵

独立裁判 人格看完所有论点,强制输出 JSON 爆点矩阵:每个论点 成立/驳倒/悬而未决 三态 + 置信度 + 下一步要找的证据。

难点: JSON 解析失败的容错。我们做了三层兜底:(1) JSON 解析 → (2) 正则提取 → (3) 失败时显示 _parse_error + 原文。
类比: LLM 即裁判 / 约束 AI 的评判器范式

📡 SSE 多 Agent 流式协议(自研)

业界 Agent 框架(LangGraph / CrewAI / AutoGen)普遍不流式或只支持单一流。智研自研了一套 SSE 协议,支持 6 个 Agent 在单一 SSE 连接上并发输出,前端按 人格 id 路由。

SSE 单连接 · 多 Agent 并发 客户端 1 个 EventSource · 服务端 6 个 LLM 并发 · 前端按 persona id 路由到对应卡片
📊 阶段 1 · 数据装配
6 维核心快照
🧠 阶段 2 · 学派思辨
6 派 SSE 并发 delta
🗳 阶段 3 · 投票发布
立场 + 置信度 + 加权矩阵
📜 阶段 4 · 联席决议书
秘书 LLM 流式综合
meta会话起手 · 推 6 个 persona 元信息(头像 / 名称 / 主题色)给前端初始化卡片
phase阶段切换 · 携带 name:"thinking" 让前端切换页面 + 进度条到对应阶段阶段 1 → 2 → 3 → 4
delta流式 markdown 增量 · 带 persona:"value" 路由,前端按 id 找对应卡片追加文字 · 同时 6 派并发吐字高频事件
persona_done单派输出完结 · 带 立场:"bull/bear/neutral" + 置信度,触发卡片"立场胶囊"高亮
votes阶段 3 · 6 派投票分布快照 · 加权矩阵从这里开始可拖滑块实时算综合分
resolution_delta阶段 4 · 秘书 LLM 综合 6 派输出,流式 markdown 增量写决议书
[DONE]会话结束 · 触发归档写盘(joint.db) + 分享卡片生成

工程难度:这套协议要在 6 个并发 LLM 调用 + 单 SSE 连接 + 前端聚合器 (Compose / 浏览器双端)三处都正确处理乱序、丢包、人格 id 路由、流式 markdown 增量渲染。市面上的 Agent 框架(CrewAI/AutoGen)都没解决这件事 — 因为他们的目标用户是开发者,不是终端用户,不需要"看着 6 个 AI 同框思考"的体验。

🔬 时光机:反事实回测 + AI 归因(独家)

核心 AI 技术:防数据泄漏的反事实评估 + LLM 归因复盘。这是当前 LLM 应用学术界的开放问题(2024-2025 顶会反复讨论"LLM 怎么做可解释金融回测"),我们用工程手段解了:

问题 1

数据泄漏

LLM 训练数据见过未来,怎么让它"忘记"?

解法:注入 截止数据 + system prompt 双层约束;承认 LLM 模糊记忆但用逻辑可见替代"完全 blind"作为可信度标准

问题 2

反事实评估

怎么用真实历史涨跌去打分 LLM 的判断?

解法:取决策日后 5/30/90 日真实交易数据 → 与 LLM 立场 匹配 → 算 命中率;不只看结果对错,看归因逻辑是否成立

问题 3

AI 归因

谁判对了为什么?谁踩坑在哪个变量?

解法:归因 LLM 综合判断 + 真实结果 + 客观涨跌,流式输出 markdown,逐派 dissect。这是同业唯一的能力

⚖ 和业界 Agent 框架对比

AutoGen
Microsoft · 框架

多 Agent 对话框架,主打开发者用

学术友好,但缺垂直场景 + 缺端到端用户产品

CrewAI
开源 · 框架

声明式 agent 编排,有角色概念

本质是 后端,不流式,没有面向终端用户的体验层

OpenAI Swarm
OpenAI · 实验性

轻量 agent 协作 + 交接

尚为实验框架,不带状态持久化,无金融数据接入

智研 编排器
自研 · 上线产品

4 种协作模式(串行/并行/对抗/仲裁)同台

多 Agent SSE 流式前端边吐边渲染

金融垂直 + 16 人格具体场景闭环

🎯

关键差异:AutoGen/CrewAI/Swarm 是给开发者用的框架,目标是"让程序员构建 Agent 系统";智研的 编排器 是给散户用的产品,目标是"让用户看一场 16 个 AI 的辩论"。从「Agent 框架」到「Agent 体验产品」这一步,业界没有现成模板,智研做了第一个落地。

🧪 LLM 幻觉治理 · 8 层防线

金融场景下幻觉的代价是用户真金白银的亏损。智研建立了一套由数据约束到产品层兜底的 8 层防御,层层把住 LLM 的自由发挥边界。

🌪 原始 LLM 输出 混杂事实 + 幻觉 + 主观 ✅ 用户看到的输出 透明 · 可对照 · 可质疑 L1 数据强制注入 Python 算 / 不让 LLM 编 L2 客观 / 解读分离 视觉上一眼能区分 L3 JSON Schema 强制结构 + 三层兜底 L4 信号灯固化 Python 算分位数 → 红黄绿 L5 6 派交叉验证 LLM 立场 vs 算法立场 L6 红蓝队对抗 强制三段式 + 裁判 L7 反事实回测 真实涨跌 命中率 L8 产品层兜底 免责 + 不给买卖点 📊 数据卡 Python 算 · 100% 真实 PE-TTM:25.4x 五年分位:32% 低位 信号灯: 绿灯 · 估值便宜 🤖 AI 解读(LLM 写) "32% 分位处于历史低位, 但需结合行业看是否常态低估" ✓ 数字可验证 · 解读可质疑 · 立场可对照
L1 · 数据约束

真实数据强制注入

所有数字(PE / ROE / YoY / 涨跌幅)由 Python 从 Lixinger / 港股 vendor 拉取后注入 prompt。LLM 不能"编"数字,只能解读已知数字。

L2 · 客观/解读分离

客观与解读分离

报告里客观数据卡(Python 算)AI 解读(LLM 写)视觉分离。用户一眼能区分"这是事实"和"这是观点"。

L3 · 结构化输出

JSON Schema 强制 + 兜底

裁判矩阵 / 投票 / 验收输出 JSON schema 强制;解析失败时三层 兜底:JSON.parse → 正则提取 → _parse_error 显原文。

L4 · 信号灯固化

客观信号灯固化结论

估值 / 资金 / 趋势 / 质量等 4 维度Python 算分位数给灯,LLM 只能在"红黄绿"三态内 dissect,不能颠倒结论。

L5 · 多人格 交叉

6 派交叉验证

6 学派各自 立场 + 算法立场 双线投票。若 LLM 立场 与算法立场 严重背离,UI 显示背离警示提醒用户警惕。

L6 · 对抗校验

红蓝队对抗校验

多空两位人格 强制对抗,N 轮三段式。一边倒结论会被对方拷问,裁判矩阵把每个论点标 成立/驳倒/悬而未决。

L7 · 反事实回测

时光机反事实验证

把判断放回历史时点 + 真实涨跌,对每派算 命中率。准确率公开,LLM 的"自信"会被真实数据打脸。

L8 · 产品层兜底

免责 + 不给买卖点

报告 hero 下固定免责;智研不给"买入/卖出"具体行动建议,只产研究观点 + 决议书。决策由用户做,产品端守住合规红线。

🛡

核心理念:幻觉不是用"更强模型"消除的,而是用工程边界 + 多层验证 + 产品自律压缩到可接受范围。我们承认 LLM 会犯错,但通过 8 层防线让"犯错的代价"对用户透明、可对照、可质疑。

⚖ Python × AI 工程哲学 · 什么交给 LLM,什么不给

AI 应用最大的工程陷阱是"把所有事都丢给 LLM"。智研的核心工程哲学是:Python 做"事实层"(确定性、可验证),LLM 做"叙事层"(开放性、创造性)。这条分界线决定了产品的速度、成本、可信度。

🐍 Python · 事实层 确定性 · 可验证 · 快 · 廉价 数据装配Lixinger / 港股 vendor 指标计算PE / ROE / YoY / 分位数 DCF 折现3 种 WACC + 永续 历史涨跌5/30/90 日 命中率 信号灯打分分位数 → 红黄绿 沙盘综合分6 维敏感度矩阵 缓存 / 并发WAL + 多 key 轮询 🤖 LLM · 叙事层 开放性 · 创造性 · 难量化 报告解读要点 一句话 多人格 立场6 学派理由 归因复盘谁判对了为什么 红蓝辩论论点 / 证据 / 反驳 裁判矩阵成立 / 驳倒 / 悬而未决 沙盘叙事200 字推演 新闻翻译事件 → 持仓影响 注入 prompt 📦 智研 · 一份可信报告

🐍 Python 做(确定性 · 可验证 · 快)

  • 数据装配:Lixinger / 港股 vendor / 新浪 / 东方财富 接入
  • 指标计算:PE / PB / ROE / YoY / 分位数 / DCF 现金流折现
  • 历史涨跌:取真实交易数据,5/30/90 日 命中率 计算
  • 信号灯打分:估值 / 资金 / 趋势 / 质量四维度,分位数→红黄绿
  • 沙盘综合分:6 变量敏感度矩阵 → 综合分 + 行业冲击
  • JSON 解析 + 兜底:三层 兜底 容错
  • 缓存 / 持久化:7 WAL store + 凌晨预跑
  • 并发 / 限流:Lixinger 8 req/s + ThreadPool 8 路 + 多 key 轮询

🤖 LLM 做(开放性 · 创造性 · 难量化)

  • 报告解读:数据卡背后的 要点 "为什么 PE 在 32% 分位说明便宜"
  • 多人格 立场:6 学派各自的判断 + 理由
  • 归因复盘:时光机里"谁判对了为什么,踩坑在哪个变量"
  • 红蓝辩论:论点 / 证据 / 反驳的展开
  • 裁判矩阵:每个论点的 成立 / 驳倒 / 悬而未决 判定
  • 沙盘叙事:6 变量推演结果的 200 字解读
  • 章节问答:用户对子章的追问
  • 新闻翻译:行业事件 → 持仓影响的语义改写

分界线判断标准:能用公式 / 查表 / 算法解决的,绝不给 LLM(贵、慢、易错);需要语义理解 / 立场判断 / 开放叙事的,LLM 是最优解。判断错了会出现两种典型问题:把 LLM 当计算器 = 数字错;把 Python 当叙事器 = 干巴巴没人看。

🧪 AI 模型选型 · 开发 vs 生产分账

"用什么模型"是 AI 应用最早要回答的问题。结论:开发(写代码 + 复杂推理验证)用顶配 · 生产(用户实时推理)用性价比 mini — 不混用。

开发期 · 写代码

🧠 Claude Opus 4.7

Anthropic · 200K 上下文 · 工具调用稳
  • 大型多文件项目能记住跨文件结构
  • Plan / Skill 切片能力强,适合全链路
  • 命令行 / 工具调用稳定 · 智研 100% 代码由它写
  • 承认不确定,出错时主动说"我猜的"
定位:主程 + 主架构师 · 4 个周末写完全栈 + Android
评估期 · 备选

🚀 GPT-5.5

OpenAI · 旗舰多模态 · 推理深
  • 纯推理 / 数学题偶尔超 Opus,深度链路稍稳
  • 🎨 画图能力极强 — 智研 16 位 AI 合伙人头像、首页 hero 插画、各种人物素材全部由 GPT-5.5 生成
  • 多模态(图像 / 表格)处理强 · 写代码场景用不到
  • 大型多文件项目"记忆性"反而不如 Opus
结论:代码场景边际收益不够,但「画图素材生成」就是它专属任务 · 双模型互补
生产期 · 16 persona 跑实时

⚡ GPT-5.4 mini

OpenAI · 中端 · 流式快 · 高性价比
  • 金融解读 / 多 persona 立场表达质量够用
  • SSE 流式延迟极低 · 决策直播间 6 派同台不卡
  • JSON 结构化输出稳 · 裁判矩阵 / 投票一次过
  • 单价显著低于旗舰 · 散户免费层才能跑得起
定位:生产 LLM · 16 个 persona 同时跑流式都是它扛着
💰

为什么不一律用顶配?一次"决策直播间"触发 7 次 LLM 调用(6 persona + 1 主席),如果都走旗舰,免费层 3 票/天不可持续;切到 mini 后单次成本压到很低,规模化才有可能。开发用 Opus 是因为它把"4 周末做出大型上线产品"这件事变成可能 — 是开发者的杠杆;mini 是产品的运营成本基线。分账思路:省钱的地方往死里省,值钱的地方一分别省。

技术内里

不是 demo,是上线 30 天的产品

AI 应用 90% 卡在数据接入、冷启动慢、429 风暴 — 我们把这些都拆掉了。

🎯 一支股票从冷启动到看到决议

3s
首屏出框 (stage1)
优化前 10-12s
8s
全量补水 (stage2)
后台异步,无感升级
30s
决策直播间
4 阶段全程
22s
宏观快照
优化前 90s
6-12s
银行/保险
优化前 82s
数据基建示意

🛠 vibecoding 过程中的困难与挑战

100% 让 AI 写代码、产品经理只做产品决策 / prompt / 验收,听起来很美;真做下来踩了一堆非技术坑。诚实复盘 9 个真实痛点 + 解法 — 也是任何想搞 vibecoding 的人都会撞上的。

挑战 ①
🧠 LLM 上下文易爆
单个对话写到 7-8 万 token 时,Claude 经常忘记最初 spec(比如忘了"研报 7 tab 不是 16 子章")。
解:CLAUDE.md + 短指令持续注入约束;复杂任务先用 Plan / Skill切片。
挑战 ②
🏗 跨端栈切换成本高
Python (FastAPI / Jinja) → Kotlin Compose → JS 浏览器 — 同一份功能要写 3 遍。LLM 切栈时框架习惯会带歪。
解:每端 convention 速记;切栈前让 AI 复述本端 idiom;多端共享逻辑做单一真相源
挑战 ③
🪲 不写代码 = 不会调 bug
vibecoding 最大的反直觉:出 bug 时自己根本看不懂栈,靠 AI 自己修往往陷入"猜→改→又坏"。
解:逼 AI 先写测试 + 日志;复杂 bug 用 Plan 模式让它列假设 + 验证步骤而不是直接动手。
挑战 ④
🌪 vendor API 反复变形
理杏仁 / 港股 vendor 半路改字段 / 限流 / 同时 500;Claude 不知道新版,按旧记忆写 → 上线就崩。
解:每个 vendor 调用包raw_post + 兜底层;TypeError SKIP 落盘 5 min TTL;抓样本 paste 给 AI。
挑战 ⑤
🪞 AI 编的"看起来对"
LLM 经常造一个不存在的字段名 / 路由 / chip 出来,跑通后才发现页面上根本没有这功能。
解:所有产品文案必须从真实 DOM grep 验证;Tour selector 跑 querySelector 兜底缺则跳过。
挑战 ⑥
🔁 改一处坏三处
重构编排器 → 直播间挂了,改持仓 store → 沙盘热力图烂了。LLM 不知道远处影响。
解:凌晨预跑 298 支当回归测试;关键模块写 contract test钉死接口。
挑战 ⑦
📦 大型项目像玩拼图
17 routes 模块 + 7 SQLite + 16 persona prompt,改一个 import 都要拐 5 层。新会话进来上不了手。
解:记录 memory 文件;新会话开头让 AI 自己读;每模块顶部写简短 docstring当导航。
挑战 ⑧
⏱ 产品验收 vs AI 想象差距
AI 写完说"完成了",实测发现按钮没接、跳转错、移动端排版破。
解:PM 先写验收清单,AI 写完拿清单 manual 走一遍;不通过的 bug 拿截图 / 复现路径回投。
挑战 ⑨
💸 多模型协作 + 成本
写代码用 Opus 4.7(贵但准)、生产 LLM 用 mini(便宜但偶尔糊);切换不当容易错位。
解:开发 / 生产分开模型;每月对账 token 用量,贵的环节单点验证后再上量。
🎯

vibecoding 真正的难点不是"AI 会不会写代码",而是"产品经理能不能给出足够清晰的 spec + 验收"。代码 AI 写得很快,但验收路径没有人替你想。这 9 个挑战的本质就是:把传统软件团队的"代码 review + QA + DevOps + 文档"这些角色,压缩成 PM 一个人 + AI 的工作流

🤖

这个作品本身,就是「AI 应用替代研发」的活体案例

2026-04-18 启动 · 30 天 · 4 个周末 vibecoding · 作者零行手写代码
后端 Python + 前端 Jinja + Android Kotlin Compose 全栈,100% 由 Claude Code 编码完成,作者只做产品决策、prompt 与验收。这不仅是一款 AI 应用,也是 AI 替代传统研发的真实数据点 — 一个人,4 个周末,做出双端 16 模块上线产品

📅 实际研发时间线

04-18 启动

骨架 + 报告生成 + 6 学派(MVP)

04-19/26 第一/二个周末

联席尽调 + 决议书 + 凌晨预跑

05-03 第三个周末

港股接通 + Lixinger 加速 + macro 并行化

05-10 第四个周末

16 人格 群聊 + 决策直播间 + 红蓝队 + 时光机 + 沙盘

05-12 至 05-17 工作日碎片

Android 双端原生化(0.1.0 → 1.5.9) + 流式 markdown 全覆盖 + 自定义场景/滑块

05-18 当天

Android 1.6.0 会员登录(与 web sessions 互通) + 两段渲染(冷启动 ~3s 首屏) + admin 优先调度 + 双 admin 看板(用户行为 + 系统健康度)

📦 30 天里出炉的东西

~101K
代码行数(Python/Jinja/Kotlin/JS/CSS)
16
独立 AI 人格
4
决策剧场模式
18
Android release(0.1.0→1.6.8)
数十
web 发布
120+
理杏仁接口接通
7
WAL store 持久化
100%
AI 编码完成
📊 拆分:Python 后端 ~39K · Jinja2 模板 ~23K · Kotlin Compose ~27K · JS 交互 ~7.5K · CSS ~4.5K — 4 个周末 · 1 个 PD + AI · 0 行作者手写代码
未来 · 商业化

从「散户口袋投委会」到「AI 投研基础设施」

智研当前是 C 端免费产品,底层的 16 人格编排器 + 多市场数据底座 + 决议持久化 是一套可复用的「AI 投研中间件」。下一阶段路线:把 C 端做厚 → 跑通真实闭环 → 开放基础设施输出

📅 三阶段路线图

不写死季度日期 — 每个阶段「完成判据」清晰、迭代节奏由数据闭环驱动。

1 PHASE 1 · 把 C 端做厚

用户深度 + 多市场

让单用户用得更深、覆盖资产更广。完成判据:日活留存 + 单用户场景使用次数翻倍。
  • 组合管理·16 派对整个持仓做归因 + 调仓建议
  • 多市场扩展·美股 / ETF / 加密资产接入
  • 沙盘 NL 升级·任意复杂宏观叙事自动解析
  • iOS 客户端·补齐三端
2 PHASE 2 · 跑通真实闭环

从「看 AI 怎么判」到「看 AI 准不准」

用实盘和复盘把"AI 投委会"变成可被市场验证的决策系统。完成判据:6 派决议公开胜率持续可读。
  • 实盘验证·6 派决议接模拟仓,周度公开胜率
  • 个性化合伙人·用户偏好 → 私人 persona
  • 结构化社区·决议书可点赞 / Fork,雪球的结构化版本
  • 归因复盘自动化·胜率回灌到下一轮 prompt
3 PHASE 3 · 开放基础设施

把能力开放给生态

"AI 投委会"从单产品变成中间件,反哺生态。完成判据:首批 B 端客户接入跑通。
  • API / 白标·16 人格 + 4 剧场封装给教育 / 科普 / 财媒
  • 持牌合作·券商 / 银行投顾「AI 副驾」集成,不直接持牌
  • 非核心模块开源·SSE 协议 / persona 框架 / 编排器接口
  • 金融垂直模型·基于自有决议语料 fine-tune 小模型

💰 商业化三层模型

① 规模化C 端订阅 / SaaS

面向个人投资者

  • 免费层·3 票 / 天,体验全部核心功能
  • 专业版·不限次 + 16 人格全开 + 高级历史归档
  • 家庭 / 小团队版·多账号 + 决议库共享
关键:转化率而非首年 ARPU · 决策日记是最强复购钩子
② 高客单B 端 API / 白标

面向金融科普 / 教育 / 券商

  • API 按调用·教育 / 财媒平台接 SSE 流式
  • 券商「AI 副驾」·按席位年费,投顾日常辅助
  • 私行报告·银行客户报告自动化生成
关键:不持牌 · 只做底层能力供应商,合规风险低
③ 长期护城河数据资产

沉淀独家训练语料

  • 百万级决议·每份带 6 派立场 + 真实涨跌 + 复盘标注
  • 反哺 fine-tune·中文金融多 persona 小模型
  • 数据本身可流转·定价权随积累指数增长
关键:这是赛道里别人 1 年也追不上的护城河

🎯 为什么是现在 · 时间窗口

2024-2025 是 Multi-Agent + 流式 + 反事实回测 三件事从学术到产品的窗口期 — 学术 paper 满天飞,但没有产品级落地。智研抢的就是这 12-18 个月的结构性时间差:大厂(豆包 / 同花顺 / 雪球)受赛道定位拖累不会做、传统投研公司没有 AI 工程力,只有小团队 + AI 编码红利能填这个空白。

⚠ 风险与边界

  • 合规边界·不持牌、不给买卖点、信息辅助决策
  • 数据成本·vendor 年费 + LLM token,靠订阅与 B 端摊销
  • 幻觉责任·决议归档 + 时光机回测 → 让错误可审计
立即体验

🟢 产品已上线 · 评委现场可访问

智研不是 PPT 产品 — Web 端 + 安卓双端已稳定运行。下面三个入口任选其一,现场就能验证。

🌐

Web 直接访问

浏览器打开,无需注册即可看完整产品
junming.fun
🔗 立即打开 →
FastAPI · 4 worker · 凌晨 02:30 预跑 298 票
📱

安卓 APK 下载

扫码下载 — 三端(Web/Android/iOS 规划中)体验对齐
安卓 1.6.8 APK 下载二维码
扫码 → 直接下载 v1.6.8 APK
zhiyan-1.6.8.apk · 22 MB · Compose + okhttp-sse 流式渲染
v1.6+
已上线版本
30 天
连续稳定运行
100%
AI 编码生成
4 端
Web · A 股 · 港股 · Android