智研 · 你的口袋投委会

能力维度	豆包 / 千问	ChatGPT	同花顺	雪球	智研
实时 A股+港股数据	✗ 通用 AI 无	✗ 无	✓ 强	◐ 社区视角	✓ 理杏仁 A股、港股、宏观数据(120+ 接口)
多 AI 人格协作	✗ 单一 bot	✗ 单一 bot	✗ 无 AI	✗ 真人大 V	✓ 16 位独立人格
决策剧场化 / 流程化	✗ 聊天问答	✗ 聊天问答	✗ 数据展示	✗ 帖子瀑布	✓ 4 阶段剧场
结构化辩论 + 裁判矩阵	✗	✗	✗	◐ 大 V 互喷无结构	✓ 红蓝队 + JSON 矩阵
历史回测 + AI 归因	✗	✗	◐ 仅数字回测	✗	✓ 时光机(独家)
情景沙盘推演	✗	✗	◐ 静态指标	✗	✓ 6 变量 + NL 解析
流式 markdown 渲染	✓ 单线	✓ 单线	✗	✗	✓ 多人格并发流
投委会决议持久化	✗	✗	✗	◐ 帖子归档	✓ joint.db 永久
客户端原生(非 WebView)	✓	✓	✓	✓	✓ Compose 100%
立场对照(可解释性)	✗ 一个观点	✗ 一个观点	✗ 不下结论	◐ 自己拼大 V	✓ 6 派同框对照

用户动线 · 场景化演示

两个典型用户的一天 · 把产品串成故事

不按模块干讲,我们走两个典型场景 — 一个互联网产品经理上班路上看到自己持仓暴跌,一个私募研究员准备投委会汇报。同一款智研,两条完全不同的动线 — 看完这一节,后面 3 节(16 合伙人 / 4 决策剧场 / 报告 + 新手层)的位置就全清楚了。

👩‍💻

案例 ① · 小林,28 岁,互联网产品经理

炒股 8 个月 · 持有宁德时代 200 股 · 成本 ¥250 · 不会看研报、看不懂 K 线、最怕一只票天天看心率上来

🎬 场景

周一早 9:15,上班地铁里刷新闻看到「宁德时代盘前跌 7%,机构调研称四季度产能利用率不及预期」。她拿着手机心里发慌 — 是该立刻割肉,还是该补仓?雪球大 V 一半喊"跑",一半喊"上"。3 站地铁里能不能拿到一个让她不焦虑的答案?

🚶‍♀️ 小林的 5 分钟动线(5 步,把核心功能串一遍)

#	她点了什么 / 屏幕看到什么	她的心里活动 / 解决了什么	对应核心功能
1	智研首页「AI 智能搜索框」(提示语"输入股票代码 / 公司名 / 投资问题,AI 自动路由")— 直接打"宁德"或问题"宁德今天怎么了" → AI 听懂后 3 秒进对应分析模块	"打字就行,不用学股票代码 — 还能直接问问题"	AI 智能搜索
2	研报顶部信息卡旁点「✦ AI 大白话讲讲」:"别被『产能利用率不及预期』吓到 — 宁德本来一天能造 100 块电池,现在只造 65 块。不是机器坏了,是车厂没下那么多单。短期不是塌房,是订单变慢。" 旁边还有「这份研报靠谱吗?」按钮,告诉她"哪些是数据驱动的、哪些是模型推演、有什么不确定性"	"AI 一句话讲明白 + 会主动告诉我哪里不确定"	研报顶部 AI 解读 + 透明度
3	研报顶部 7 个 tab(AI 研报 / 流派论战 / 事件雷达 / 公司画像 / 财务估值 / 资金风险 / 市场宏观) — 切到「事件雷达」看「🚦 信号红绿灯」(警示 / 观察 / 正向三档自动归类)+ 「📅 催化剂日历」(已发生 + 未来事件);研报里散布 14 张「新手指南」(杜邦 / 现金流 / 股权质押 / 主力资金…);不懂字段点「✦ AI 解释」三秒翻译	"有红有绿不是塌房;字段看不懂随时点小标签当字典"	研报 7 tab + 新手指南
4	滑到「流派论战」tab 「六派独立推理」:6 位 AI 合伙人同台流式发言 + 「六派打分明细」;不过瘾 → 单开「决策直播间」大屏看 4 阶段:📊 数据装配 → 🧠 学派思辨 → 🗳 投票发布(「加权矩阵」可拖) → 📜 联席决议书	"6 个人吵架 30 秒结束,4:2 持有不加仓"	流派论战 + 决策直播间
5	不踏实 → 「红蓝队辩论」:蓝队"杀估值刚开始"对打红队"调研定价过头" → 系统出「裁判矩阵」,从立场清晰度 / 数据扎实度 / 逻辑严密度 / 置信度四维打分	"看反方打脸自己的想法,心里才有底"	红蓝队辩论

🎯 结果:小林 3 分钟看清局势,没有恐慌割肉,没有 FOMO 加仓,选择继续持有。她解决的是"焦虑",不是"赚钱" — 这才是散户最缺的东西。

👨‍💼

案例 ② · 王老师,35 岁,某私募基金研究员

5 年新能源研究 · 持证资深 · 自己有一套三因子打分表 · 缺的不是数据,是"自己看不见自己盲区"的对手盘

🎬 场景

周四晚 22:00,准备周五投委会汇报「新能源板块是否加仓」。她做了 3 天基本面分析,结论"宁德加仓到 25%"。但深夜静下来,她担心自己被锂电池的"成长滤镜"框住 — 需要 3 个完全不同立场的对手盘视角,否则明天投委会被合伙人问死。

🚶‍♂️ 王老师的 12 分钟动线(8 步,从宏观底盘到个股落地再到历史压测)

#	她点了什么 / 屏幕看到什么	她要的对手盘 / 解决了什么	对应核心功能
1	投委会前夜先打开「📊 宏观分析 · 7 框架同时解读」(总览 / 价格通胀 / 增长动能 / 货币与利率 / 房地产 / 外部环境 / 情绪与高频)— 每框架都有「分维证据与分歧点 / 宏观立场与主线逻辑 / 情景分布 / 配置建议与信号跟踪」	"先把宏观底盘看一遍 — 锂电池加仓决策不能脱离大势"	宏观分析 · 7 框架
2	进「🌐 宏观咨询」 — 5 位首席宏观合伙人(凯恩斯派 / 货币学派 / 奥地利学派 / 现代货币理论 / 新结构主义)+ 1 位主席,对当前宏观环境各自出独立判断,主席收口出综合决议	"5 派同台 + 主席收口 — 还原宏观研究真实流程,看到自己漏掉的视角"	宏观咨询 · 5 派合议
3	切到「🎛 宏观推演 · 情景沙盘」,自然语言打字:"美联储突然降息 50bp,国内 LPR 跟随 10bp,油价回到 80 美元" — 系统解析成 6 个宏观变量(CPI / M2 / 5Y / USDCNY / 布伦特 / 出口),出「行业热力图 + Top3 受益 / 受损 + 行业影响拆解」+ AI 推演叙事	"Python 算敏感度矩阵 × LLM 写推演叙事 — 不是闭门造车的情景假设"	宏观推演 · 情景沙盘
4	宏观底盘 OK,落到选股层 — 在「🔎 指标选股」顶部 10+ 预设场景(价值派 / 成长派 / 质量派 / 红利派 / 宏观对冲派 / 港股蓝筹 / 经典默认 / 低估值党 / 质量价值党…)一键应用 + 市场 / 上限 / 排序二次过滤;「单股验证」可反查为什么某支没被选中	"专业用户从一组候选池开始 — 节省手动初筛 2 小时"	指标选股
5	用「🥊 AI 选股 PK」把宁德 / 比亚迪 / 阳光电源三支并排,按估值 / 成长 / 资金 / 风险四维度对照表 + 同业排名分位	"不是看走势 PK,是四维度同口径对比 — 直接看出宁德估值最贵"	AI 选股 PK
6	锁定宁德进「个股分析」个股研报 — 7 tab(AI 研报 / 流派论战 / 事件雷达 / 公司画像 / 财务估值 / 资金风险 / 市场宏观)+ 16 张折叠新手指南 + 信号红绿灯;顶部「AI 大白话讲讲」「这份研报靠谱吗」两按钮主动给结论与置信度 — 数据驱动 vs 模型推演透明分层	"反幻觉的「自报家门」— 给评委看哪些是硬数据、哪些是 AI 推演"	个股分析 · 7 tab 研报
7	进「个股研究 · 5 位合伙人并行尽调」 — 在 16 位合伙人卡片里勾选价值派 + 成长派 + 宏观派 + 对冲派 + 量化派,点开始尽调 → 5 位合伙人 SSE 并行流式输出 5 份独立尽调,4 分钟出齐;每段带真实基本面 / 资金流 / 行业景气 / 宏观数据引用	"对冲派提到我没想到的:头部基金宁德持仓占比已 8%,边际买盘减弱"	5 派个股尽调
8	最后做历史压测 — 打开「时光机决策实验室」,把同一研究框架放到 2021 年 9 月(锂电池上次见顶前),系统给 AI 注入切到那一天的宏观数据 / 基本面 / 行业景气;AI 看不到 2021 年 9 月之后,在那时点出判断,系统快进真实涨跌做归因	"AI 当年也被『成长滤镜』骗到 — 我现在的框架就是同样陷阱"	时光机决策实验室

🎯 结果:王老师原本要建议"加仓 25%",看完对手盘后改成"维持 20% + 5% 对冲头寸"。智研对她不是"AI 投顾",是"低成本对手盘工厂"。

🔗 两条动线 → 三节产品介绍的串联关系

产品模块	小林(新手)用到了	王老师(专业)用到了
§ 16 位 AI 合伙人	默认 6 派直接上场,不需要她选	自选 5 派组合,故意避开自己的同温层
§ 4 决策剧场	流派论战(研报内嵌)· 决策直播间 · 红蓝队辩论	个股咨询报告 · 时光机决策实验室 · 情景沙盘
§ 个股研报(7 个 tab)	AI 大白话讲讲 · 这份研报靠谱吗 · 信号红绿灯 · 催化剂日历 · 新手指南	完整 7 tab(AI 研报 / 流派论战 / 事件雷达 / 公司画像 / 财务估值 / 资金风险 / 市场宏观)+ AI 选股 PK
§ 宏观入口	默认看研报的「市场宏观」tab,不主动进宏观区	宏观分析 7 框架 · 宏观咨询 5 派合议 · 情景沙盘推演(三连击开局)
§ 选股与个股	AI 智能搜索 · 研报 7 tab(护栏层) · 红蓝队辩论	指标选股 · AI 选股 PK · 个股分析 7 tab · 5 派个股尽调 · 时光机

完整产品矩阵

报告 + 咨询双层 · 新手友好层贯穿

决策剧场是吸睛点,日常使用主线是「报告 + 咨询」双层:个股 / 宏观各一份「研报式」结构化输出 + 一份「合议体」多 persona 咨询;底座之上铺一整层新手友好特性,让 0 基础也能看懂。

📊

个股 AI 研报

报告 · 研报式

输入一支代码,30-45 秒生成 7 个 tab 分组研报(AI 研报 / 流派论战 / 事件雷达 / 公司画像 / 财务估值 / 资金风险 / 市场宏观)。LLM 输出全部基于真实数据,客观与解读分离。

🚦 信号红绿灯 📅 催化剂日历 ✨ AI 大白话讲讲 🛡 这份研报靠谱吗 14 张新手指南 📑 归因复盘

亮点:整个行业唯一一个 hero 上有「这份研报靠谱吗」 chip 的 AI 产品 — 主动告诉用户哪些是数据驱动、哪些是模型推演。

🌐

宏观 7 框架解读

报告 · 研报式

7 个 tab 同时给宏观研判:总览 / 价格通胀 / 增长动能 / 货币与利率 / 房地产 / 外部环境 / 情绪与高频。每框架都有「分维证据与分歧点 / 立场与主线逻辑 / 情景分布 / 配置建议」。

🧠 宏观分析师研报 📊 情景分布 ⚡ 情绪与高频 🎯 配置建议 💬 内嵌 AI 问答

亮点:7 个宏观框架并行给研判 — 等于同时请 7 位首席经济学家,分歧点可见、立场可追溯。

💼

个股咨询

咨询 · 合议体

输入候选股票 → 5 位合伙人 + 1 位主席并行流式合议,4 分钟出齐 5 份独立尽调报告。还原投行真实流程:战略 / 业务 / 市场 / 运营 / 风险五维同口径,主席综合判断。

5 位合伙人 SSE 并发主席合议出结论真实数据引用归档可追溯投委会对手盘材料

亮点:业界 Agent 框架(LangGraph / CrewAI / AutoGen)普遍不流式或只支持单一流,智研自研 SSE 协议支持 5 路并发同时流式渲染。

🗺

宏观咨询

咨询 · 合议体

用户提一个宏观问题(政策 / 利率 / 出海 / 板块轮动…)→ 5 位宏观合伙人 + 1 位主席合议体给出研判:宏观策略 / 产业传导 / 资产配置 / 政策执行 / 宏观风险 — 多视角不偏一隅。

5 位宏观合伙人主席最终研判每日 02:30 预生成长期归档

亮点:凌晨 02:30 预跑 6 份咨询报告(5 合伙人 + 主席),用户白天打开秒回;未命中也只要 ~20s 流式补水。

🌱 新手友好层 · 8 道防线贯穿所有报告 / 咨询

✦ AI 大白话讲讲

研报 hero 一键用人话讲 结论 / 为什么 / 风险 三件事。

📖 新手指南折叠卡

14 张(杜邦 / 现金流 / 主力资金 / 股权质押…),不懂的随时展开。

🪞 投资人格测评

几道题找出"哪派 AI 在替你看股",AI 回答按偏好自动调深浅。

🚦 信号红绿灯

警示 / 观察 / 正向三档自动归类,小白一眼看红黄绿。

🎮 历史决策模拟器

免开真账户在历史时点模拟下单,看 AI 当时怎么判 vs 真实涨跌。

✦ ai-chip 字段解释

研报里每个不懂的字段旁有 「让 AI 解释」三秒翻译。

🪪 PERSONA 短名头像

16 位人格用短名 + 头像,把"风险合伙人"变"认识的人"。

📜 内嵌免责条

每篇报告 hero 下固定免责声明 + 不给买卖点。诚实 + 合规。

AI 技术先进性

从「调一个 LLM」到「编排一支 Agent Team」

2024 年的 AI 应用是「提示词工程 + 单 LLM」;2025 年起的赛点是Multi-Agent Orchestration。智研的核心 AI 工程价值,是把 16 个角色变成一支真正能分工 / 辩论 / 投票 / 仲裁的 Agent Team。

核心理念

🤖 不是 16 个聊天 bot,是一支有结构的 Agent Team

每个人格 = 独立 prompt + 独立工具偏好 + 独立角色;编排器决定什么场景叫谁上场 · 谁先发言 · 谁裁判 · 输出怎么聚合。这套编排模式 2024 年只在 AutoGen / CrewAI / OpenAI Swarm 等学术框架里出现,智研把它第一次落进金融决策场景并真实上线。

🧩 Agent Team 编排架构

智研的编排器同时支持 4 种多 Agent 协作模式 — 串行 / 并行 / 对抗 / 投票仲裁,根据场景动态选择。

🤖

编排器 Core

场景 → 角色挑选 → 编排模式 → 流式聚合输出

SERIAL · 接力

串行模式

联席尽调:5 咨询接力
战略 → 业务 → 市场 → 运营 → 风险

PARALLEL · 并发

并行模式

决策直播间:6 派同时跑
SSE 多路流式

DEBATE · 对抗

对抗模式

红蓝队辩论:多 vs 空
N 轮三段式 + 裁判

ARBITRATION · 仲裁

仲裁模式

投票 / 决议
立场 + 置信度 + 主席综合

🧠 16 人格池独立 prompt + 独立工具偏好

价值成长质量红利趋势宏观对冲战略业务市场运营风险宏观策略产业传导资产配置政策执行宏观风险

6 学派 · 5 咨询合伙人 · 5 宏观合伙人

⚡ LLMClient · N key 轮询 · 流式 SSE · 401/429/5xx 自动换 key

🎭 4 种多 Agent 协作模式

01 SERIAL · 接力

串行协作 · 联席尽调

5 位咨询合伙人按战略→业务→市场→运营→风险顺序接力,后者基于前者的输出深化。最终主席综合写决议书。

难点: 串行加共享上下文 — 后位人格看得到前位的输出但 prompt 要避免被带歪。我们用结构化交接卡(每位输出固定 schema)。
类比: CrewAI 的顺序流程

02 PARALLEL · 并发

并行协作 · 决策直播间

6 学派同时跑,SSE 多路流式,前端按人格 id 分发增量到对应卡片,边吐边渲染 markdown。

难点: 6 个 LLM 调用并发 + 单一 SSE 流的协议设计 — 我们用 {type, 人格, text} 三元组路由。前端 Compose / 浏览器都用同一 reducer。
类比: OpenAI Swarm 的 parallel 交接

03 对抗模式

对抗协作 · 红蓝队辩论

2 位人格多空对垒,N 轮强制【论点】【证据】【反驳】三段式。后轮可看到前轮全部内容,被要求直接驳斥对方上一论点。

难点: 防止"和稀泥"(LLM 倾向温和)。我们在 system prompt 里植入角色压力词("你是对方最严格的挑战者")+ 强制 marker 切段。
类比: AutoGen 的对抗辩论范式

04 仲裁模式

仲裁协作 · 裁判矩阵

独立裁判人格看完所有论点,强制输出 JSON 爆点矩阵:每个论点成立/驳倒/悬而未决三态 + 置信度 + 下一步要找的证据。

难点: JSON 解析失败的容错。我们做了三层兜底:(1) JSON 解析 → (2) 正则提取 → (3) 失败时显示 _parse_error + 原文。
类比: LLM 即裁判 / 约束 AI 的评判器范式

📡 SSE 多 Agent 流式协议(自研)

业界 Agent 框架(LangGraph / CrewAI / AutoGen)普遍不流式或只支持单一流。智研自研了一套 SSE 协议,支持 6 个 Agent 在单一 SSE 连接上并发输出,前端按人格 id 路由。

SSE 单连接 · 多 Agent 并发客户端 1 个 EventSource · 服务端 6 个 LLM 并发 · 前端按 persona id 路由到对应卡片

📊 阶段 1 · 数据装配

6 维核心快照

🧠 阶段 2 · 学派思辨

6 派 SSE 并发 delta

🗳 阶段 3 · 投票发布

立场 + 置信度 + 加权矩阵

📜 阶段 4 · 联席决议书

秘书 LLM 流式综合

meta会话起手 · 推 6 个 persona 元信息(头像 / 名称 / 主题色)给前端初始化卡片

phase阶段切换 · 携带 name:"thinking" 让前端切换页面 + 进度条到对应阶段阶段 1 → 2 → 3 → 4

delta流式 markdown 增量 · 带 persona:"value" 路由,前端按 id 找对应卡片追加文字 · 同时 6 派并发吐字高频事件

persona_done单派输出完结 · 带 立场:"bull/bear/neutral" + 置信度,触发卡片"立场胶囊"高亮

votes阶段 3 · 6 派投票分布快照 · 加权矩阵从这里开始可拖滑块实时算综合分

resolution_delta阶段 4 · 秘书 LLM 综合 6 派输出,流式 markdown 增量写决议书

[DONE]会话结束 · 触发归档写盘(joint.db) + 分享卡片生成

⚡

工程难度:这套协议要在 6 个并发 LLM 调用 + 单 SSE 连接 + 前端聚合器 (Compose / 浏览器双端)三处都正确处理乱序、丢包、人格 id 路由、流式 markdown 增量渲染。市面上的 Agent 框架(CrewAI/AutoGen)都没解决这件事 — 因为他们的目标用户是开发者,不是终端用户,不需要"看着 6 个 AI 同框思考"的体验。

🔬 时光机:反事实回测 + AI 归因(独家)

核心 AI 技术:防数据泄漏的反事实评估 + LLM 归因复盘。这是当前 LLM 应用学术界的开放问题(2024-2025 顶会反复讨论"LLM 怎么做可解释金融回测"),我们用工程手段解了:

问题 1

数据泄漏

LLM 训练数据见过未来,怎么让它"忘记"?

解法:注入截止数据 + system prompt 双层约束;承认 LLM 模糊记忆但用逻辑可见替代"完全 blind"作为可信度标准

问题 2

反事实评估

怎么用真实历史涨跌去打分 LLM 的判断?

解法:取决策日后 5/30/90 日真实交易数据 → 与 LLM 立场匹配 → 算命中率;不只看结果对错,看归因逻辑是否成立

问题 3

AI 归因

谁判对了为什么?谁踩坑在哪个变量?

解法:归因 LLM 综合判断 + 真实结果 + 客观涨跌,流式输出 markdown,逐派 dissect。这是同业唯一的能力

⚖ 和业界 Agent 框架对比

AutoGen

Microsoft · 框架

多 Agent 对话框架,主打开发者用

学术友好,但缺垂直场景 + 缺端到端用户产品

CrewAI

开源 · 框架

声明式 agent 编排,有角色概念

本质是后端,不流式,没有面向终端用户的体验层

OpenAI Swarm

OpenAI · 实验性

轻量 agent 协作 + 交接

尚为实验框架,不带状态持久化,无金融数据接入

智研编排器

自研 · 上线产品

4 种协作模式(串行/并行/对抗/仲裁)同台

多 Agent SSE 流式前端边吐边渲染

金融垂直 + 16 人格具体场景闭环

🎯

关键差异:AutoGen/CrewAI/Swarm 是给开发者用的框架,目标是"让程序员构建 Agent 系统";智研的编排器是给散户用的产品,目标是"让用户看一场 16 个 AI 的辩论"。从「Agent 框架」到「Agent 体验产品」这一步,业界没有现成模板,智研做了第一个落地。

🧪 LLM 幻觉治理 · 8 层防线

金融场景下幻觉的代价是用户真金白银的亏损。智研建立了一套由数据约束到产品层兜底的 8 层防御,层层把住 LLM 的自由发挥边界。

L1 · 数据约束

真实数据强制注入

所有数字(PE / ROE / YoY / 涨跌幅)由 Python 从 Lixinger / 港股 vendor 拉取后注入 prompt。LLM 不能"编"数字,只能解读已知数字。

L2 · 客观/解读分离

客观与解读分离

报告里客观数据卡(Python 算)与AI 解读(LLM 写)视觉分离。用户一眼能区分"这是事实"和"这是观点"。

L3 · 结构化输出

JSON Schema 强制 + 兜底

裁判矩阵 / 投票 / 验收输出 JSON schema 强制;解析失败时三层兜底:JSON.parse → 正则提取 → _parse_error 显原文。

L4 · 信号灯固化

客观信号灯固化结论

估值 / 资金 / 趋势 / 质量等 4 维度Python 算分位数给灯,LLM 只能在"红黄绿"三态内 dissect,不能颠倒结论。

L5 · 多人格交叉

6 派交叉验证

6 学派各自立场 + 算法立场 双线投票。若 LLM 立场与算法立场严重背离,UI 显示背离警示提醒用户警惕。

L6 · 对抗校验

红蓝队对抗校验

多空两位人格强制对抗,N 轮三段式。一边倒结论会被对方拷问,裁判矩阵把每个论点标成立/驳倒/悬而未决。

L7 · 反事实回测

时光机反事实验证

把判断放回历史时点 + 真实涨跌,对每派算命中率。准确率公开,LLM 的"自信"会被真实数据打脸。

L8 · 产品层兜底

免责 + 不给买卖点

报告 hero 下固定免责;智研不给"买入/卖出"具体行动建议,只产研究观点 + 决议书。决策由用户做,产品端守住合规红线。

🛡

核心理念:幻觉不是用"更强模型"消除的,而是用工程边界 + 多层验证 + 产品自律压缩到可接受范围。我们承认 LLM 会犯错,但通过 8 层防线让"犯错的代价"对用户透明、可对照、可质疑。

⚖ Python × AI 工程哲学 · 什么交给 LLM,什么不给

AI 应用最大的工程陷阱是"把所有事都丢给 LLM"。智研的核心工程哲学是:Python 做"事实层"(确定性、可验证),LLM 做"叙事层"(开放性、创造性)。这条分界线决定了产品的速度、成本、可信度。

🐍 Python 做(确定性 · 可验证 · 快)

数据装配:Lixinger / 港股 vendor / 新浪 / 东方财富接入
指标计算:PE / PB / ROE / YoY / 分位数 / DCF 现金流折现
历史涨跌:取真实交易数据,5/30/90 日命中率计算
信号灯打分:估值 / 资金 / 趋势 / 质量四维度,分位数→红黄绿
沙盘综合分:6 变量敏感度矩阵 → 综合分 + 行业冲击
JSON 解析 + 兜底:三层兜底容错
缓存 / 持久化:7 WAL store + 凌晨预跑
并发 / 限流:Lixinger 8 req/s + ThreadPool 8 路 + 多 key 轮询

🤖 LLM 做(开放性 · 创造性 · 难量化)

报告解读:数据卡背后的要点 "为什么 PE 在 32% 分位说明便宜"
多人格立场:6 学派各自的判断 + 理由
归因复盘:时光机里"谁判对了为什么,踩坑在哪个变量"
红蓝辩论:论点 / 证据 / 反驳的展开
裁判矩阵:每个论点的成立 / 驳倒 / 悬而未决判定
沙盘叙事:6 变量推演结果的 200 字解读
章节问答:用户对子章的追问
新闻翻译:行业事件 → 持仓影响的语义改写

⚖

分界线判断标准:能用公式 / 查表 / 算法解决的,绝不给 LLM(贵、慢、易错);需要语义理解 / 立场判断 / 开放叙事的,LLM 是最优解。判断错了会出现两种典型问题:把 LLM 当计算器 = 数字错;把 Python 当叙事器 = 干巴巴没人看。

🧪 AI 模型选型 · 开发 vs 生产分账

"用什么模型"是 AI 应用最早要回答的问题。结论:开发(写代码 + 复杂推理验证)用顶配 · 生产(用户实时推理)用性价比 mini — 不混用。

开发期 · 写代码

🧠 Claude Opus 4.7

Anthropic · 200K 上下文 · 工具调用稳

大型多文件项目能记住跨文件结构
Plan / Skill 切片能力强,适合全链路
命令行 / 工具调用稳定 · 智研 100% 代码由它写
承认不确定,出错时主动说"我猜的"

定位:主程 + 主架构师 · 4 个周末写完全栈 + Android

评估期 · 备选

🚀 GPT-5.5

OpenAI · 旗舰多模态 · 推理深

纯推理 / 数学题偶尔超 Opus,深度链路稍稳
🎨 画图能力极强 — 智研 16 位 AI 合伙人头像、首页 hero 插画、各种人物素材全部由 GPT-5.5 生成
多模态(图像 / 表格)处理强 · 写代码场景用不到
大型多文件项目"记忆性"反而不如 Opus

结论:代码场景边际收益不够,但「画图素材生成」就是它专属任务 · 双模型互补

生产期 · 16 persona 跑实时

⚡ GPT-5.4 mini

OpenAI · 中端 · 流式快 · 高性价比

金融解读 / 多 persona 立场表达质量够用
SSE 流式延迟极低 · 决策直播间 6 派同台不卡
JSON 结构化输出稳 · 裁判矩阵 / 投票一次过
单价显著低于旗舰 · 散户免费层才能跑得起

定位:生产 LLM · 16 个 persona 同时跑流式都是它扛着

💰

为什么不一律用顶配?一次"决策直播间"触发 7 次 LLM 调用(6 persona + 1 主席),如果都走旗舰,免费层 3 票/天不可持续;切到 mini 后单次成本压到很低,规模化才有可能。开发用 Opus 是因为它把"4 周末做出大型上线产品"这件事变成可能 — 是开发者的杠杆;mini 是产品的运营成本基线。分账思路:省钱的地方往死里省,值钱的地方一分别省。

技术内里

不是 demo,是上线 30 天的产品

AI 应用 90% 卡在数据接入、冷启动慢、429 风暴 — 我们把这些都拆掉了。

🎯 一支股票从冷启动到看到决议

首屏出框 (stage1)
优化前 10-12s

全量补水 (stage2)
后台异步,无感升级

30s

决策直播间
4 阶段全程

22s

宏观快照
优化前 90s

6-12s

银行/保险
优化前 82s

🛠 vibecoding 过程中的困难与挑战

100% 让 AI 写代码、产品经理只做产品决策 / prompt / 验收,听起来很美;真做下来踩了一堆非技术坑。诚实复盘 9 个真实痛点 + 解法 — 也是任何想搞 vibecoding 的人都会撞上的。

挑战 ①

🧠 LLM 上下文易爆

单个对话写到 7-8 万 token 时,Claude 经常忘记最初 spec(比如忘了"研报 7 tab 不是 16 子章")。

解:用 CLAUDE.md + 短指令持续注入约束;复杂任务先用 Plan / Skill切片。

挑战 ②

🏗 跨端栈切换成本高

Python (FastAPI / Jinja) → Kotlin Compose → JS 浏览器 — 同一份功能要写 3 遍。LLM 切栈时框架习惯会带歪。

解:每端 convention 速记;切栈前让 AI 复述本端 idiom;多端共享逻辑做单一真相源。

挑战 ③

🪲 不写代码 = 不会调 bug

vibecoding 最大的反直觉:出 bug 时自己根本看不懂栈,靠 AI 自己修往往陷入"猜→改→又坏"。

解:逼 AI 先写测试 + 日志;复杂 bug 用 Plan 模式让它列假设 + 验证步骤而不是直接动手。

挑战 ④

🌪 vendor API 反复变形

理杏仁 / 港股 vendor 半路改字段 / 限流 / 同时 500;Claude 不知道新版,按旧记忆写 → 上线就崩。

解:每个 vendor 调用包raw_post + 兜底层;TypeError SKIP 落盘 5 min TTL;抓样本 paste 给 AI。

挑战 ⑤

🪞 AI 编的"看起来对"

LLM 经常造一个不存在的字段名 / 路由 / chip 出来,跑通后才发现页面上根本没有这功能。

解:所有产品文案必须从真实 DOM grep 验证;Tour selector 跑 querySelector 兜底缺则跳过。

挑战 ⑥

🔁 改一处坏三处

重构编排器 → 直播间挂了,改持仓 store → 沙盘热力图烂了。LLM 不知道远处影响。

解:凌晨预跑 298 支当回归测试;关键模块写 contract test钉死接口。

挑战 ⑦

📦 大型项目像玩拼图

17 routes 模块 + 7 SQLite + 16 persona prompt,改一个 import 都要拐 5 层。新会话进来上不了手。

解:记录 memory 文件;新会话开头让 AI 自己读;每模块顶部写简短 docstring当导航。

挑战 ⑧

⏱ 产品验收 vs AI 想象差距

AI 写完说"完成了",实测发现按钮没接、跳转错、移动端排版破。

解:PM 先写验收清单,AI 写完拿清单 manual 走一遍;不通过的 bug 拿截图 / 复现路径回投。

挑战 ⑨

💸 多模型协作 + 成本

写代码用 Opus 4.7(贵但准)、生产 LLM 用 mini(便宜但偶尔糊);切换不当容易错位。

解:开发 / 生产分开模型;每月对账 token 用量,贵的环节单点验证后再上量。

🎯

vibecoding 真正的难点不是"AI 会不会写代码",而是"产品经理能不能给出足够清晰的 spec + 验收"。代码 AI 写得很快,但验收路径没有人替你想。这 9 个挑战的本质就是:把传统软件团队的"代码 review + QA + DevOps + 文档"这些角色,压缩成 PM 一个人 + AI 的工作流。

未来 · 商业化

从「散户口袋投委会」到「AI 投研基础设施」

智研当前是 C 端免费产品,底层的 16 人格编排器 + 多市场数据底座 + 决议持久化 是一套可复用的「AI 投研中间件」。下一阶段路线:把 C 端做厚 → 跑通真实闭环 → 开放基础设施输出。

📅 三阶段路线图

不写死季度日期 — 每个阶段「完成判据」清晰、迭代节奏由数据闭环驱动。

1 PHASE 1 · 把 C 端做厚

用户深度 + 多市场

让单用户用得更深、覆盖资产更广。完成判据:日活留存 + 单用户场景使用次数翻倍。

组合管理·16 派对整个持仓做归因 + 调仓建议
多市场扩展·美股 / ETF / 加密资产接入
沙盘 NL 升级·任意复杂宏观叙事自动解析
iOS 客户端·补齐三端

2 PHASE 2 · 跑通真实闭环

从「看 AI 怎么判」到「看 AI 准不准」

用实盘和复盘把"AI 投委会"变成可被市场验证的决策系统。完成判据:6 派决议公开胜率持续可读。

实盘验证·6 派决议接模拟仓,周度公开胜率
个性化合伙人·用户偏好 → 私人 persona
结构化社区·决议书可点赞 / Fork,雪球的结构化版本
归因复盘自动化·胜率回灌到下一轮 prompt

3 PHASE 3 · 开放基础设施

把能力开放给生态

"AI 投委会"从单产品变成中间件,反哺生态。完成判据:首批 B 端客户接入跑通。

API / 白标·16 人格 + 4 剧场封装给教育 / 科普 / 财媒
持牌合作·券商 / 银行投顾「AI 副驾」集成,不直接持牌
非核心模块开源·SSE 协议 / persona 框架 / 编排器接口
金融垂直模型·基于自有决议语料 fine-tune 小模型

💰 商业化三层模型

① 规模化C 端订阅 / SaaS

面向个人投资者

免费层·3 票 / 天,体验全部核心功能
专业版·不限次 + 16 人格全开 + 高级历史归档
家庭 / 小团队版·多账号 + 决议库共享

关键:转化率而非首年 ARPU · 决策日记是最强复购钩子

② 高客单B 端 API / 白标

面向金融科普 / 教育 / 券商

API 按调用·教育 / 财媒平台接 SSE 流式
券商「AI 副驾」·按席位年费,投顾日常辅助
私行报告·银行客户报告自动化生成

关键:不持牌 · 只做底层能力供应商,合规风险低

③ 长期护城河数据资产

沉淀独家训练语料

百万级决议·每份带 6 派立场 + 真实涨跌 + 复盘标注
反哺 fine-tune·中文金融多 persona 小模型
数据本身可流转·定价权随积累指数增长

关键:这是赛道里别人 1 年也追不上的护城河

🎯 为什么是现在 · 时间窗口

2024-2025 是 Multi-Agent + 流式 + 反事实回测 三件事从学术到产品的窗口期 — 学术 paper 满天飞,但没有产品级落地。智研抢的就是这 12-18 个月的结构性时间差:大厂(豆包 / 同花顺 / 雪球)受赛道定位拖累不会做、传统投研公司没有 AI 工程力,只有小团队 + AI 编码红利能填这个空白。

⚠ 风险与边界

合规边界·不持牌、不给买卖点、信息辅助决策
数据成本·vendor 年费 + LLM token,靠订阅与 B 端摊销
幻觉责任·决议归档 + 时光机回测 → 让错误可审计

智研 · 你的口袋 AI 投委会

散户的决策困境,不是缺信息,是缺立场

⚠ 用户每天面对的真实痛点

✅ 我们的答卷

市场上没有第二个智研

📍 二维定位图

🥊 头对头对照

🔍 各家做对了什么 / 漏了什么

豆包 / 千问

同花顺 / Wind

雪球

智研

两个典型用户的一天 · 把产品串成故事

🔗 两条动线 → 三节产品介绍 的串联关系

16 位 AI 合伙人,每人独立人格

🎓 6 位投资学派 · 看个股

💼 5 位咨询合伙人 · 做尽调

🌐 5 位宏观合伙人 · 看大势

🎓 投资学派

💼 咨询合伙人

🌐 宏观合伙人

4 种决策剧场,把研究变成可看的故事

01🎬决策直播间

02⚔红蓝队辩论

03⏪时光机

04🎛情景沙盘

报告 + 咨询 双层 · 新手友好层贯穿