小同商学院

首页 > 资讯动态 > 行业政策 > 陈天桥 MiroMind 团队蝉联 FutureX 全球冠军 开源预测模型改写 AI 决策格局
陈天桥 MiroMind 团队蝉联 FutureX 全球冠军 开源预测模型改写 AI 决策格局
2025-10-27

2025 年 9 月 21 日,陈天桥旗下 AI 公司 MiroMind 团队在全球首个动态实时 LLM 智能体预测基准 FutureX 中,实现连续两周蝉联冠军。这一突破性成就不仅标志着中国 AI 团队在预测决策领域实现对国际顶尖对手的超越,更通过完全开源的技术框架,为全球 AI 研究注入新的协作模式。



FutureX:衡量 AI 智能的 "试金石"

由字节跳动 SEED 团队联合斯坦福大学、复旦大学、普林斯顿大学等顶尖机构共同打造的 FutureX 基准,自 2025 年推出以来便被业界视为 "AI 智能的最佳测量仪"。其独特的评估机制体现在三个维度:
  • 动态实时性:从全球 200 多个高质量信息源抓取未来一周内将产生明确结果的真实问题,涵盖金融市场、体育赛事、政治动态等复杂场景。

  • 不确定性推理:要求 AI 模型具备类人分析师的逻辑推演能力,而非依赖静态数据的简单匹配。

  • 跨领域验证:测试范围从 ATP 网球排名到加密货币价格波动,全面考察模型在规则密集型与混沌系统中的决策能力。

"预测未来的能力是衡量智能的最佳标准",马斯克对该基准的评价更凸显了其在 AGI(通用人工智能)发展历程中的里程碑意义。


技术破壁:记忆驱动模型的颠覆性创新

MiroMind 团队的夺冠并非偶然,其核心突破在于摒弃了主流生成式模型的文本输出导向,独创记忆驱动型预测框架。该技术路径展现出三大优势:
在模型表现上,搭载 GPT-5 的 MiroFlow 框架连续两周稳居榜首,自研模型 MiroThinker 亦保持前五席位,力压微软、DeepMind 等机构的闭源模型。技术验证方面,MiroFlow 在 GAIA-Validation 测试中取得 82.4% 的高分,并在 HLE、BrowseComp 等多个权威评测中全面领先国际对手。

团队核心负责人戴霁峰(前微软资深研究员)介绍:"我们的模型像人类决策者一样具备长期记忆与动态更新能力,在处理未完成赛事、市场突发消息等不确定场景时,能生成多情景概率分析并持续优化"。这种机制使模型在处理 ATP 排名积分规则变动、加密货币市场情绪波动等复杂问题时表现尤为突出。


双案例实证:从网球场到金融市场的精准预测

ATP 男子单打排名预测

面对网球排名系统中积分计算、时间窗口、赛事动态更新等技术难点,MiroMind 团队采取四步解决方案:
  1. 以 9 月 1 日 TOP 10 排名数据建立基准线

  2. 深度解析 2025 年积分 "掉落" 规则与往年差异

  3. 对未结束赛事生成 6 种可能情景的概率分布

  4. 引入博彩市场赔率数据进行交叉验证

最终预测误差控制在极小范围,精准命中 9 月 9 日排名第 4-6 位选手变动结果。


Solana 价格突破点预测

针对加密货币高波动性挑战,模型实施六步策略框架:
  • 聚合多平台实时数据构建市场基准

  • 计算年化波动率与日内振幅量化风险

  • 扫描美联储政策、生态更新等外部催化剂

  • 通过永续合约资金费率捕捉市场情绪

  • 筛选多行情路径下的稳健性价格档位

  • 融合统计模型与第三方机构预期形成最终判断

该方案成功锁定 9 月 11 日 Solana 关键价格突破点,展现出强大的复杂系统建模能力。


开源生态:打造 AI 创新的 "公共基础设施"

MiroMind 团队在技术突破的同时,更以开源共享重塑行业协作模式。其完全开放的 MiroFlow 框架包含可复现的模型架构、训练数据与优化流程,开发者可直接在多智能体协作、长期记忆嵌入等前沿领域展开探索。
团队承诺每月发布技术更新,陈天桥在公开声明中强调:"MiroMind 的目标是打造全球最好的预测大模型,让 AI 记住过去,洞察未来。我们邀请全球研究者共同参与,推动 AI 决策能力的普惠化"。这种开放战略已初见成效,MiroMind Open Deep Research(Miro ODR)项目已超越 OpenAI 等机构的同类研究,成为开源预测模型的新标杆。