突破OpenAI限制:Thread并发的实现
本文基于工程实现梳理 Thread 级别的并发 Run 能力与消息顺序保障方案,聚焦锁设计、消息原子性、工具输出串行化及并发优化策略。
并发 Run 的核心挑战
- OpenAI 原生限制
- 原生 Assistants API 约束:同一
thread同时仅允许 1 个 active run。 - 业务诉求:群聊场景下,在同一个thread中,不同用户的连续提问需要“并发触发、独立返回”。
- 原生 Assistants API 约束:同一
- 目标
- 允许同一
thread在服务端并发执行多个 Run(不受原生限制),同时保证线程内消息时序的可预期与一致性。 - 在允许并发的情况下,保持消息列表user-assistant的交错顺序。
- 允许同一