Multi-Agent AI Through ODTOE: Why 3-6-9 Roles Outperform Flat Crews

Мультиагентный ИИ через ODTOE: почему 3-6-9 роли обыгрывают плоские команды

Anton Pankratov
AImulti-agentTesla3-6-9applied

Thesis. Tesla's "3, 6, 9" was famously cryptic; ODTOE makes it concrete in the context of multi-agent AI. A flat crew of N identical agents has a flat coherence ceiling because the joint E saturates fast. A structured 3-6-9 hierarchy — 3 strategic agents, 6 tactical agents, 9 operational agents, with closure protocols between layers — has structurally higher joint B because each layer has a different role-coherence profile. Recent benchmarks (2025–2026) confirm this prediction.

Tesla, briefly, without mysticism

The "3, 6, 9" pattern Tesla obsessed over is, in ODTOE's reading, a closure-rich hierarchy. Three is the minimum number of distinct levels needed to form a stable strange-loop closure (high-level, mid-level, low-level, with feedback from low to high). Six is the natural pairing of those three with their feedback partners. Nine is three sub-levels per level, the next closure-rich tier.

The 3-6-9 / Tesla paper develops the structural account. The numerical claim is not that 3, 6, 9 are magic numbers — they are minimum-closure numbers for a hierarchy that maintains its π-topology.

Multi-agent AI before ODTOE

Most current multi-agent frameworks (the popular crewAI, AutoGen, BabyAGI families) default to flat structures: a small pool of agents differentiated by prompts, communicating in a planner-loop. ODTOE diagnoses this as low-d (low observer dimensionality) and low-Λ (low data-quality of inter-agent channel). The joint B saturates fast, and adding more agents stops helping past ~5–7.

The multi-agent coherence paper makes this quantitative: flat crews of identical agents have a closed-form upper bound on joint B that depends on the protocol's Λ and σ, not on the agent count beyond a small threshold.

The 3-6-9 structure

Apply the ODTOE diagnosis:

  • Layer 1 (3 agents): strategic. High weight on E (internal coherence) and F (fidelity to ground truth). Low weight on Λ — they should not be drowning in data. Their role is direction and closure.
  • Layer 2 (6 agents): tactical. Balanced weights. Each tactical agent is paired with one strategic agent. The pairing is the explicit π-closure: tactical agents periodically re-check their plan against the strategic agent's mandate.
  • Layer 3 (9 agents): operational. High weight on Λ (data-richness) and (1−σ) (clean execution). Three operational agents per tactical agent. Each operational triplet has a sub-π-closure: they cross-check execution among themselves before reporting up.

The structure is fractal: 3 × 2 = 6, 6 × 1.5 = 9, with closure relations at every level. The total agent count (3 + 6 + 9 = 18) is a small number — comparable to a flat crew — but the joint B is structurally higher because the protocol (the way information flows up and closure flows down) is high-Λ and low-σ.

Three benchmarks that already show this

The AI 3-6-9 → AGI paper compiles the empirical record:

  1. On long-horizon software tasks (SWE-Bench-Verified, 2025), a 3-6-9 framework scored 14 percentage points above the best flat-crew baseline at equal compute budget.
  2. On open-ended research benchmarks (GAIA, 2025–2026), the same structural advantage held, with the gap widening on tasks requiring genuine cross-level coherence.
  3. On adversarial robustness (prompt injection benchmarks), the 3-6-9 closure protocols caught injected hallucinations at the tactical layer in ~85% of cases, vs. ~35% for flat crews. This is exactly what the ODTOE prediction said: the closure layer catches F-collapse before it propagates.

What still gets debated

The optimal weights on E vs. F vs. Λ vs. σ within each layer are still being tuned. The right "personality" for strategic vs. tactical vs. operational agents is still empirical work. Some researchers argue for 4-7-10 or 5-7-11 schemes; the collective observer paper argues these are equivalently π-closed at slightly different cost curves.

The structural claim — that you need an explicit closure topology, not just a flat pool — is now the consensus.

What this means for practitioners

If you are building a multi-agent product in 2026:

  1. Pick a closure-rich topology, not a flat crew. 3-6-9 is a good default; smaller projects can use 2-4-6 with similar closure relations.
  2. Spend most of your engineering on the protocol, not the agents. The protocol is the multiplier; the agents are the multiplicands.
  3. Measure joint B, not per-agent benchmarks. Per-agent benchmarks tell you about F and Λ at the unit level. Joint B tells you whether the system works, which is what you ship.
  4. Build in mandatory closure cycles. Strategic ↔ tactical ↔ operational closure on a regular schedule. This is the π-loop. Without it, your system is an inverted pyramid (see the earlier post on inverted pyramids).

Cite this post

Pankratov, A. (2026). Multi-Agent AI Through ODTOE: Why 3-6-9 Roles Outperform Flat Crews. ODTOE Blog. https://odtoe.org/blog/multi-agent-ai-369-roles-outperform-flat-crews

Читать по-русски · Read in Russian

Тезис. «3, 6, 9» Тесла знаменито криптичны; ODTOE делает их конкретными в контексте мультиагентного ИИ. Плоская команда из N одинаковых агентов имеет плоский потолок когерентности, потому что совместное E быстро насыщается. Структурированная иерархия 3-6-9 — 3 стратегических агента, 6 тактических, 9 операционных, с протоколами замыкания между слоями — имеет структурно более высокое совместное B, потому что у каждого слоя свой ролевой профиль когерентности. Бенчмарки 2025–2026 это предсказание подтверждают.

Тесла, коротко, без мистицизма

Паттерн «3, 6, 9», на котором сосредотачивался Тесла, в прочтении ODTOE — иерархия, богатая замыканиями. Три — минимальное число различимых уровней для устойчивого замыкания странной петли (высокий-средний-низкий уровни с обратной связью снизу вверх). Шесть — естественное парное соединение этих трёх с их партнёрами по обратной связи. Девять — три подуровня на уровень, следующий слой, богатый замыканиями.

Статья 3-6-9 / Тесла развивает структурный отчёт. Числовое утверждение не в том, что 3, 6, 9 — магические числа, а в том, что это минимально-замкнутые числа для иерархии, сохраняющей π-топологию.

Мультиагентный ИИ до ODTOE

Большинство текущих фреймворков (популярные crewAI, AutoGen, BabyAGI и семейство) по умолчанию используют плоские структуры: малый пул агентов, различимых по промптам, общающихся в петле планировщика. ODTOE диагностирует это как низкое d (низкая мерность наблюдателя) и низкое Λ (низкое качество данных межагентного канала). Совместное B быстро насыщается, и добавление агентов перестаёт помогать после ~5–7.

Статья Мультиагентная когерентность делает это количественным: плоские команды одинаковых агентов имеют закрытую формулу верхней границы совместного B, зависящую от Λ и σ протокола, а не от числа агентов сверх малого порога.

Структура 3-6-9

Применяем диагноз ODTOE:

  • Слой 1 (3 агента): стратегический. Высокий вес на E (внутренняя когерентность) и F (точность относительно эталона). Низкий вес на Λ — им не нужно тонуть в данных. Их роль — направление и замыкание.
  • Слой 2 (6 агентов): тактический. Сбалансированные веса. Каждый тактический агент спарен с одним стратегическим. Спаривание — явное π-замыкание: тактические периодически перепроверяют свой план относительно мандата стратегического.
  • Слой 3 (9 агентов): операционный. Высокий вес на Λ (богатство данных) и (1−σ) (чистое исполнение). Три операционных агента на тактического. У каждой операционной тройки своё подзамыкание: они кросс-проверяют исполнение между собой до отчёта вверх.

Структура фрактальна: 3 × 2 = 6, 6 × 1.5 = 9, с отношениями замыкания на каждом уровне. Общее число агентов (3 + 6 + 9 = 18) — небольшое, сравнимо с плоской командой, — но совместное B структурно выше, потому что протокол (как информация течёт вверх и замыкание — вниз) высокий по Λ и низкий по σ.

Три бенчмарка, уже показывающих это

Статья ИИ 3-6-9 → AGI собирает эмпирическую запись:

  1. На задачах с длинным горизонтом по софту (SWE-Bench-Verified, 2025) фреймворк 3-6-9 набрал на 14 п.п. больше лучшей плоской базы при равном вычислительном бюджете.
  2. На бенчмарках открытых исследований (GAIA, 2025–2026) то же структурное преимущество держалось, разрыв расширялся на задачах, требующих подлинной кросс-уровневой когерентности.
  3. На устойчивости к атакам (бенчмарки prompt injection) протоколы замыкания 3-6-9 ловили внедрённые галлюцинации на тактическом слое в ~85% случаев против ~35% у плоских команд. Это в точности то, что предсказывала ODTOE: слой замыкания ловит крах F до распространения.

Что ещё обсуждается

Оптимальные веса E vs. F vs. Λ vs. σ внутри каждого слоя ещё подбираются. Правильная «личность» для стратегических vs. тактических vs. операционных агентов — эмпирическая работа. Некоторые исследователи аргументируют схемы 4-7-10 или 5-7-11; статья Коллективный наблюдатель утверждает, что они эквивалентно π-замкнуты при слегка иных кривых стоимости.

Структурное утверждение — что нужна явная топология замыкания, а не плоский пул — стало консенсусом.

Что это значит для практиков

Если в 2026 строите мультиагентный продукт:

  1. Берите топологию, богатую замыканиями, а не плоскую команду. 3-6-9 — хороший дефолт; меньшие проекты могут использовать 2-4-6 с теми же отношениями замыкания.
  2. Тратьте основную инженерию на протокол, а не на агентов. Протокол — множитель; агенты — множимые.
  3. Меряйте совместное B, а не покомпонентные бенчмарки. Покомпонентные говорят об F и Λ на уровне юнита. Совместное B говорит, работает ли система — а её вы и продаёте.
  4. Встраивайте обязательные циклы замыкания. Стратегический ↔ тактический ↔ операционный замыкания на регулярном расписании. Это π-петля. Без неё ваша система — перевёрнутая пирамида (см. предыдущий пост о перевёрнутых пирамидах).

Цитирование

Панкратов А. (2026). Мультиагентный ИИ через ODTOE: почему 3-6-9 роли обыгрывают плоские команды. ODTOE Blog. https://odtoe.org/blog/multi-agent-ai-369-roles-outperform-flat-crews

Cite this post

If you reference this post, please cite as:

Pankratov, A. (2026). Multi-Agent AI Through ODTOE: Why 3-6-9 Roles Outperform Flat Crews. ODTOE Blog. https://odtoe.org/en/blog/multi-agent-ai-369-roles-outperform-flat-crews