Learning With an AI Tutor: The Sweet Spot of Difficulty

Учёба с ИИ-наставником: золотая середина сложности

Anton Pankratov
AI tutoringadaptive learningzone of proximal developmentflowcognitive offloadingself-regulated learningmetacognitionhuman-AI dyadODTOEcoherencemastery gapdesirable difficulty

Video overview

Thesis. When you learn with an AI tutor, you are not a learner using a tool — you and the AI form a single coherent system, a learning dyad. Real learning is the convergence of that dyad to a stable skill that reproduces itself without the tutor. The danger is that a fluent AI can make the dyad feel coherent long before the skill is actually yours. ODTOE gives us the vocabulary to tell the difference — and to keep difficulty in the one narrow band where learning actually happens.

One system, not two

Stop picturing yourself on one side of the screen and the AI on the other. While you study, the two of you are coupled tightly enough to behave as one observer of the material. Every question you ask reshapes the next explanation; every explanation reshapes your next question. That coupled object — the dyad — is what learns, or fails to.

ODTOE describes learning as convergence to a self-consistent fixed point of competence, written Psi∗. A fixed point is a skill that, once you reach it, reproduces itself: you can do the thing, which lets you do the thing again, without external help. Before Psi∗, the loop leaks — remove the tutor and the ability drains away. The whole goal of an AI tutor is to push the dyad toward a Psi∗ that survives the tutor's removal. That is the only success worth the name. For the underlying model, see the coherence of the human–AI learning dyad.

The sweet spot of difficulty is an interior optimum

The most useful single idea here is that the right difficulty is not the maximum difficulty. Push too hard and the learner is overwhelmed; nothing sticks. Make it too easy and the learner is bored; nothing grows. Optimal challenge lives in the interior — a narrow band between the two.

That band is the overlap of two classic ideas:

  • Vygotsky's Zone of Proximal Development — what you can do with help but not yet alone.
  • Csikszentmihalyi's Flow — the state where challenge matches skill closely enough to absorb you completely.

A good AI tutor steers the dyad into that overlap and keeps it there as your skill grows. A recent caution from the literature names the failure mode precisely: when help never stops, learners enter a Zone of No Development, where assistance replaces the struggle that builds the skill. The fix is not less help in general — it is graduated, reversible help: hints before solutions, and support that withdraws as competence consolidates. ODTOE applied to the classroom appears in coherent education.

Coherence is multiplicative — one broken link breaks learning

ODTOE measures the dyad's coherence as a product:

B = F · E · (1 − sigma) · Lambda

Read it as four factors that must all hold:

  1. F (form) — the explanation fits how you actually represent the idea; a mismatched analogy scores low.
  2. E (energy) — attention and effort are present; a distracted, exhausted learner has low E.
  3. (1 − sigma) — sigma is doubt; honest, calibrated uncertainty raises the term, while either blind trust or paralysing distrust lowers it.
  4. Lambda (data-quality) — the AI's information is actually correct.

The structure matters more than the symbols. Because B is a product, it has a weak-link property: send any one factor to zero and the whole thing collapses, no matter how strong the others. A flawless explanation of a wrong fact (Lambda = 0) teaches nothing. Perfect facts you are too tired to absorb (E = 0) teach nothing. Learning fails at its weakest link, not its average — so diagnosis means hunting for the one factor that has gone to zero, not polishing the ones that are already fine. The data-quality term has its own treatment in Lambda, the data-quality factor.

The ideal error: feeling masterful is not mastery

Here is the central honest warning, and the 2025–2026 evidence is blunt about it. A smooth, fluent, confident AI explanation produces a coherent appearance of mastery. Your confidence rises because the account felt complete — but your actual ability lags behind. ODTOE calls this the ideal error: the dyad looks coherent from the inside while the fixed point Psi∗ has not been reached.

The studies make it concrete. Learners with a strong AI tutor improved on practice problems dramatically, yet when the tutor was removed for the exam the advantage vanished — and, tellingly, those learners believed they had done better than everyone else. Researchers call the mechanism metacognitive laziness: a fluent answer removes the difficulty signal that would normally trigger you to check yourself, so acceptance quietly replaces verification. A convincing explanation is evidence about the explanation, not about you. The deeper point about confident-but-wrong internal states is explored in belief.

Keep your hands on the wheel: the AI is a co-regulator

Self-regulated learning runs a loop — forethought (plan, set a goal), performance (attempt, monitor), reflection (judge what happened, adjust). The healthy arrangement is the AI as a co-regulator inside that loop, never the driver of it.

Reliance on the tutor has its own interior optimum:

  • Too little and you waste the genuine help available; you grind on obstacles a hint would clear.
  • Too much and you stop driving — the dyad converges to a fixed point that lives in the AI, not in you, and the skill never internalizes.

The current research converges on the same prescription: AI works best when it introduces productive friction — withholding the solution until you attempt it, delivering graded hints, and demanding that you explain the answer back. Friction is not a bug in a tutor; it is the mechanism. The broader pattern of who drives a coupled system appears in team configuration.

Measure the gap, not the feeling

So how do you know it is working? Not by how good the session felt — that is exactly the signal the ideal error corrupts. Measure the mastery gap: the distance between what you can do with the AI and what you can do without it.

Practical moves that shrink the gap:

  1. Close the loop with the tutor away. After any session, redo a problem from scratch with no AI. The unaided result is your real coordinate.
  2. Make it explain back to you. If you can re-derive the AI's explanation in your own words, the form F was real; if you only recognised it, it was not.
  3. Demand calibrated uncertainty. Ask the tutor what it is unsure about. This protects Lambda and keeps sigma honest.
  4. Tune one knob at a time. When learning stalls, find the zeroed factor — wrong difficulty, low energy, bad data, misfit form — rather than working harder on everything.

Learning with AI is neither salvation nor doom. It is a coupled system with a knowable optimum, a known failure mode, and an honest measure of success. Keep the difficulty interior, keep your hands on the wheel, and trust the shrinking gap over the good feeling. A gentler on-ramp to these ideas is the simple guide.

Cite this post

If you reference this post, please cite as:

Pankratov, A. (2026). Learning With an AI Tutor: The Sweet Spot of Difficulty. ODTOE Blog. https://odtoe.org/en/blog/human-ai-learning-coherence-the-sweet-spot-of-difficulty
Читать по-русски · Read in Russian

Тезис. Когда вы учитесь с ИИ-наставником, вы не ученик, использующий инструмент, — вы и ИИ образуете единую когерентную систему, обучающуюся диаду. Настоящее обучение — это сходимость этой диады к устойчивому навыку, который воспроизводит сам себя уже без наставника. Опасность в том, что гладкий ИИ способен заставить диаду казаться когерентной задолго до того, как навык действительно станет вашим. ODTOE даёт нам язык, чтобы различить эти два состояния — и удержать сложность в той единственной узкой полосе, где обучение и происходит.

Одна система, а не две

Перестаньте представлять себя по одну сторону экрана, а ИИ — по другую. Пока вы учитесь, вы двое связаны достаточно тесно, чтобы вести себя как один наблюдатель материала. Каждый ваш вопрос переформировывает следующее объяснение; каждое объяснение переформировывает ваш следующий вопрос. Именно этот связанный объект — диада — учится или не учится.

ODTOE описывает обучение как сходимость к самосогласованной неподвижной точке компетентности, обозначаемой Psi∗. Неподвижная точка — это навык, который, будучи достигнут, воспроизводит сам себя: вы умеете делать нечто, и это умение позволяет вам сделать это снова, без внешней помощи. До Psi∗ петля «протекает» — уберите наставника, и способность утекает. Вся цель ИИ-наставника — подтолкнуть диаду к такому Psi∗, которое переживёт уход наставника. Только это и заслуживает имени успеха. Лежащую в основе модель см. в статье когерентность человеко-ИИ обучающей диады.

Золотая середина сложности — это внутренний оптимум

Самая полезная отдельная мысль здесь в том, что правильная сложность — это не максимальная сложность. Надавите слишком сильно — и ученик перегружен; ничего не закрепляется. Сделайте слишком легко — ученику скучно; ничего не растёт. Оптимальный вызов живёт внутри — в узкой полосе между этими крайностями.

Эта полоса — пересечение двух классических идей:

  • Зона ближайшего развития Выготского — то, что вы можете сделать с помощью, но ещё не в одиночку.
  • Поток Чиксентмихайи — состояние, в котором вызов настолько близко соответствует навыку, что поглощает вас целиком.

Хороший ИИ-наставник заводит диаду в это пересечение и удерживает её там по мере роста навыка. Недавнее предостережение в литературе точно называет режим отказа: когда помощь не прекращается, ученики попадают в зону отсутствия развития, где поддержка замещает усилие, которое и строит навык. Лекарство — не «меньше помощи вообще», а помощь градуированная и обратимая: подсказки прежде решений, и поддержка, которая отступает по мере консолидации компетентности. ODTOE в применении к классу — в статье когерентное образование.

Когерентность мультипликативна — одно разорванное звено рушит обучение

ODTOE измеряет когерентность диады как произведение:

B = F · E · (1 − sigma) · Lambda

Читайте это как четыре фактора, которые должны выполняться все:

  1. F (форма) — объяснение совпадает с тем, как вы на самом деле представляете идею; неподходящая аналогия даёт низкий балл.
  2. E (энергия) — присутствуют внимание и усилие; рассеянный, измотанный ученик имеет низкое E.
  3. (1 − sigma) — sigma это сомнение; честная, откалиброванная неуверенность поднимает этот член, тогда как и слепое доверие, и парализующее недоверие его снижают.
  4. Lambda (качество данных) — информация от ИИ действительно верна.

Структура важнее символов. Поскольку B это произведение, у него есть свойство слабого звена: обнулите любой фактор — и всё рушится, как бы сильны ни были остальные. Безупречное объяснение неверного факта (Lambda = 0) не учит ничему. Идеальные факты, которые вы слишком устали усваивать (E = 0), не учат ничему. Обучение отказывает на самом слабом звене, а не на среднем — значит, диагностика означает охоту за тем единственным фактором, что ушёл в ноль, а не полировку тех, что и так в порядке. Член качества данных разбирается отдельно в статье Lambda — фактор качества данных.

Идеальная ошибка: чувствовать себя мастером — не значит быть мастером

Вот центральное честное предостережение, и данные 2025–2026 годов говорят о нём прямо. Гладкое, беглое, уверенное объяснение ИИ производит когерентную видимость мастерства. Ваша уверенность растёт, потому что рассказ ощущался завершённым, — но реальная способность отстаёт. ODTOE называет это идеальной ошибкой: диада изнутри выглядит когерентной, тогда как неподвижная точка Psi∗ ещё не достигнута.

Исследования делают это осязаемым. Ученики с сильным ИИ-наставником резко улучшили результаты на тренировочных задачах, но когда наставника убрали на экзамене, преимущество испарилось — и, что показательно, эти ученики были уверены, что справились лучше остальных. Механизм исследователи называют метакогнитивной ленью: беглый ответ снимает сигнал сложности, который обычно побудил бы вас себя проверить, и принятие тихо замещает проверку. Убедительное объяснение — свидетельство об объяснении, а не о вас. Глубже о уверенных, но ошибочных внутренних состояниях — в статье вера.

Держите руки на руле: ИИ — со-регулятор

Саморегулируемое обучение крутит петлю — предвидение (план, постановка цели), исполнение (попытка, мониторинг), рефлексия (оценка случившегося, корректировка). Здоровое устройство — ИИ как со-регулятор внутри этой петли, но никогда не её водитель.

У опоры на наставника есть собственный внутренний оптимум:

  • Слишком мало — и вы упускаете доступную настоящую помощь; вы буксуете на препятствиях, которые сняла бы одна подсказка.
  • Слишком много — и вы перестаёте вести; диада сходится к неподвижной точке, которая живёт в ИИ, а не в вас, и навык так и не интернализуется.

Текущие исследования сходятся к одному и тому же рецепту: ИИ работает лучше всего, когда вводит продуктивное трение — придерживает решение, пока вы не попробуете, выдаёт градуированные подсказки и требует, чтобы вы пересказали ответ. Трение — не дефект наставника, а его механизм. Более широкий узор того, кто ведёт связанную систему, — в статье конфигурация команды.

Измеряйте разрыв, а не ощущение

Так как же понять, что это работает? Не по тому, насколько хорошей ощущалась сессия, — именно этот сигнал и искажает идеальная ошибка. Измеряйте разрыв мастерства: расстояние между тем, что вы умеете с ИИ, и тем, что вы умеете без него.

Практические ходы, сокращающие разрыв:

  1. Замыкайте петлю при выключенном наставнике. После любой сессии перерешайте задачу с нуля без ИИ. Результат без помощи — ваша настоящая координата.
  2. Заставьте себя объяснить обратно. Если вы можете заново вывести объяснение ИИ своими словами, форма F была настоящей; если вы лишь узнали его — нет.
  3. Требуйте откалиброванной неуверенности. Спросите наставника, в чём он не уверен. Это защищает Lambda и держит sigma честной.
  4. Крутите по одной ручке за раз. Когда обучение застопорилось, найдите обнулённый фактор — неверная сложность, низкая энергия, плохие данные, несовпавшая форма, — а не работайте усерднее надо всем сразу.

Учёба с ИИ — ни спасение, ни погибель. Это связанная система с познаваемым оптимумом, известным режимом отказа и честной мерой успеха. Держите сложность внутренней, держите руки на руле и доверяйте сокращающемуся разрыву больше, чем приятному ощущению. Более мягкий вход в эти идеи — простое руководство.