Исследователи из Университета Калифорнии в Санта-Крузе показали, что выращенные в лаборатории органоиды мозга способны адаптивно настраиваться под задачу при правильной системе обратной связи. В эксперименте нейронные сети в чашке Петри научились улучшать управление виртуальным маятником — классической задачей из теории управления. Работа опубликована в журнале Cell Reports.
Речь идет о так называемой задаче «cartpole»: виртуальная тележка должна двигаться вправо или влево, чтобы удерживать вертикально закрепленный на ней стержень. Малейшая ошибка приводит к падению маятника, поэтому система требует постоянных и точных корректировок. Эта модель часто используется в исследованиях обучения с подкреплением.
В эксперименте применялись органоиды, выращенные не из человеческих, а из мышиных стволовых клеток. Они представляли собой небольшие кластеры кортикальной ткани, способные передавать электрические сигналы и изменять внутренние связи под воздействием стимуляции. До уровня сознания или «мышления» такие структуры далеки.
Разные электрические сигналы кодировали угол наклона виртуального маятника. Ответы органоида интерпретировались как команды двигать тележку влево или вправо. При этом ткань не «понимала» задачу — ученые проверяли, можно ли с помощью структурированной обратной связи постепенно изменить конфигурацию нейронных связей так, чтобы улучшить управление.
Органоиды разделили на три группы: без обратной связи, со случайной стимуляцией и с адаптивной обратной связью. В последнем случае алгоритм отслеживал результаты за несколько попыток и при ухудшении показателей подавал короткие импульсы высокой частоты на определенные нейроны. Система анализировала, какие схемы стимуляции ранее приводили к улучшению, и корректировала воздействие.
«Когда мы можем целенаправленно выбирать обучающие стимулы, мы способны формировать сеть так, чтобы она решала задачу», — пояснил один из авторов работы, исследователь робототехники и ИИ Эш Роббинс.
Результаты оказались показательными. Без обратной связи органоиды достигали порогового уровня успешности лишь в 2,3% случаев, при случайной стимуляции — в 4,4%. При адаптивной обратной связи этот показатель вырос до 46%.
Однако эффект оказался краткосрочным. После 45 минут без активности органоиды «забывали» приобретенный навык и возвращались к исходному уровню. В дальнейшем ученые планируют изучить, можно ли усилить долговременную память, например, за счет увеличения сложности структуры.
Авторы подчеркивают, что цель исследования — не создание «живых компьютеров», а изучение фундаментальных механизмов пластичности нейронных сетей. По их словам, понимание того, как нейронные цепи адаптируются в лабораторных условиях, может помочь в изучении неврологических заболеваний и нарушений обучения.
Ранее была названа простая привычка, снижающая риск деменции почти на 40%.