Лауреаты Нобелевской премии по физике — одни из основоположников идей нейронных сетей. Они разработали архитектуры нейросетей и методы их обучения, которые позволили имитировать когнитивные функции человека для распознавания и классификации различных объектов. Ученые решили эту задачу с позиций статистической физики, опираясь на теоретическую аналогию с явлениями магнетизма и теплового движения молекул.
«Работа лауреатов уже принесла огромную пользу. В физике мы используем искусственные нейросети в широком спектре областей, в частности, для разработки новых материалов с определенными свойствами», — отметила председатель Нобелевского комитета по физике Эллен Мунс.
Исследователи работали с нейросетями с 1980-х годов. Сначала, в 1982 году, физик Джон Хопфилд изобрел ассоциативную нейросеть — модель обработки данных, которая умеет находить в базе данных похожие, но не идентичные эталонным образцам для обучения изображения. Идея сети Хопфилда основана на принципах статистической физики, то есть корректной организации коллективного поведения отдельных узлов сети.
В 1985 году на основе сети Хопфилда Джеффри Хинтон разработал модель обработки данных, которая использует другой метод — машину Больцмана (названа в честь австрийского физика Людвига Больцмана, одного из создателей статистической физики). В отличие от нейросети Хопфилда, эта сеть уже не нуждается в эталонных образцах и умеет классифицировать изображения на основе сравнения — распознавая общие характерные элементы. В своей работе Хинтон тоже использовал инструменты из статистической физики: нейросеть обучается на примерах изображений, с которыми с большой вероятностью столкнется во время работы.
Работы ученых позволили приблизить нейросети к человеческому мышлению (обычно люди не мыслят эталонами, а просто соотносят друг с другом сходные объекты) и сделать важный шаг в сторону развития современного ИИ.
«В основе идеи нейросети лежит принцип работы человеческого мозга — нейроны в мозге человека с помощью отростков связываются с другими нейронами и создают сложные нейронные связи. Так, Хопфилд предложил передавать сигнал с выхода каждого нейрона в сети на входы всех остальных нейронов. Такая архитектура была одной из первых сетей, которая смогла эффективно и быстро обучаться, а также работать в режиме восстановления поврежденных изображений. Джеффри Хинтон был одним из ученых, разработавших метод обратного распространения ошибки, который до сих пор применяется для обучения многослойных нейросетей. С 1980-х годов нейронные сети сильно развились и современные модели состоят уже из триллиона нейронов, но технологии Хопфилда и Хинтона являются краеугольными камнями этих систем», — рассказал директор института прикладных компьютерных наук Антон Кузнецов.
Как отмечает исследователь, все системы искусственного интеллекта — от чата GPT до генеративных моделей — используют идеи, заложенные этими учеными. Даже в основе ChatGPT — нейросети, которая по набору слов генерирует наиболее релевантный ответ, — заложена идея обнаружения сходных объектов.
Современные нейросети содержат до нескольких триллионов параметров и могут решать абсолютно разные задачи: от генерации изображений и музыки до предсказания того, каким именно заболеванием болен пациент. Для решения таких задач входные данные (изображения, тексты и прочее) превращаются в наборы чисел, а затем передаются на вход нейронам первого слоя. Затем сигнал распространяется по остальным слоям и на выходе выдает результат. Конечно, сама по себе нейронная сеть не может сходу решать такие задачи, для этого ей нужно учиться — то есть передавать на вход данные, для которых уже известен ответ, и сравнивать получившийся результат с эталонным. Чтобы в дальнейшем минимизировать ошибки, Джеффри Хинтон вместе с группой ученых предложил метод обратного распространения ошибки в 1986 году.
Работы Хопфилда и Хинтона легли в основу систем искусственного интеллекта, которые в том числе применяют в химии для предсказания вероятного течения химических реакций, а также в биологии при создании лекарств нового поколения.
Такие системы на основе ИИ разрабатывают и в ИТМО. В 2024 году в Первом неклассическом открылась лаборатория «Генеративный дизайн ферментов и аптамеров», где на основе ИИ разрабатывают инструменты для создания молекулярных машин — наноустройств, которые способны ускорять химические реакции, избирательно связывать молекулы и даже выступать в роли биопроцессоров для терапии и диагностики заболеваний. Недавно исследователи химико-биологического кластера ИТМО создали веб-платформу, которая за считанные секунды с высокой точностью «рассчитывает» способность ускорять химические реакции у нанозимов — искусственных ферментов.