FEDOT и новые члены ИИ-семьи
Еще в 2021 году команда Национального центра когнитивных разработок (НЦКР) ИТМО с огромным отрывом победила в хакатоне Emergency DataHack. В чем секрет? Всё дело в том, что участникам помогал FEDOT — open-source фреймворк автоматического машинного обучения. С его помощью можно создавать и оптимизировать пайплайны (цепочки задач) машинного обучения или их отдельные элементы. Таким образом, на основе открытых данных FEDOT может быстро решать совершенно разные задачи — от прогнозирования наводнений до мультимодальной классификации сортов вина.
А недавно благодаря ученым из исследовательского центра «Сильный искусственный интеллект в промышленности» у FEDOT появился преемник — open-source фреймворк автоматического машинного обучения FEDOT.Industrial. От предшественника новый инструмент перенял автоматическую эволюционную генерацию моделей, оптимизацию пайплайна с точки зрения погрешностей предсказания, валидацию данных и моделей. Также ученые добавили более глубокую и детализированную библиотеку и хранилище полученных в процессе моделирования метаданных — характеристики входных данных и результаты моделирования. Это позволяет пользователю экономить время и ресурсы во время решения задач. Основное же предназначение FEDOT.Industrial зашифровано в его названии — работа с промышленными типами данных и оптимизация процессов и ресурсов предприятий. В частности, инструмент можно использовать для классификации временных рядов, поиска точки изменения динамики временного ряда, детектирования аномалий и объектов на изображениях.
«FEDOT.Industrial может решать задачи из разных областей. Но его главное преимущество в том, что если проверять нашу разработку на классических бенчмарках (тестах на производительность), возможности FEDOT.Industrial превосходят три четверти программного обеспечения, которое сделали и выгрузили в открытый доступ другие специалисты», — отметил директор мегафакультета трансляционных информационных технологий ИТМО Александр Бухановский.
Еще одной новинкой от НЦКР ИТМО стал новый облачный сервис SMILE.Cloud. Благодаря нему любой пользователь ― вне зависимости от его навыков в программировании ― может бесплатно создавать и проверять модели машинного обучения. Например, сервис можно использовать для классифицикации жилых домов по их состоянию или проведения банковского скоринга. При этом задачу можно решить, даже если для работы не хватает данных. Также сервис позволяет моделировать технологические процессы любого масштаба. После регистрации на платформе можно редактировать уже готовые решения типовых задач или создать свой проект, используя стабильные фреймворки AutoML. А информационная система подскажет, как можно улучшить работу пользователя.
Среди других open source-решений, которые в ИТМО развивает команда разработчиков исследовательского центра «Сильный ИИ в промышленности», ― библиотека для продвинутого обучения и анализа данных на основе байесовских сетей BAMT. Она используется для решения задач, в которых информации о связях между объектами и их зависимостях недостаточно ― например, так часто бывает в добывающей промышленности, если нужно проанализировать параметры месторождений. Еще одна open source технология GOLEM позволяет оптимизировать структурированные графовые модели и также справляться с разными задачами — находить конечные автоматы в робототехнических системах или изучать молекулярные графы для поиска новых лекарств.
И наконец, библиотека GEFEST поможет создать генеративный дизайн физических объектов, которые представлены в виде геометрических структур и взаимодействуют со сплошными средами. С помощью этого инструмента можно оптимизировать разные структуры ― от волноломов, защищающих берег от волн, до искусственных селезенок.
Создание открытого программного обеспечения в области ИИ и смежных цифровых технологий в исследовательском центре «Сильный искусственный интеллект в промышленности» видят своей главной задачей. Поэтому вслед за открытыми фреймворками FEDOT.Industrial, BAMT, GOLEM и GEFEST специалисты центра готовят к выходу также открытые библиотеки по обучению на несбалансированных данных, мультиагентной оптимизации, графовым нейронным сетям и другим фронтирным направлениям ИИ.
Идеальный город с помощью цифрового планирования
По данным комитета по образованию Санкт-Петербурга, заполненность петербургских школ к 1 сентября 2022 года составляла 110–115%, при этом в образовательных учреждениях не хватало почти 72 тыс. мест, а в детских садах эта цифра достигает 26 тыс. В каких районах необходимо прежде всего строить школы и детские сады? Как наиболее эффективно планировать другие объекты социальной инфраструктуры и общественные пространства? В решении этих вопросов тоже может помочь искусственный интеллект, уверены в НЦКР.
Ученые предлагают несколько цифровых сервисов, использующих технологию генеративного дизайна. Все они основаны на веб-сервисе автоматического сбора и обработки геоданных YourMaps. После фильтрации и классификации открытые геоданные становятся объектами геометрической формы с необходимыми тегами.
«В основе модели цифровой урбанистики лежат разные способы оптимизации данных. Они содержат в себе модели каждого объекта городской среды, у которых есть свои характеристики — пространственные, функциональные и физические. Например, детский садик — это пространственный объект, объединенный фундаментом. Также это физическое здание, а с точки зрения функционала — это сервис для детей и родителей», — объяснил руководитель лаборатории «Интеллектуальные технологии анализа городских данных» НЦКР, директор Института дизайна и урбанистики ИТМО Сергей Митягин.
Дополняя результаты YourMaps данными из социологических опросов, можно, например, оценить, насколько жителям нравится социальная и транспортная инфраструктура в конкретном районе, где они проживают и какие места посещают большинство из них.
Также с помощью технологий ИИ, компьютерного моделирования и больших данных можно за несколько минут сгенерировать план застройки новой территории или городские зоны отдыха. Справиться с первой задачей может платформа для территориального развития rTim, созданная в партнерстве с российской ИТ-компанией Rocket Group. А для второй ― подойдет сервис ParkPlanner. Оба инструмента работают одинаково: пользователь выделяет область на карте, а через несколько минут ИИ предлагает вариант ее организации.
Безопасность в метавселенных
Метавселенная — это виртуальный мир, созданный с помощью цифровых технологий, где за каждым аватаром стоит реальный пользователь. Но здесь, как и в реальном мире, перед учеными появляются новые задачи, которые нужно решить, чтобы создать для пользователей комфортную и безопасную среду.
«Во-первых, появляется много источников информации, при этом не всем из них можно доверять. Во-вторых, меняется коммуникация. Если раньше мы встречались с людьми очно, то сейчас мы чаще используем мессенджеры и платформы для онлайн-общения. Причем из общения пропадает визуальная составляющая, которая несет дополнительную информацию о собеседнике. Наконец, как наладить межличностное и командное взаимодействие, если пользователи общаются и ставят рабочие задачи в разных приложениях?», — рассказал руководитель и Product Owner лаборатории «Когнитивная невербалика» НЦКР ИТМО, доцент факультета цифровых трансформаций Олег Басов.
Решить все три задачи могут технологии, разработанные сотрудниками НЦКР. Инструмент Expert может анализировать текст, аудио и видео и по невербальным признакам (мимике, тембре голоса, скорости речи и так далее) определять психоэмоциональное состояние человека — уровень его уверенности, агрессии и противоречивости. В перспективе это поможет понять, насколько честен и открыт перед пользователем другой аватар.
А быстро изучить сотни отзывов на реальные продукты, обозначить тренды, проанализировать рынок и скорректировать свое предложение позволяет технология AutoTM, которую заканчивают разрабатывать в НЦКР. Она самостоятельно проводит тематическое моделирование и анализирует отзывы, используя модели обработки естественного языка.
Также продолжается работа над сервисом Avatar — персональным ассистентом пользователя. Это не просто мессенджер, который собирает в одном месте коллег пользователя для общения и работы. Из сообщений Avatar самостоятельно вычленяет информацию о настроении собеседника, чтобы предупредить о возможном конфликте, а также находит сообщения о планирующейся встрече и заносит ее в календарь. Еще с помощью этого инструмента можно проанализировать компетенции сотрудников, объединить их в одну проектную команду, назначить задания и проконтролировать их выполнение. Попробовать сервис можно, скачав его из App Store.
Национальный центр когнитивных разработок (НЦКР) ИТМО — центр, созданный на базе ИТМО в рамках государственной программы поддержки центров компетенций Национальной технологической инициативы (НТИ) в 2018 году. Главная цель НЦКР — развитие технологий машинного обучения и когнитивных технологий. К ним относятся системы поддержки и принятия решений, предсказательное моделирование, цифровые аватары, двойники и так далее. О технологиях, которые помогут пользователям решать прикладные интеллектуальные и творческие задачи в разных областях, рассказали представителям власти и бизнеса 14 декабря на базе ИТМО.
Центр «Сильный искусственный интеллект в промышленности» создан на базе ИТМО в рамках федерального проекта «Искусственный интеллект». Это один из шести центров, призванных стать опорными точками развития искусственного интеллекта в России. Он специализируется на технологиях сильного ИИ, способных поддержать отраслевых специалистов в решении не только рутинных, но и нестандартных, творческих задач.