Новая модель искусственного интеллекта с кодированием физических законов помогает изучать пространственно-временную динамику

Профессор Лю Ян из Китайской академии наук (UCAS) в сотрудничестве со своими коллегами из Народного университета Китая и Массачусетского технологического института предложил новую нейронную сеть, а именно физически кодированную рекуррентную сверточную нейронную сеть (PeRCNN), для моделирования и открытия нелинейных пространственно-временных динамических систем на основе разреженных и зашумленных данных.

Этот подход может быть применен к различным задачам, таким как реакционно-диффузионные процессы и другие системы дифференциальных уравнений в частных производных (PDE), включая прямой и обратный анализ, моделирование на основе данных и открытие уравнений в частных производных. Предварительные знания физики «кодируются», что делает сеть интерпретируемой.

В частности, исследователи предложили метод глубокого обучения, который принудительно кодирует заданную физическую структуру в рекуррентной сверточной нейронной сети для облегчения изучения пространственно-временной динамики в режимах разреженных данных. Статья опубликована в журнале Nature Machine Intelligence.

Они обнаружили, что такая вычислительная парадигма демонстрирует высокую точность, устойчивость, интерпретируемость и обобщаемость, и продемонстрировали возможности предложенной архитектуры сети, применив ее к различным задачам научного моделирования пространственно-временной динамики, таким как реакционно-диффузионные процессы.

В общем, прогнозирование эволюции сложных пространственно-временных динамических систем является сложной задачей во многих случаях из-за недостаточных предварительных знаний и отсутствия явной формулировки уравнения в частных производных для описания нелинейного процесса переменных системы. Традиционные методы машинного обучения должны полагаться на большой объем обучающих данных и страдают от проблем, таких как плохая интерпретируемость, слабая обобщаемость и неконтролируемые ошибки моделирования.

Благодаря недавнему развитию подходов, основанных на данных, появилась возможность изучать пространственно-временную динамику на основе данных измерений с добавлением предварительных знаний физики. Однако существующие парадигмы машинного обучения на основе физики налагают физические законы или уравнения в мягких ограничениях штрафов, и качество решения в значительной степени зависит от метода проб и ошибок при установке гиперпараметров. Поэтому крайне необходимо разработать новую модель обучения с встроенными знаниями для изучения лежащей в основе пространственно-временной динамики на основе данных.

По словам исследователей, главным преимуществом PeRCNN является то, что предварительные знания физики могут быть закодированы в сети, что гарантирует, что результирующая сеть строго подчиняется заданной физике. Это имеет значительные преимущества в улучшении сходимости и точности модели. Путем кодирования заданной физической структуры в рекуррентной сверточной нейронной сети была повышена производительность моделирования пространственно-временных динамических систем на основе разреженных и зашумленных данных.

Посредством многочисленных экспериментов они показали, как предложенный подход может быть применен для моделирования и открытия различных реакционно-диффузионных процессов и других систем уравнений в частных производных. Сравнивая предложенный подход с некоторыми существующими методами (также известными как базовые модели), они обнаружили, что подход последовательно превосходит (хотя и не настолько хорошо) рассмотренные базовые модели при разных уровнях шума и насыщенности данными.

Кроме того, исследователи интегрировали метод разреженной регрессии с моделью PeRCNN для выявления явной формы уравнений в частных производных. Вся процедура состоит из трех шагов: реконструкция данных, разреженная регрессия и точная настройка коэффициентов.

Ожидается, что это исследование продвинет разработку методов моделирования сложных пространственно-временных динамических систем на основе данных, предоставляя ученым и инженерам более мощные инструменты для понимания и прогнозирования природных и технических явлений.

Ожидается, что этот подход, объединяющий глубокое обучение и предварительные знания физики, будет применим во многих дисциплинах и сыграет важную роль, в том числе в механике жидкости и газа, биохимии, науках об окружающей среде, технике, материаловедении и других.

Исследователи с нетерпением ждут дальнейшего развития и применения этого нового подхода, который может раскрыть еще больше тайн о сложных пространственно-временных динамических системах и принести новые прорывы для будущего научного и технологического развития.

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *