Новосибирский студент разработал нейронную сеть для автоматической обработки данных

Фото: пресс-служба НГУ

Проект студента Новосибирского государственного университета вошел в число победителей молодежного конкурса научно-исследовательских проектов «Рентгеновские, синхротронные, нейтронные методы междисциплинарных исследований».

Метод рентгеновской фотоэлектронной спектроскопии (РФЭС) — один из самых распространенных спектроскопических методов в катализе, материаловедении, физике полупроводников и многих других областях современной науки. В настоящее время обработка рентгеновских фотоэлектронных спектров в подавляющем большинстве случаев осуществляется вручную и представляет собой рутинный процесс — на описание одного спектра у научного сотрудника уходит порядка 10 минут. Классические алгоритмы анализа спектров могут вызывать значительную ошибку при обнаружении и подгонке пиков, и поэтому не могут использоваться в задачах автоматизации.

«С открытием ЦКП «Сибирский кольцевой источник фотонов» объем данных значительно увеличится, а инструментов для их автоматической обработки до сих пор нет, — рассказывает студент 4 курса Факультета естественных наук НГУ Артем Вахрушев. — И мы решили впервые доверить решение этой проблемы нейросетям. Задачи обработки спектров могут быть решены методами глубокого машинного обучения, так как модели нейронных сетей способны обрабатывать такие неструктурированные данные, как изображения и последовательности сигналов, находя в них закономерности и оптимизируя ручной труд. Мы рассматривали проблему обнаружения пиковых площадей и максимумов как проблему сегментации. Для обучения модели мы использовали синтетические данные. Каждый такой синтетический спектр включал в себя шум, пики и фон неупругого рассеяния. Пики моделировались с помощью функций псевдо-Фойгта со случайными параметрами. Фон неупругого рассеяния моделировался с помощью нормальной кумулятивной функции распределения. Затем мы разработали алгоритм для постобработки результатов анализа модели».

В качестве данных для проверки модели и алгоритмов постобработки использовались спектры хлорида серебра (AgCl), полученные научной группой в Институте катализа имени Г.К. Борескова СО РАН. В результате исследований выяснилось, что разработанный Артемом Вахрушевым подход, сочетающий в себе сегментацию спектров нейросетью и алгоритмов постобработки, хорошо согласуется с результатами ручного анализа.

Разработка архитектуры модели, обучение и тестирование были выполнены с использованием PyTorch на Python. А поскольку архитектура была оптимизирована для быстрого вывода, процесс обработки спектра занимает менее секунды на домашнем ноутбуке.

В настоящее время эта нейросетевая модель существует только в виде кода в открытом доступе и неудобна для потенциальных пользователей, но Артем Вахрушев уже приступил к разработке ее графического интерфейса. Также он планирует создать потоковую обработку большого количества спектров, чтобы программа могла выводить динамику изменения состава исследуемой поверхности.

Добавьте нас в источники на Яндекс.Новостях

Поделиться:
Если вы хотите, чтобы ЧС-ИНФО написал о вашей проблеме, сообщайте нам на SLOVO@SIBSLOVO.RU или через мессенджеры +7 913 464 7039 (Вотсапп и Телеграмм) и социальные сети: Вконтакте и Одноклассники

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *