Большие данные без большого шума

Александр Гурьянов

Анализ больших данных — это крупная компьютерная отрасль. Обычно речь идет о маркетинговых исследованиях, результаты которых должны помогать продавать больше товаров. Если разобраться, то наука всегда оперирует большими данными. Экспериментальные данные, которых, как правило, много, содержат артефакты и искажены шумом. Задача ученого выделить в них закономерности и выразить их в компактном виде, желательно на четком математическом языке. На это способен только человеческий интеллект.

Но и искусственный интеллект кое-что умеет. Компьютерные сети могут понизить неопределенность исходных данных эксперимента и представить их в удобном для анализа виде. Один из способов такого применения обучаемых нейронных сетей только что продемонстрировали физики Берлинского центра материалов и энергии имени Гельмгольца под руководством доктора Грегора Хартманна (Gregor Hartmann), заведующего лабораторией методов ИИ. С его помощью они измерили параметры излучения лазера на свободных электронах. Статья появилась в конце прошлого года в журнале Scientific Reports.

Ученые разработали программу, которая сжимала набор данных, а затем удаляла из них шум. Это стало возможным благодаря тому, что их сеть представляет собой комбинацию двух сетей, первая сжимает данные, вторая — восстанавливает. Обе их тренируют так, чтобы сжатые данные было удобно интерпретировать исследователю. В 2017 году, когда такие сети предложил Гугл, их широкое практическое применение не просматривалось.

Лазер на свободных электронах позволяет получать очень короткий импульс излучения, длящийся от фемто- до аттосекунд. Для его измерения обычно применяют газовые детекторы. В них импульс выбивает фотоэлектроны, характеристики которых затем анализируют приборы. Излучение лазера сильно меняется от импульса к импульсу, но экспериментаторам нужно точно знать параметры каждого из них.

Новая нейросеть как раз и решает эту задачу. Она успешно определяет энергию и интенсивность лазерного импульса по импульсу фотоэлектронов детектора излучения. ИИ извлекает ценную информацию из зашумленных данных о времени пролета фотоэлектронов и даже учитывает индивидуальные характеристики конкретного детектора. Программа делает это гораздо лучше других способов. Интересно, что она позволяет реконструировать сигналы, которые незаметны на фоне шума в первичных данных.

Доктор Хартманн говорит, что его ИИ сможет выявлять неожиданные физические эффекты и корреляции в больших наборах самых разных экспериментальных данных. Годы работы позволили немецким ученым создать очень удобную для пользователя программу. Ее мощный инструментарий годится не только для оптики и спектроскопии.


Scientific Reports, 2022; 12 (1)

Разные разности
Пишут, что...
…космический телескоп Джеймс Уэбб, наблюдавший за окружающей средой двух молодых протозвезд, обнаружил на крошечных частичках ледяной пыли многочисленные сложные органические молекулы… …газообразный водород из гидротермальных источников превра...
Раскрыт секрет синего цвета фруктов
Давно известно, что черника и другие ягоды в действительности содержат только красные красители в мякоти и кожуре. Но тогда откуда берется такой красивый сине-голубой цвет черники и голубики? Ученые решили присмотреться к поверхности кожуры ягод черн...
Почему у собак глаза темнее, чем у волков
У большинства домашних собак глаза темно-коричневые. А вот если мы посмотрим на волков, то увидим другую картину — их глаза ярко-желтые. Куда же делся ярко-желтый волчий цвет? Этим вопросом задались японские ученые и решили докопаться до истины.
Память обезьян похожа на человеческую
Наука постоянно добывает все новые и новые факты, подтверждающие сходство людей и обезьян и намекающие на то, что, как минимум, общий предок у человека и обезьяны был. И речь идет не о внешнем сходстве, а о более тонких вещах — о работе мозга.