Что ИИ может узнать о Вселенной?

Квазар
Квазар в представлении художника. Авторы и права: Yoshiki Matsuoka.

Искусственный интеллект и машинное обучение стали повсеместными, применяясь в областях от анализа данных, кибербезопасности и разработки фармацевтических препаратов до создания музыки и изображений.

В последние годы также появились большие языковые модели (LLMs). Среди них ChatGPT, LLM, который оказал глубокое влияние с момента своего появления менее двух лет назад. Это применение вызвало значительные дебаты о потенциальных применениях и последствиях искусственного интеллекта.

Астрономия также получила огромную пользу, где машинное обучение используется для обработки огромных объёмов данных в поисках признаков планетарных транзитов, коррекции атмосферных помех и выявления закономерностей в шуме. По словам международной группы астрофизиков, это может быть только началом того, что мог бы сделать искусственный интеллект для астрономии.

В недавнем исследовании команда настроила модель Generative Pre-trained Transformer (GPT), для наблюдения астрономических объектов. В процессе они успешно доказали, что модели GPT могут эффективно помогать научным исследованиям.

Исследование провела команда ICRANet, международный консорциум, состоящий из исследователей Международного центра относительной астрофизики (ICRA), Национального института астрофизики (INAF), Университета науки и технологии Китая, Института высоких энергий Китайской академии наук (CAS-IHEP), Падуанского университета, Технологического университета Исфахана и Университета Феррары.

Их документ, “Может ли ИИ понять нашу вселенную? Тестирование и настройка GPT по астрофизическим данным”, недавно был опубликован на сервере предварительных публикаций arXivOrg.

Астрономы в значительной степени полагаются на алгоритмы машинного обучения для обработки огромных объёмов данных, полученных современными телескопами и инструментами. Эта практика началась около десяти лет назад и с тех пор значительно выросла, до того момента, когда искусственный интеллект был интегрирован в весь процесс исследований. Как сказал президент ICRA и главный автор исследования Ю Ванг в электронном письме для Universe Today:

“Астрономия всегда основывалась на данных, и астрономы являются некоторыми из первых учёных, которые приняли и использовали машинное обучение. Теперь машинное обучение интегрировано во всю астрономическую исследовательскую деятельность, от производства и управления земными и космическими телескопами (например, оптимизации работы систем адаптивной оптики, улучшения инициирования специфических действий (триггеров) спутников в определённых условиях и т. д.) до анализа данных (например, снижение шума, восстановление данных, классификация, симуляция и т. д.) и создания и проверки теоретических моделей (например, тестирование модифицированной гравитации, ограничение уравнения состояния нейтронных звёзд и т. д.).”

Анализ данных остаётся наиболее распространённым среди этих применений, поскольку это самая лёгкая область, в которой машинное обучение может быть интегрировано. Десятки исследователей и сотни гражданских учёных анализировали бы объёмы данных, произведённые в рамках наблюдательной кампании на протяжении многих лет.

Однако это непрактично в эпоху, когда современные телескопы ежедневно собирают терабайты данных. Это включает всеобъемлющие обзоры неба, такие как VLASS и многие фазы, проводимые Слоанским цифровым обзором неба (SDSS).

До настоящего времени LLM применялись в астрономических исследованиях лишь незначительно, поскольку они являются относительно недавним изобретением. Но, по словам сторонников, они имели огромное общественное значение и имеют потенциал, эквивалентный “промышленной революции”.

Что касается верхнего предела, Ванг предсказывает, что он может сильно варьироваться и может привести к “просвещению или разрушению” человечества. Однако, в отличие от Промышленной революции, темп изменений и интеграции намного быстрее для искусственного интеллекта, что вызывает вопросы о том, насколько далеко заведёт нас его принятие.

Чтобы определить его потенциал для области астрономии, сказал Ванг, он и его коллеги приняли предварительно обученную модель GPT и настроили её для идентификацииастрономических явлений:

“OpenAI предоставляет предварительно обученные модели, и то, что мы сделали, это настройка, которая включает изменение некоторых параметров исходной модели, позволяя ей распознавать астрономические данные и вычислять результаты на основе этих данных.”

“Мы предоставили ограниченные данные с умеренным разрешением и обучили GPT меньшее количество раз по сравнению с обычными моделями. Тем не менее результаты впечатляют, достигнув точности около 90%. Этот высокий уровень точности обусловлен прочным фундаментом GPT, который уже понимает обработку данных и обладает логическими выводами, а также коммуникационными навыками.”

Для настройки своей модели команда ввела наблюдения различных астрономических явлений, полученных из различных каталогов. Это включало 2 000 образцов квазаров, галактик, звёзд и квазаров с широкой линией поглощения (BAL) из SDSS (по 500 каждого). Они также интегрировали наблюдения коротких и длинных гамма-всплесков (GRB), галактик, звёзд и симуляций чёрных дыр. При тестировании их модель успешно классифицировала различные явления, различала типы квазаров, делала выводы о их расстоянии на основе красного смещения и измеряла вращение и наклон чёрных дыр.

“Эта работа по крайней мере демонстрирует, что LLM способны обрабатывать астрономические данные”, – сказал Ванг. “Более того, способность модели обрабатывать различные типы астрономических данных – это возможность, которой не обладают другие специализированные модели. Мы надеемся, что LLM могут интегрировать различные виды данных, а затем выявить общие принципы, помогающие нам понять мир. Конечно, это сложная задача, и астрономы не могут справиться с ней одни.”

Конечно, команда признаёт, что набор данных, с которым они экспериментировали, был очень мал по сравнению с объёмом данных современных обсерваторий. Это особенно верно для оборудования следующего поколения, такого как Обсерватория имени Веры Рубин, которая недавно получила свою камеру LSST, самую большую цифровую камеру в мире!

Можно с уверенностью сказать, что в ближайшем будущем будут появляться новые приложения LLM для астрономии. Это не только вероятное развитие, но и необходимое, учитывая объёмы данных, которые генерируются астрономическими исследованиями сегодня. И поскольку это вероятно будет увеличиваться экспоненциально в ближайшем будущем, искусственный интеллект, вероятно, станет неотъемлемой частью этой области знаний.

Оставьте комментарий