Создана нейросеть для химиков, способная синтезировать новые соединения

Май 12, 2024 09:30

ДУШАНБЕ, 12.05.2024 /НИАТ «Ховар»/. Ученые из Швейцарии и США выяснили, что большие языковые нейросети можно научить решать большой набор задач в области органической химии, если встроить в них набор из нескольких алгоритмов, которыми пользуются профессиональные химики в своей работе. Система ИИ успешно синтезировала репеллент от насекомых и несколько катализаторов, передает агентство Kazinform со ссылкой на ТАСС.

«Наша система похожа по принципам своей работы на то, как ведет себя эксперт в своей области, имеющий доступ к калькулятору и специализированным базам данных. Умение пользоваться этими инструментами и наличие доступа к ним не только повышает эффективность работы эксперта, но и помогает совершать меньше ошибок. В случае с нейросетью эти инструменты снижают вероятность появления «галлюцинаций» в ее работе», — пояснил научный сотрудник EPFL Андрес Бран, чьи слова приводит пресс-служба Федеральной политехнической школы Лозанны (EPFL).

Этот подход, как отмечают Бран и его коллеги, позволяет ликвидировать главный недостаток уже существующих больших языковых нейросетей — их неспособность корректно оперировать научными данными и решать тривиальные задачи. В частности, системы ИИ из семейства GPT не способны точно перемножать числа, а также визуализировать молекулы веществ, опираясь на их названия или формулы.

Для решения этой проблемы ученые встроили в одну из популярных больших языковых моделей набор алгоритмов и виртуальных инструментов, которыми химики пользуются для поиска патентов и публикаций по интересующим их темам, оценки массы и сходства изучаемых веществ, подготовки плана по синтезу определенных молекул и решения других тривиальных и рутинных задач.

Последующие проверки ее работы показали, что новая система ИИ, получившая имя ChemCrow, значительно превосходила GPT-4 в точности предсказаний и совершала меньше ошибок в работе. При ее помощи ученым удалось синтезировать популярный репеллент от насекомых DEET, а также три катализатора, ускоряющих реакции с участием органических соединений серы.

Кроме того, ученые использовали ChemCrow для создания ранее не существовавшего соединения из числа хромофор, органических молекул, способных поглощать ультрафиолетовое излучение с длиной волны в 369 нанометров. Подобные успехи, по мнению Брана и его коллег, позволяют использовать созданную ими систему ИИ в качестве виртуального помощника для химика-профессионала, который сможет значительно ускорить его работу и избавить от рутины.

Так называемые большие языковые нейросети (LLM) представляют собой сложно устроенные системы ИИ, которые были обучены на большом количестве неразмеченного текста и обладают миллиардами параметров. Благодаря особенностям процесса их обучения и архитектуры они способны решать очень широкий перечень задач и при этом демонстрировать значительные общие знания о мире. К их числу относятся системы ChatGPT, Claude, LLaMA и прочие похожие на них нейросети.

Фото: freepik.com

Май 12, 2024 09:30

Другие новости этой рубрики

В Таджикском государственном институте изобразительных искусств и дизайна открылась выставка творческих работ
В этом году 3168 выпускников педагогических вузов Таджикистана направлены на работу в общеобразовательные учреждения
Один за четырёх: сеть «МегаФон Таджикистан» оснащают мощными аккумуляторами
Объем продукции рыбоводства увеличился на 11,4 %
В 2024 году прогнозируется средний рост заработной платы на 2,7 %
Более трети всех видов деревьев находятся под угрозой исчезновения
Южная Корея борется с одиночеством с помощью культуры
Ледники продолжают уменьшаться в Швеции
Две трети создателей цифрового контента не проверяют факты перед тем, как ими поделиться
Обсуждено сотрудничество Международногоуниверситета туризма и предпринимательства Таджикистана с Институтом стратегии развития науки и технологий и Технологическим университетом Чэнду Китая
О ПОГОДЕ: в отдельных горных районах Таджикистана сегодня сильные осадки
В этом году из Таджикистана за пределы страны экспортировано более 1000 тонн шиповника