Медицинский искусственный интеллект Google превзошел врачей

Google представила Med-Gemini — семейство передовых моделей искусственного интеллекта, специализирующихся в медицине. Med-Gemini от Google превзошел другие искусственные интеллектуальные системы и даже профессиональных врачей.

Май 7, 2024 - 22:40

Медицинский искусственный интеллект Google превзошел врачей

Google представила Med-Gemini — семейство мультимодальных моделей, охватывающих текстовые, визуальные и другие данные, разработанных на основе Gemini и специально предназначенных для сферы здравоохранения. Хотя эти модели еще не доступны для публичного или бета-тестирования, на платформе arXiv был опубликован исчерпывающий исследовательский документ о них. Подробные примеры и сравнения показывают, что Google Med-Gemini превосходит другие искусственные интеллектуальные системы и даже профессиональных врачей.

Каждый день врачи помогают множеству пациентов с различными потребностями, используя разнообразные методы лечения. Для оптимальной помощи им важно иметь доступ к предыдущим медицинским записям своих пациентов и быть в курсе современных методов лечения. Взаимоотношения между врачом и пациентом также играют ключевую роль в процессе лечения. Кратко говоря, профессия врача требует множества усилий и знаний.

С другой стороны, слияние искусственного интеллекта с медициной продвигается стремительно. Примером этого является Google Med-Gemini, семейство передовых моделей искусственного интеллекта, специализирующихся в области медицины.

Примечательной особенностью Google Med-Gemini является возможность работы с длинным контекстом, что улучшает обработку медицинских записей и исследовательских статей. Это позволяет моделям делать последовательные выводы на основе больших объемов данных, таких как часы видео или десятки часов аудио. Кроме того, все модели искусственного интеллекта являются мультимодальными: они могут обрабатывать текст, изображения и видео.

Семейство Med-Gemini, как следует из названия, основано на существующих моделях Gemini, но имеет некоторые улучшения, специализированные на медицине. В Med-Gemini представлены четыре разные модели: Med-Gemini-S 1.0, Med-Gemini-M 1.0, Med-Gemini-L 1.0 и Med-Gemini-M 1.5.

Кроме того, в Google Med-Gemini включен доступ к веб-поиску, что способствует улучшению клинического мышления. Также Med-Gemini проходит обучение на базе MedQA - набора вопросов с несколькими вариантами ответов, представляющих собой вопросы экзамена на медицинскую лицензию США (USMLE), разработанные для проверки медицинских знаний и суждений.

Превосходит GPT-4 по всем критериям

Med-Gemini смогла превзойти самую передовую модель OpenAI, GPT-4, по всем 14 медицинским критериям, на основании которых она была протестирована. Она получила самую высокую оценку по 10 из этих критериев, что означает, что в некоторых аспектах превзошла человеческих врачей. В частности, сообщается, что модель Med-Gemini-L 1.0 работает на 4,5 процента лучше, чем ее предшественник Med-PaLM 2, достигая точности на уровне 91,1 процента в MedQA (USMLE).

Кроме того, Med-Gemini превзошла GPT-4 в среднем на 44,5 процента в семи мультимодальных тестах, включая NEJM, который включает в себя изображения сложных клинических случаев. Модель также успешно справилась с проверкой MIMIC-III, большой общедоступной базы данных, содержащей обезличенные данные о состоянии здоровья пациентов, поступивших в отделения интенсивной терапии.

Несмотря на то что у модели есть недостатки, такие как орфографические ошибки и сокращения, которые могут увеличить количество ошибок, исследователи отмечают, что она успешно справляется с поставленными задачами. Тем не менее, по мнению ученых, Med-Gemini в своем текущем виде представляет собой лишь «многообещающее» исследование, и дополнительные исследования необходимы для его дальнейшего развития. Однако все согласны в том, что даже в текущем виде этот инструмент может значительно сэкономить время врачей.