В недавнем исследовании, опубликованном исследователями из Google DeepMind на сервере предварительных публикаций arXiv, представлена новая модель искусственного интеллекта, разработанная специально для применения в медицине. В ходе испытаний технология доказала свою эффективность, ставя диагнозы на основе диалогов с пациентами и оказывая ценную помощь врачам при проведении некоторых анализов. В этих задачах она даже превзошла OpenAI серии GPT-4.
Gemini — самая продвинутая модель ИИ в Google DeepMind. Доступная в нескольких версиях, она способна обрабатывать и интерпретировать данные в различных форматах, включая текст, изображения, видео и аудио. Осознавая революционный потенциал ИИ в медицинском секторе, исследователи Google создали Med-Gemini — версию Gemini, специально адаптированную и усовершенствованную для применения в медицине. Этот новый ИИ показал многообещающие результаты в ходе первых испытаний, хотя для его безопасного и эффективного применения все еще требуются дальнейшие исследования.
Система, обученная с помощью MedQA
Для обучения Med-Gemini была использована MedQA — многоязычная база данных вопросов с несколькими вариантами ответов, взятых из экзамена на получение медицинской лицензии США (USMLE), в котором проверяются клинические навыки врачей, проходящих обучение. Эта база данных содержит десятки тысяч вопросов на трех языках: более 12 700 на английском, около 34 200 на упрощенном китайском и 14 100 на традиционном китайском.
Чтобы расширить возможности модели, Google разработала два расширения для этой базы данных. Первое, MedQA-R (R — «рассуждение»), представляет собой расширение MedQA, включающее генерируемые объяснения рассуждений, называемые «цепочками мыслей», с подробным объяснением каждого ответа. Вторая, MedQA-RS (RS — «рассуждение и поиск»), позволяет модели проводить веб-поиск и использовать его результаты для повышения точности своих ответов. В тестах MedQA Med-Gemini достигла впечатляющей точности в 91,1%. Это позволило превзойти OpenAI в серии GPT-4.
Хорошее понимание больших наборов данных
Исследователи также сосредоточились на улучшении способности Med-Gemini обрабатывать и анализировать огромные массивы сложной медицинской информации. Чтобы проверить эту способность, они использовали большую публичную базу данных, содержащую анонимные медицинские записи.
В рамках эксперимента было подготовлено около 200 наборов данных из этого источника, каждый из которых содержал от 200 000 до 700 000 слов. Задача Med-Gemini состояла в том, чтобы определить и извлечь из этих наборов точную информацию, такую как конкретные медицинские состояния и симптомы. После извлечения информации ИИ должен был оценить ее релевантность, классифицировать и определить, отражает ли она историю болезни пациента, связанную с данным заболеванием или симптомами. По словам исследователей, эксперимент дал хорошие результаты.
Успешные практические испытания
Med-Gemini также был протестирован на практике, что продемонстрировало его полезность и мультимодальные возможности в реальном медицинском контексте. В первом сценарии пациент использовал модель, чтобы получить консультацию по поводу кожного нароста, который вызывал у него зуд. Модель попросила пациента предоставить изображение этого образования для более точной оценки. Получив изображение, Med-Gemini задал дополнительные вопросы, чтобы уточнить диагноз. Ему удалось правильно диагностировать редкое поражение и дать рекомендации по дальнейшим действиям.
В другом испытании Med-Gemini использовалась врачом для интерпретации рентгеновского снимка грудной клетки до того, как было получено официальное заключение рентгенолога. Модель не только дала интерпретацию снимка, но и сформулировала упрощенную версию заключения на понятном для пациента языке.
Несмотря на полученные результаты, исследователи признают, что для улучшения возможностей Med-Gemini в области клинических бесед необходимы дальнейшие исследования. Цель состоит в том, чтобы обеспечить надежность и эффективность модели во всех сценариях использования в медицине.