Яндекс.Метрика
мы в социальных сетях

Маленькие проблемы больших данных

Big data в медицине: шесть примеров удачного и неудачного использования



Алексей Каменский,

специальный корреспондент Русфонда


Иллюстрация: pixabay.com

Стало общим местом, что так называемые большие данные скоро совершат переворот во врачебной науке. Ведь множество медицинских сведений о множестве людей: результаты КТ-МРТ, генетических и прочих анализов, электронные медицинские карты, данные о работе, образе жизни, любимых блюдах – не могут не помочь в поиске причин болезней и методов лечения. Вопрос в том, когда же совершится этот долгожданный прорыв. Мы подобрали несколько примеров того, на что способны большие данные уже сейчас.

Twitter против лихорадки

Один из самых ранних примеров использования того, что можно с некоторой натяжкой назвать big data, – предсказание вспышек лихорадки денге с помощью Twitter. Лихорадка денге приходит в Бразилию почти ежегодно, как грипп в Россию. Но эпидемии начинаются каждый раз в новом месте. Быстро реагировать не получается: от вспышки заболевания до ответной реакции государственной медицины проходят недели. В 2009 году два бразильских исследовательских института создали программу анализа заболеваемости через твиты. В общем потоке сообщений программа вылавливает слово denge и географические привязки. Анализируя структуру фразы, программа определяет, идет ли речь о персональном опыте автора твита, или он, например, обсуждает политику минздрава в этой сфере. В 2009 году программа проанализировала 2500 твитов и сумела предсказать, в каких районах будут вспышки эпидемии. Работа продолжалась и в следующие годы. В 2017 году группа ученых подвела итог этой твит-диагностики. В 2016 году, например, релевантных твитов со словом denge было 475 тыс., и 74% из них содержали географическую привязку. Исследование подтвердило, что анализ твитов позволяет не только получить экспресс-картину распространения лихорадки, но и предсказать вспышку максимум за два месяца до ее начала. Впрочем, полноценной программы использования этого моря информации в бразильском здравоохранении пока не создано.

Big data и диета

Это исследование об углеводах – чемпион по количеству участников – было опубликовано в августе прошлого года. В первой части объектом наблюдения были 15 400 американцев в возрасте от 45 до 64 лет. Все они ответили на вопросы о своем питании в начале исследования и через шесть лет. Наблюдение же за ними продолжалось 25 лет. В результате выяснилась простая вещь: и бедная углеводами диета (когда организм получает из них меньше 40% энергии), и богатая (более 70%) сокращают продолжительность жизни. Лучше всего золотая середина – получение из углеводов 50–55% энергии. 50-летний участник исследования, потреблявший углеводы в таком разумном количестве, мог надеяться прожить еще 33 года. Бедная углеводами диета обещала гражданину такого же возраста 29 лет жизни. Богатая – 32 года.

Во второй части исследования эти результаты проверялись на большем количестве участников и одновременно изучался вопрос, чем же недостающие углеводы заменить. Количество участников составило 432 тыс. человек из 20 стран. Точнее сказать, это было мета-исследование, объединившее результаты восьми отдельных работ. Вывод: если уж заменять чем-то углеводы, то белками и жирами растительного происхождения (орехи и т. п.), а не животного. Конечно, мысль сама по себе не слишком новая – но тут важна не новизна, а доказательная сила больших данных.

Кишечник в цифрах

То, как следовало бы использовать большие данные, показали японцы. Они изучили риски правосторонней гемиколэктомии – удаления правой части ободочной кишки (ободочная кишка – главная часть толстой кишки). Работа эта очень показательная по обилию данных и по непредсказуемости результата. Исследователи собрали сведения об 1,2 млн случаев хирургического вмешательства в 3500 японских больницах в течение 2011 года и выделили среди них все случаи правосторонней гемиколэктомии. Их оказалось 19 070. Анализ данных доверили компьютеру. Он вычислил уровень смертности (2,3% при обычной операции и 6% — при срочной), а затем на основе записей в историях болезни самостоятельно выделил целых 26 факторов риска (недостаточная свертываемость крови, почечная недостаточность, предшествующие заболевания периферических сосудов, и т. д. и т. п.) и рассчитал вклад каждого из них в исход операции. Авторы заявляют, что их работа, на тот момент не имевшая прецедентов по размеру и строгости подхода, определила на последующие годы пути развития хирургии. Правда, лишь в узком сегменте медицины.

Big data по-русски

Российская компания «Интеллоджик» – типичный представитель еще одного направления в big data: машинного анализа изображений. Чтобы обучить программу находить на КТ опухоль, ей предъявляют очень много изображений, диагноз по которым уже поставлен врачами. Машина постепенно сама начинает понимать что к чему и обучается ставить диагнозы. Главной удачей «Интеллоджика» глава компании Сергей Сорокин назвал диагностику рака легких по КТ, которую компьютер произвел лучше, чем живые врачи. В четырех регионах, выбранных для пилотного проекта, были собраны 1500 томограмм, на которых врачи не увидели нарушений. Программа «Интеллоджика» оказалась более проницательной: на некоторых из этих изображений она обнаружила следы онкозаболеваний. Причем 15 из этих догадок, по словам Сорокина, оказались верными или, по крайней мере, уместными: врачи, посмотрев на эти изображения, сказали, что онкология тут и правда возможна. К сожалению, оценить качество этой работы нелегко: «Интеллоджик» не следила за дальнейшей судьбой пациентов, не знает, проводились ли дополнительные исследования и подтвердилась ли в конечном итоге догадка компьютера. Еще важнее другое: Сорокин не сообщил Русфонду количества ложноположительных результатов (случаев, когда программа заподозрила болезнь, а врач с этим не согласился). Ведь компьютер мог, например, найти онкологические следы на всех 1500 КТ – в этом случае врачи сочли бы заслуживающими внимания всего 1% его догадок. Но Сорокин говорит, что просто забыл эту цифру.

Прощай, слух, здравствуй, депрессия

Очень важный плюс big data – возможность связать между собой параметры, которые обычно анализируют и считают только по отдельности. В январе 2019 года было опубликовано исследование о связи проблем со слухом с другими заболеваниями. Объектом исследования стали 154 414 человек в возрасте 50 лет и старше, обращавшиеся к врачу по поводу ухудшения слуха. Выяснилось, что риск развития у таких людей деменции и депрессии в течение пяти лет после обращения на 50% и 40% соответственно выше, чем у людей, на слух не жалующихся. В дополнение была изучена и финансовая сторона вопроса: если у человека возникли проблемы со слухом, но никаких мер принято не было, то расходы на его лечение в следующие десять лет оказываются на 46% выше, чем в среднем в этом возрасте.

Лечение от IBM: быстро, но с ошибками

Компания IBM усиленно пытается проникнуть в медицину с помощью своего суперкомпьютера IBM Watson. Это мощнейшая машина, состоящая из нескольких десятков серверов и при этом нацеленная на понимание естественного человеческого языка. Медицинский подраздел программы, Watson Health, или – в вольном переводе – доктор Уотсон, пытается добиться от компьютера, чтобы он помогал врачам в принятии решений. Предполагается, что машина, располагающая всей полнотой информации о пациенте и о заболевании, может по крайней мере ускорить этот процесс. Результаты пока двойственные. С одной стороны, как рассказывает сама IBM, при анализе геномной информации, позволяющей точнее определить метод лечения глиобластомы, доктор Уотсон за десять минут проделал работу, на которую живой эксперт потратил бы 160 часов. С другой стороны, недавно стало известно, что суперкомпьютер часто ошибается буквально на ровном месте. Например, при кровотечении советует препарат, который может это кровотечение усилить. По мнению экспертов, дело в том, что при обучении доктора Уотсона в IBM часто использовали не истории настоящих пациентов, а созданные на их основе синтетические образы. В результате знания Уотсона оказались оторванными от реальности. IBM есть над чем поработать, а большим данным есть куда расти.

Подпишитесь на канал Русфонда в Telegram — первыми узнавайте новости о тех, кому вы уже помогли, и о тех, кто нуждается в вашей помощи.

Оплатить
картой
Авто-
платежи
Оплатить
c PayPal
Сбербанк
онлайн
Телефон
Другое

Информация о произведенном пожертвовании поступает в Русфонд в течение четырех банковских дней.

Информация о произведенном пожертвовании поступает в Русфонд в течение четырех банковских дней.

Информация о произведенном пожертвовании поступает в Русфонд в течение четырех банковских дней.

Sberbank Держатели карт Сбербанка России, подключенных к системе «Сбербанк Онлайн», могут сделать пожертвование в Русфонд из своего личного кабинета в системе «Сбербанк Онлайн».

Внимание! Комиссия за проведение платежей через Сбербанк и «Сбербанк Онлайн» не взимается!

Далее

Отправить пожертвование можно со счета мобильного телефона оператора — «Мегафон», «Билайн», МТС или Tele2.

Введите номер своего телефона, а затем сумму пожертвования в форме внизу. После этого на ваш телефон будет отправлено СМС-сообщение с просьбой подтвердить платеж. Большое спасибо!


Информация о произведенном пожертвовании поступает в Русфонд в течение четырех банковских дней.

Для абонентов МТС есть возможность отправить деньги через сайт:

МТС. Легкий платеж

Пожертвовать
с помощью SMS

Скачайте мобильное приложение Русфонда:

App Store

Google Play

Другие способы

Банковский перевод Сбербанк Альфа•банк Кошелек РБК Money Кошелек Web Money Яндекс Деньги

Как помочь из-за рубежа

Pay Pal SMS Банковская карта Банковские реквизиты Система платежей CONTACT
comments powered by HyperComments