MGERM - идеальное решение для медицинских центров, участвующих в научно-исследовательских работах.
Медицинские центры за годы работы накапливают огромное количество специализированных данных. Эта ценнейшая информация для научных исследований часто не используется или используется не полностью. Обрабатывать ее вручную – это долгий кропотливый труд, который затрудняет анализ и не может обеспечить точного результата.Современные технологии предлагают новые возможности для развития науки. Все записи, которые вводятся в систему врачами, лаборантами и другими сотрудниками ЛПУ, хранятся в формализованном виде в специальных таблицах. В таком виде информация наиболее доступна для научных исследований.
Гибкость структуры электронной истории болезни достигается за счет наличия конструктора форм. Этот инструмент позволяет добавлять в историю пациента объективные параметры оценки эффективности лечения, например, медицинские шкалы, размеры патологических образований в шаблонах исследований, лабораторные показатели. Для научных данных в истории можно создавать дополнительные разделы. Конструктор форм позволяет легко создавать поля с обязательным выбором вариантов ответа из настраиваемых словарей, при этом данные в таблицах сохраняются в виде соответствующей значению цифр.
По указанию руководства клиники, записи с дополнительными параметрами можно сделать обязательными для заполнения. Правильно настроенная электронная история болезни позволяет собирать данные для научных исследований параллельно ведению основной медицинской документации и накапливать огромные массивы данных для анализа или предварительного отбора интересующей группы пациентов для последующего углубленного исследования.
Для поиска интересующих групп пациентов удобен параметрический поиск. Для этих целей используются вторичные таблицы, данные в которых обновляются ночью, поэтому поиск пациентов с нужными параметрами происходит моментально. Для сбора и анализа научных данных можно также использовать сервер резервного хранения данных. Стоит отметить, что информация о процессе лечения пациента также формализована: лист назначений, суммарное количество лекарственных препаратов, динамика изменения дозировок, количество проведенных процедур, интенсивность облучения - все данные доступны в табличном виде.
Благодаря высокому уровню формализации данных можно получить выборку интересующих данных в табличной форме. Результат выгружается в табличной форме для дальнейшей обработки статистических программ. Еще недавно это казалось фантастикой. Исследователям приходилось иметь дело с огромным количеством бумажных носителей и вводить данные в таблицы вручную.
Традиционные статистические методы (факторный анализ, дисперсионный и дескриптивный анализ, корреляционный и регрессионный анализ, компонентный анализ, анализ временных рядов, анализ выживаемости) уже успешно применяются для анализа данных, хранящихся в базах MGERM.
Использование методов Data Science и Data mining для анализа медицинских баз данных имеет большой научный потенциал. В отличии от традиционной парадигмы, предполагающей проверку гипотезы статистическими данными, использование Data Mining (различные методы классификации, моделирования и прогнозирования, основанные на применении деревьев решений, генетических алгоритмов, искусственных нейронных сетей,ассоциативной памяти, кластеризация) предполагает поиск скрытых закономерностей в массивах данных. К сожалению, использование вышеописанных методов ограничено из-за недостатка современных баз данных, пригодных для анализа. Мы надеемся, что использование MGERM поможет изменить ситуацию и готовы консультировать наших клиентов по поводу возможностей нашей МИС для структурирования данных, а также настраивать системы параметрического поиска в рамках программы технической поддержки.
Интересным направлением являются методы Text mining и семантический анализ, предполагающие анализ текстов, особенно в областях медицины, где превалируют текстовые описания, например в психиатрии. С точки зрения многих исследователей эти данные не представляют интереса, так как там нет цифр для статистического анализа. Однако они ошибаются, текст можно преобразовать в массив цифр. В MGERM большинство разделов обычной истории болезни также формализованы, например, анамнез жизни разбит на смысловые параграфы: Мать Отец, Раннее развитие, Семейная обстановка, Особенности воспитания, Дошкольный период, особенности характера, Возраст поступления в школу, Отношение к школе, Успеваемость, Предпочтения в учебе, Школьные интересы и увлечения, Подростковый период, Служба в армии, Образование, Трудовой анамнез, Отношения с окружающими (на работе, учебе), Семейный анамнез, Отношение со значимыми близкими, Информация о детях, Особенности характера, Вредные привычки.Таким образом получается, что если нас интересует именно семейная обстановка в детстве пациента, мы можем анализировать текст, имеющий отношение именно к этой части анамнеза. Важно, что к каждому полю врач может формировать набор подсказок - стандартных фраз, которые потом можно одним кликом выбрать из списка, то есть текст в каждом параграфе с большой долей вероятности будет состоять из похожих фраз и предложений и мы имеем список таких фрагментов текста и можем проверить смысловой параграф на их наличие и степень сходства. В ряде случаев, например, анализируя жалобы, мы можем предположить, что пациент будет в первую очередь жаловаться на то, что больше всего его беспокоит - обладает наибольшей субъективной значимостью и ранжировать каждую жалобу от 1 до 0 в зависимости от этого. Посмотреть результат такого анализа можно в файле excel.
Приведенный анализ приведен для демонстрации, в реальном исследовании в таблицу можно добавить еще множество параметров, например данные психометрических шкал. В таблицу отобраны только те случаи, где параметр значимости жалобы на головокружение больше 0.8 (беспокоит больше всего). Обратите внимание, что в выборку в основном попали пациенты с диагнозом F06.6 Органическое эмоционально лабильное [астеническое] расстройство, а также с паническим расстройством, при этом у первой группы пациентов часто встречается жалобы на головные боли. Мы можем использовать алгоритм нейронных сетей и обучить компьютер постановке предварительного диагноза, анализируя текст истории болезни. Безусловно подобное заключение на заменит мнение врача, однако их расхождение может говорить, что диагноз врача недостаточно обоснован или сигнализировать о необходимости дифференциальной диагностики. Анализ динамики изменения жалоб в дневниках может служить индикатором эффективности лечения вместе с показателями психометрических шкал. Кластерный анализ (для определения группирующихся симптомов) результатов семантического анализа жалоб и психического статуса и последующая классификация конкретных случаев, поможет определить к какой группе относится пациент. Возможно, анализ динамики заболевания покажет, что принадлежность к определенным кластерам является важным предиктором улучшения или ухудшения состояния пациента. Машина анализирует десятки тысяч случаев, поэтому ее оценка может быть точнее интуиции врача.
Одним словом, все возможности, которые дают новые методы исследования и анализа, еще только предстоит осмыслить. Нам было бы интересно услышать Ваше мнение, комментарии, свежие идеи по поводу данной статьи.