Хронические заболевания органов дыхания, такие как бронхиальная астма (БА), относятся к числу наиболее распространенных неинфекционных заболеваний. Неинвазивная диагностика таких заболеваний является одним из важнейших направлений развития современной медицины. К таким методам относится анализ выдыхаемого воздуха. Выдыхаемый воздух представляет собой сложную газовую смесь, содержащую помимо атмосферных газов продукты основного обмена (СО2, Н2О), а также множество газообразных молекул в следовых количествах, некоторые из которых можно использовать в качестве биомаркеров [1, 2].
Ранее в работе [3] было установлено, что сочетание относительно простого и быстрого метода ИК-спектроскопии и возможности идентификации молекул-биомаркеров делает широкополосную квантово-каскадную лазерную спектроскопию привлекательной для исследования диагностического и прогностического потенциала летучих веществ в выдыхаемом воздухе.
Целью настоящего исследования является разработка численных методов решения обратной задачи спектроскопии для определения состава выдыхаемого человеком воздуха.
Экспериментальная установка [4] основана на методе инфракрасной лазерной спектроскопии и предназначена для высокочувствительного спектрального анализа многокомпонентных газовых смесей, чистых веществ и выдыхаемого человеком воздуха.
На рис. 1 представлена принципиальная схема экспериментальной установки. Экспериментальная установка состоит из ИК-квантово-каскадного лазера и кадмий-ртуть-теллурового фотоприемника, охлаждаемого каскадом ячеек Пельтье, и многоходовой кюветы. Квантово-каскадный лазер (LaserTune, Block Engineering) излучает в импульсном режиме с пиковой мощностью до 150 мВт, длительностью импульса около 50 нс и частотой повторения около 1 МГц. Излучение происходит в спектральном диапазоне 5,3...12,8 мкм с шагом перестройки 2 см–1. Размер лазерного луча в поперечном сечении составляет около 2×4 мм2. Расходимость не более 5 мрад, нестабильность мощности около 5 %.
В эксперименте приняли 33 пациента с диагностированной бронхиальной астмой и 60 добровольцев без хронических заболеваний. Разработанные численные методы предназначены для классификации газовых смесей и выявления биомаркеров [5, 6].
В настоящей работе для обработки экспериментальных данных спектров были использованы такие методы машинного обучения, как метод главных компонент и стохастическое вложение соседей с t-распределением. На рис. 2 показан результат применения метода PCA, на рис. 3 – результат применения метода t-SNE для спектров выдыхаемого воздуха. На графиках t-SNE заметно разделение между точками данных, принадлежащих к классу здоровых пациентов и классу больных БА.
В таблице представлены результаты классификации, полученные методами машинного обучения: методом опорных векторов (SVM) и методом ближайших соседей (KNN). Тестовая выборка составляла 10% от всех ИК-спектров. Подбор оптимальных параметров (C = 0.1, n_neihbors = 21) осуществлялся с применением GridSearchCV. Показано, что данные методы обеспечивают высокую точность.
Результаты применения методов машинного обучения
для классификации газовых смесей и выявления биомаркеров
Метод SVM | Метрика | Метод KNN | Метрика | ||||||
Precision | Recall | F1-score | Support | Precision | Recall | F1-score | Support | ||
0 | 1,00 | 1,00 | 1,00 | 73 | 0 | 0,95 | 1,00 | 0,97 | 73 |
1 | 1,00 | 1,00 | 1,00 | 29 | 1 | 1,00 | 0,86 | 0,93 | 29 |
Accuracy | – | – | 1,00 | 102 | Accuracy | – | – | – | 102 |
Примечание: 0 — волонтеры без хронических заболеваний, 1 — пациенты с бронхиальной астмой |
Из представленной на рис. 4 матрицы кросс-корреляций видно, что корреляция Пирсона не позволяет классифицировать испытуемых по спектрам выдыхаемого воздуха. Методы машинного обучения позволяют достичь лучших результатов.
В данной работе инфракрасная лазерная спектроскопия использовалась для анализа выдыхаемого человеком воздуха с целью диагностики бронхиальной астмы. Установлено, что методы машинного обучения эффективны для обработки и анализа спектральных данных. Полученный результат демонстрирует принципиальную возможность разработанных методов для кластеризации спектров больных и здоровых людей, что может найти применение в медицинской практике.