Прогнозування метаболічно асоційованої стеатотичної хвороби печінки (МАСХП) за допомогою зрозумілих моделей машинного навчання
Дата публікації: 28.11.2025
Автори: Відкриті джерела , Редакція платформи «Аксемедін»
Ключові слова: метаболічний синдром, стеатоз печінки, фіброз печінки, MASLD, MASH, МАСХП
Метаболічно асоційована стеатотична хвороба печінки (МАСХП) є одним із найпоширеніших хронічних захворювань печінки у світі, і її поширеність невпинно зростає разом зі збільшенням частоти ожиріння, інсулінорезистентності та цукрового діабету 2 типу. У значної частини пацієнтів МАСХП прогресує до запального варіанту — МАСГ — який асоціюється з фіброзом, цирозом та гепатоцелюлярною карциномою.
При цьому хвороба тривалий час перебігає безсимптомно, а більшість випадків залишаються недіагностованими. Еластографія або МРТ дозволяють точно визначати ступінь стеатозу і фіброзу, але ці методи недоступні для масового скринінгу. У клінічній практиці часто використовують індекси, такі як FSI, FLI або HSI, однак їх діагностичні можливості є обмеженими.
Технології машинного навчання відкривають новий підхід до персоналізованого прогнозування МАСХП, дозволяючи знаходити важливі ознаки, моделювати складні нелінійні зв’язки й створювати ефективні інструменти скринінгу на основі рутинних клінічних даних. Важливою перевагою методів нового покоління є можливість пояснення результатів моделі, зокрема за допомогою алгоритму SHAP, що забезпечує прозорість і підвищує довіру лікарів до таких інструментів.
Метою цього дослідження було створення та валідація пояснюваної моделі прогнозування МАСХП, яка ґрунтується на доступних клінічних параметрах і може бути інтегрована в реальну медичну практику.
Методи
У дослідженні використано дані національного американського опитування NHANES за 2017–2020 роки. До фінальної вибірки включено 13 436 дорослих учасників. МАСХП визначали за наявністю стеатозу за даними транзієнтної еластографії та щонайменше одного кардіометаболічного фактора ризику, при цьому виключали надмірне споживання алкоголю та інші етіології ураження печінки.
Для моделювання було доступно широкий спектр демографічних, антропометричних та біохімічних показників. З 50 потенційних ознак видаляли ті, що мали надмірну кількість пропущених значень або високу мультиколінеарність. Дані поділили на тренувальну (70%), внутрішню (20%) та зовнішню (10%) валідаційні вибірки з однаковою часткою МАСХП.
Було створено шість моделей машинного навчання: логістичну регресію, дерево рішень, метод k-ближчих сусідів, випадковий ліс, опорні вектори та XGBoost. Для кожної моделі виконувалася оптимізація гіперпараметрів і крос-валідація. Найкращу модель визначали за площею під ROC-кривою. Далі проводили відбір оптимальної кількості ознак методом рекурсивного виключення ознак. Для пояснення моделі використовували алгоритм SHAP, який дозволяє як оцінити найбільш вагомі ознаки загалом, так і продемонструвати внесок кожної ознаки в прогноз конкретного пацієнта.
Результати
У всіх трьох вибірках частка МАСХП становила близько 35%, і не виявлено статистично значущих відмінностей між групами, що підтверджує коректність розподілу. Серед усіх моделей найвищу точність продемонстрував випадковий ліс. Внутрішня валідація дала AUC 0,928, а зовнішня — 0,918, що значно перевищує показники логістичної регресії, дерева рішень, SVM та інших алгоритмів. Модель також мала високі значення PR-AUC — 0,876 і 0,863 відповідно.
Подальший аналіз дозволив сформувати компактну модель із десяти найбільш інформативних ознак, які майже повністю відтворюють точність повної моделі з 50 змінними. До фінальної версії увійшли: наявність ожиріння, співвідношення талії до зросту, вік, рівень тригліцеридів, глюкоза натще, вживання алкоголю, куріння, рівень С-реактивного білка, концентрація сироваткового заліза та рівень сечової кислоти. Така модель зберегла AUC на рівні 0,928, що робить її придатною для широкого використання навіть у первинній ланці.
Порівняння з існуючими скринінговими індексами показало істотну перевагу машинного навчання: різниця AUC між новою моделлю і FSI, FLI та HSI становила від 0,195 до 0,234, що є статистично значущим.
Алгоритм SHAP продемонстрував, що на прогноз найбільше впливають рівень тригліцеридів, наявність ожиріння, С-реактивний білок, глюкоза натще та співвідношення талії до зросту. Пояснення на індивідуальних графіках показало, як конкретні значення кожної ознаки зміщують прогноз на користь або проти наявності МАСХП. Це робить модель не лише точною, а й прозорою для клініцистів, що суттєво підвищує її цінність для практичного застосування.
Обговорення
Отримані результати підтверджують, що методи машинного навчання можуть значно підвищити ефективність скринінгу МАСХП порівняно з традиційними індексами ризику. Висока точність моделі, а також доступність використаних ознак роблять її особливо цінною для первинної ланки медичної допомоги, де інструментальні методи можуть бути недоступними.
Важливо й те, що SHAP-пояснення усувають одну з ключових перешкод у впровадженні ML-моделей — їхню «непрозорість». Лікар може обґрунтувати пацієнтові, на чому базується прогноз, та використати інформацію як аргумент для зміни способу життя або подальшої діагностики.
Дослідження має певні обмеження. Його поперечний дизайн не дозволяє визначити причинно-наслідкові зв’язки. Всі дані походять із США, тому модель може потребувати додаткової калібрації перед застосуванням в інших країнах. Крім того, як і будь-яка ML-модель, вона потребує оновлення при появі нових даних.
Висновки
У ході дослідження створено та валідовано високоточну модель прогнозування МАСХП на основі рутинних клінічних параметрів. Випадковий ліс у поєднанні з десятьма ключовими показниками продемонстрував високу точність і перевершив існуючі скринінгові індекси. Функція SHAP забезпечила прозорість і клінічну інтерпретованість моделі.
Запропонований підхід може стати ефективним інструментом для раннього виявлення МАСХП та оптимізації маршруту пацієнтів, однак потребує проспективної перевірки у різних популяціях.
ДЖЕРЕЛО: Mdpi
На платформі Accemedin багато цікавих заходів! Аби не пропустити їх, підписуйтесь на наші сторінки! Facebook. Telegram. Viber. Instagram.
Щоб дати відповіді на запитання до цього матеріалу та отримати бали,
будь ласка, зареєструйтеся або увійдіть як користувач.
Реєстрація
Вхід
Матеріали з розділу
Ризик хвороби Паркінсона серед пацієнтів і ...
Клінічна загадка: Біль в нозі у дитини
Вплив дієти та ожиріння на розвиток хроніч ...
Перспективний противірусний засіб широкого ...
Дослідження пропонують нове розуміння того ...
Від НАЖХП до МАСХП: сучасна трансформація ...

