K-MEANS ASOSIDA KLASTERLASH ORQALI IMBALANCED MA’LUMOTLAR TO‘PLAMINI BALANSLASH VA TIBBIY KLASSIFIKATSIYA UCHUN TAYYORLASH

Authors

  • Sariyev Shohruh Norqo‘zi o‘g‘li Author

Keywords:

imbalanced data, K-Means, ma’lumotlarni balanslash, HistGB, LightGBM, AutoGluon.

Abstract

Tibbiyotda amaliy mashinaviy o‘qitish modellarining samaradorligi ko‘pincha ma’lumotlar to‘plamining balansiga bog‘liq. Qandli diabetni erta aniqlash vazifasida ko‘plab ma’lumotlar to‘plamlari imbalanced ya’ni sinflararo nomutanosiblikka ega bo‘lib kam uchraydigan sinf prediabet to‘g‘ri klassifikatsiya qilinmaydi. Ushbu maqolada 0: sog‘lom 20 000, 1: prediabet 4604, 2: diabet 10 000 kabi sinflardan iborat imbalanced tibbiy ma’lumotlar to‘plami K-Means algoritmi yordamida klasterlash asosida balanslanib prediabet sinfi asos sifatida tanlanib har bir sinfdan 4604 ta namunani klasterlar bo‘yicha tanlash orqali yangi balansli ma’lumotlar to‘plami shakllantirildi. Yondashuv statistik vizual va amaliy jihatdan baholanib samaradorligi ko‘rsatildi.

Author Biography

  • Sariyev Shohruh Norqo‘zi o‘g‘li

    Sh.Rashidov nomidagi Samarqand davlat universiteti, Samarqand, O‘zbekiston

    sariyevshokhrukh@gmail.com

Published

2025-07-17