img 1

توضیحات در مورد پروژه

این کد به زبان پایتون نوشته شده و برای تحلیل داده‌های پزشکی (دیابت، سکته مغزی و فشار خون بالا) و ارزیابی مدل‌های یادگیری ماشین استفاده می‌شود.این کد داده‌های پزشکی را تحلیل کرده، مدل‌های مختلف یادگیری ماشین را روی آن‌ها آزمایش می‌کند و عملکرد آن‌ها را با معیارهای دقت و F1 مقایسه می‌کند. نتایج به صورت جدول و نمودارهای بصری ارائه می‌شوند تا درک بهتری از عملکرد مدل‌ها به دست آید.

پیش‌نیازها

  • pandas: کتابخانه‌ای برای مدیریت و تحلیل داده‌های جدولی (مثل فایل‌های CSV یا اکسل).
  • seaborn: کتابخانه‌ای برای تجسم‌سازی آماری، مبتنی بر matplotlib، با نمودارهای جذاب.
  • matplotlib: کتابخانه‌ای برای رسم نمودارهای پایه (مثل پراکندگی، هیستوگرام).
  • plotly: کتابخانه‌ای برای تجسم‌سازی تعاملی با نمودارهایی که در مرورگر نمایش داده می‌شوند.
  • scipy: کتابخانه‌ای برای محاسبات علمی، شامل ابزارهای آماری، بهینه‌سازی، و پردازش سیگنال.
  • scikit-learn: برای پیش‌پردازش داده‌ها (مثل مقیاس‌بندی).
  • catboost: کتابخانه گرادیان بوستینگ با پشتیبانی از داده‌های متنی.
  • xgboost: کتابخانه گرادیان بوستینگ با عملکرد بالا.