توضیحات در مورد پروژه
این کد به زبان پایتون نوشته شده و برای تحلیل دادههای پزشکی (دیابت، سکته مغزی و فشار خون بالا) و ارزیابی مدلهای یادگیری ماشین استفاده میشود.این کد دادههای پزشکی را تحلیل کرده، مدلهای مختلف یادگیری ماشین را روی آنها آزمایش میکند و عملکرد آنها را با معیارهای دقت و F1 مقایسه میکند. نتایج به صورت جدول و نمودارهای بصری ارائه میشوند تا درک بهتری از عملکرد مدلها به دست آید.
پیشنیازها
- pandas: کتابخانهای برای مدیریت و تحلیل دادههای جدولی (مثل فایلهای CSV یا اکسل).
- seaborn: کتابخانهای برای تجسمسازی آماری، مبتنی بر matplotlib، با نمودارهای جذاب.
- matplotlib: کتابخانهای برای رسم نمودارهای پایه (مثل پراکندگی، هیستوگرام).
- plotly: کتابخانهای برای تجسمسازی تعاملی با نمودارهایی که در مرورگر نمایش داده میشوند.
- scipy: کتابخانهای برای محاسبات علمی، شامل ابزارهای آماری، بهینهسازی، و پردازش سیگنال.
- scikit-learn: برای پیشپردازش دادهها (مثل مقیاسبندی).
- catboost: کتابخانه گرادیان بوستینگ با پشتیبانی از دادههای متنی.
- xgboost: کتابخانه گرادیان بوستینگ با عملکرد بالا.