سرطان پستان یکی از سرطان های شایع در ایران بوده و هرگونه اقدام تشخیصی به هنگام در این باره می تواند جان بسیاری از مبتلایان به این سرطان را نجات بخشد. هدف از این پژوهش طبقه بندی داده های نامتوازن مربوط به بانوان مراجعه کننده به کلینیک پژوهشکده سرطان پستان جهاد دانشگاهی به منظور تعیین وضعیت ایشان و طبقه بندی نرمال و یا غیر نرمال بودن پستان مراجعه کنندگان بود. مجموعه داده های نامتوازن یکی از چالشهای پیش روی طراحی سیستمهای پزشکیار برای طبقه بندی و تعیین وضعیت بیمار محسوب می شود که در این پژوهش از روشهای سطح داده برای حل آن استفاده شد. روش بررسی: در این مطالعه برای طبقه بندی دادههای 918 نفر، سه الگوریتم "AdaBoost.M1"،" k تا نزدیکترین همسایه" و "شبکه عصبی احتمالی" به خدمت گرفته شد. از آنجا که داده های این مطالعه نامتوازن بود، برای حل این مساله از روش "بیش نمونه برداری تصادفی کلاس اقلیت"، "زیر نمونه برداری تصادفی کلاس اکثریت" و "بیش نمونه برداری مصنوعی کلاس اقلیت" استفاده شد. به منظور پیاده سازی الگوریتمها از امکانات و ابزارهای نرمافزار "متلب" و "آر" استفاده گردید. همچنین برای ورودی الگوریتمهای طبقهبندی از 60 متغیر مندرج در کاربرگهای شرحِ حال و معاینه فیزیکی مراجعان استفاده شد. معیارهای دقت و F-measure به منظور ارزیابی در مرحله آزمون الگوریتمها مورد استفاده قرار گرفت. یافته ها: بر اساس معیارهای "دقت" و "F-measure"، بهترین عملکرد الگوریتمهای سه گانه این مطالعه در مواجهه با مجموعه داده تولیدشده با روش "بیش نمونه برداری مصنوعی کلاس اقلیت" بود. در این راستا عملکرد الگوریتمهای "AdaBoost.M1"، " k تا نزدیکترین همسایه " و "شبکه عصبی احتمالی" در مواجهه با مجموعه داده مذکور و بر اساس معیارهای "دقت" و "F-measure" به ترتیب عبارتند از: "93.5 و 93.6"، "79.5 و87.7 " و "86 و 91.9" بدست آمد.