چکیده:
پيشرفت شگفت انگيز فن آوري رايانه اي و مجهز شدن بشر به اين ابزار، سبب پيشرفت فوق العاده در كسب و ذخيره سازي داده هاي عددي و همچنين بوجود آمدن پايگاه داده هاي بزرگ در زمينه هاي مختلف شده است. داده هاي تبادلات تجاري، كشاورزي، ترافيك، اينترنت، داده هاي نجومي، جزئيات مكالمات تلفني، داده هاي پزشكي و درمانگاهي مثالهايي از چنين پايگاه داده ها ميباشند. در واقع تكنيكهاي توليد و جمع آوري پايگاه داده ها بسيار سريعتر از توانايي ما در درك و استفاده از آنها رشد كرده است. از اواخر دهة 80 بشر به فكر دستيابي به اطلاعات نهفته در اين داده هاي حجيم، كه با بكار بردن سيستم هاي سنتي استفاده از پايگاه داده ها ميسر نبود، افتاد و تلاشها براي انجام اين كار را شروع كرد.
داده كاوي فرآيندي است كه در آغاز دهة 90 پا به عرصه ظهور گذاشته و با نگرشي نو، به مسئله ی استخراج اطلاعات از پايگاه داده ها مي پردازد.
در سال 1996، اولين شمارة مجلة كشف دانش و معرفت از پايگاه داده ها منتشر شد . در حال حاضر، داده كاوي مهمترين فناوري جهت بهره برداري موثر از داده هاي حجيم بوده و اهميت آن رو به فزوني است.
بانک ها به منظور تعیین ریسک اعتباری و ارائه خدمات مالی به مشتریان خود نیازمند شناسایی دقیق آن ها هستند. مدل های اعتبارسنجی می توانند در این زمینه به پشتیبانی از بانک ها بپردازند. درختان تصمیم گیری به عنوان یکی از تکنیک های داده کاوی کاربرد زیادی در اعتبارسنجی مشتریان بانک ها و اعطای تسهیلات اعتباری به آنها دارند. مسئله اصلی شامل دقت طبقه بندی، پیچیدگی، اندازه بیش از حد و عدم انعطاف پذیری درختان تصمیم گیری در طبقه بندی و اعتبار سنجی مشتریان است. هدف از این پژوهش ارائه مدل تلفیقی پیشنهادی برای حل مسائل فوق و بهینه سازی درختان تصمیم گیری با بکارگیری تکنیک های خوشه بندی و الگوریتم ژنتیک است. می توان با انتخاب ویژگی های مناسب توسط الگوریتم ژنتیک و ساخت درختان تصمیم گیری به کاهش پیچیدگی، افزایش انعطاف پذیری و دقت طبقه بندی پرداخت.
در مدل تلفیقی پیشنهادی ابتدا عمل خوشه بندی برروی مجموعه داده اعتباری صورت می گیرد.سپس توسط الگوریتم طبقه بندی متا و الگوریتم انتخاب ویژگی مبتنی بر درخت تصمیم گیری ژنتیکی، درخت تصمیم گیری C4.5 در هر خوشه ساخته می شود. در نهایت با اتخاذ یک استراتژی مناسب، بهترین درختان تصمیم گیری در هر خوشه برای اعتبارسنجی مشتریان انتخاب می شوند. ابزار یادگیری ماشین وکا و نرم افزار GATree برای تحلیل نتایج بکار می رود. نتایج نشان می دهد که مدل تلفیقی پیشنهادی دقت طبقه بندی بالاتری نسبت به اکثر الگوریتم های طبقه بندی مور مقایسه در این پژوهش دارد و مشتریان اعتباری بانک را با پیچیدگی کمتری طبقه بندی می کند.
فهرست مطالب:
چکیده
کلید واژه ها
فصل اول: داده کاوی
مقدمه
داده کاوی چیست؟
تاریخچه داده کاوی
ویژگی های داده کاوی
مزایای داده کاوی
مراحل داده کاوی
عملیات داده کاوی
نرم افزارهای داده کاوی
نمونه های از نرم افزارهای داده کاوی
کاربردهای داده کاوی
کاربرد داده کاوی در بانکداری الکترونیکی
نمونه ای از کاربرد داده کاوی در بانکداری
مراحل عمل داده کاوی از یک پایگاه داده
فصل دوم: داده کاوی و بانکداری
تشریح داده کاوی در بانک
شناسایی و طبقه بندی مشتریان کلیدی
اهمیت دستیابی به رضایتمندی مشتری
فرایند داده کاوی در مدیریت ارتباط با مشتری
استخراج داده
تکنیک های استخراج داده
کاربردهای استخراج داده در بخش بانکداری
تعیین اعتبار مشتریان بانک
مجموعه داده
ریسک اعتباری و اعتبار سنجی
طبقه بندی و درختان تصمیم گیری
خوشه بندی
انتخاب ویژگی ها
الگوریتم ژنتیک
مدل تلفیقی پیشنهادی
آموزش، تست مدل
مقایسه نتایج درخت تصمیم گیری مدل تلفیقی پیشنهادی با سایر درختان تصمیم گیری
فصل سوم: استنتاج
نتیجه گیری
فصل چهارم: پیوست ها
پیوست
فصل پنجم: منابع
منابع
فهرست جدولها
فهرست شکل ها
برچسب ها:
پروژه داده کاوی داده کاوی مشتریان بانکی اعتبار سنجی مشتریان پایگاه داده تسهیلات بانکی داده کاوی تسهیلات بانکی data mining دانلود سمینار ارشد کامپیوتر پروژه خوشه بندی سمینار داده کاوی داده کاوی بانکداری الگوریتم ژنتیک الگوریتم داده کاوی