***2
■کلاسه بندی
■فرایندی دو مرحله ای است :
■ساخت مدل :
■تحلیل یک مجموعه آموزشی که مجموعهای از تاپلهای پایگاه است و مشخص کردن برچسب کلاسهای مربوط به این تاپلها .
■ یک تاپل X با یک بردار صفت X=(x1,x2,…,xn) نمایش داده میشود . فرض می شود که هر تاپل به یک کلاس از پیش تعریف شده متعلق است .
■هرکلاس با یک صفت که به آن صفت برچسب کلاس میگوییم مشخص میشود .
■ مجموعه آموزشی به صورت تصادفی از پایگاه انتخاب می شود .
■به این مرحله ، مرحله یادگیری نیز می گویند .
■استفاده از مدل :
■از طریق یک تابع y=f(X) برچسب کلاس هر تاپل X از پایگاه را پیش بینی می شود .
■این تابع به صورت قواعد کلاسهبندی ، درختهای تصمیم گیری یا فرمولهای ریاضی است .
***3
■درخت های تصمیم گیری
■یکی از روش های کارآمد و با کاربرد گسترده کلاسه بندی است .
■مدل حاصل از این روش به صورت درختهای تصمیم گیری است :
■هر گره در این درخت نشان دهنده یک آزمون بر روی یک صفت است .
■هر شاخه خارج شونده از یک گره نشان دهنده خروجی های ممکن آزمون است .
■هر برگ نشان دهنده یک برچسب کلاس است .
■نحوه استفاده از درخت تصمیم گیری :
■اگر تاپلی چون X که برچسب کلاس آن نامشخص است داشته باشیم صفات این تاپل در درخت مورد آزمون قرار می گیرند و یک مسیر از ریشه به سمت یک برگ که برچسب یک کلاس را دارد ایجاد می شود .
***6
الگوریتم برای درخت های تصمیم گیری
***7
■چالش ها
■روش های ساختن درختان تصمیم گیری فرض می کنند که تمام مجموعه آموزشی به طور همزمان می تواند در دیسک ذخیره شود .
■روش های مذکور بصورت پیاپی مجموعه آموزشی را از دیسک می خوانند .
■هدف : طراحی درخت های تصمیم گیری که هر نمونه آموزشی را فقط یکبار بخواند زمان کوتاه ثابتی را برای پردازش آن صرف کند .