داده کاوی(Data Mining)، به مجموعه ای از تکنیکها اطلاق می شود که توسط آنها، دانش پنهان درون داده ها کشف می شود.به عبارت دیگر مدلی بر اساس تمامی داده ها به صورت پویا بدست می آید.داده کاوی از مباحث نوین محسوب می شود که ارتباط تنگاتنگی با علم ریاضیات و شاخه های مختلف مهندسی دارد که البته علوم جغرافیایی و جی آی اس رو هم بایدبه اون اضافه کرد.شاید بهتره بگیم هر شاخه ای از علم که با حجم زیادی از داده ها سروکار داشته باشه به نوعی نیازمند استفاده از روشهای مختلف داده کاوی هست.

 یکی از متداولترین روشهای داده کاوی (CART(Classification and Regression Tree نام داره که درخت تصمیمی ایجاد میکند که به کمک آن می توان مشاهدات آینده را پیش بینی و یا طبقه بندی کرد. این الگوریتم از روش افراز بندی بازگشتی به منظور جداسازی رکوردهای آماده شده به قطعات جداگانه بر اساس حداقل کردن ناخالصی (بیشترین همگنی) در هر مرحله استفاده می کند، گره زمانی خالص محسوب می شود که تمام دادهای گره درون یکی از طبقه بندی های مشخص شده در فیلد هدف قرار بگیرند. فیلد هدف یا پیش بینی شده هم می تواند به صورت یک دامنه و یا یک طبقه تعریف شده باشد.اطلاعات بیشتر در مورد CART در این کتاب آماری وجود داره:

Handbook of Engineering Statistics