***2
■جریان داده
■بسیاری از برنامه های کاربردی نوع داده جدیدی به نام جریان داده را تولید و تحلیل می کنند که در آن داده ها به صورت پویا به یک بستر ( یا پنجره ) وارد و یا از آن خارج می شوند .
■خواص جریان داده :
■حجم زیاد و گاه نامحدود
■تغییرپویا
■جریان به درون و خارج با یک ترتیب مشخص
■پیمایش یکبار یا تعدا د محدود
■نیازمند زمان پاسخ سریع ( اغلب بلادرنگ )
■ممکن است دارای چندین منبع باشند .
***4
■در جریان داده تعدادی یا همه داده های ورودی که باید روی آنها عملیات انجام شود روی دیسک یا حافظه اصلی قرار ندارند و بیشتر به صورت جریان داده پیوسته می رسند .
■جریان داده ها از داده های ذخیره شده در موارد زیر متفاوت اند :
■عناصر داده ها به صورت بر خط می رسند .
■سیستم هیچ گونه کنترلی روی ترتیب عناصر دادهای ( روی عناصر جریان یا جریانهای دادهای ) ، که جهت پردازش میرسند ، ندارد .
■جریانهای داده ای به صورت ذاتی از نظر اندازه نامحدود هستند .
■یک عنصر از جریان داده پس از پردازش یا نادیده در نظر گرفته می شود یا آرشیو می شود .
***5
■دادهکاوی
■دادهکاوی استخراج اطلاعات مفید و دانش از حجم زیاد داده ها است .
■تکنیک هایی دادهکاوی :
■تحلیل قواعد وابستگی : کشف قواعد وابستگی است که هر قاعده وابستگی به صورت جفت صفت- مقدار هایی است که اغلب با هم در یک مجموعه داده اتفاق می افتند .
■کلاسهبندی : فرایند یافتن مجموعه مدلهایی است که کلاس های داده را توصیف و مشخص میکنند تا بدین وسیله بتوان کلاس اشیایی را که نامشخص است مشخص کرد .
■تحلیل خوشه ها : اشیا بر اساس قاعده " زیاد کردن شباهت بین عناصر کلاس و کم کردن شباهت بین کلاس ها " ، اشیا را به خوشه هایی تقسیم می کند . اشیا داده ای موجود در یک خوشه بیشترین شباهت را با هم دارند و با اشیا سایر خوشه ها بسیار متفاوت هستند .
***6
■دادهکاوی روی جریان داده ها
■دادهکاوی جریان داده ها یک فرایند بلادرنگ استخراج الگوهای جالب توجه از جریان داده ها است .
■برای مثال ممکن است بخواهیم ورود به حریم شبکه کامپیوتری را بر اساس جریان غیر عادی پیام ها شناسایی بکنیم که از طریق مقایسه الگوهای تکرارشونده فعلی با یک زمان قبلی ، قابل کشف است .