تجارت الکترونیکی در حال پیشرفت است و همگام با این پیشرفت ، شرکت ها علاقه بیشتری دارند تا در زمینه پیشرفت تجارت آن لاین (ONLINE) سرمایه گذاری کنند . در کتاب COMMERCE SOFTWARE TAKESOFF ، نویسندگان تحقیق forrester نوشتند که در سال 1999 تجارت آن لاین در زمینه خرده فروشی مصرف کننده حدود 3/20 میلیارد دلار بوده است و پیش بینی شده است که تا سال 2003 به بیش از 144 میلیارد دلار برسد . حدود 2500 شرکت جهانی در سال 2000 میلادی نسبت به سال 1999 بیش از 72% در زمینه تجارت الکرونیکی سرمایه گذاری خواهند کرد . سایت های موجود از اندازه گیرهای اولیه همچون تعداد بازدید صفحات استفاده می کنند اما نیاز برای تحلیل و خصوصی سازی با توجه به نیاز های متفاوت روز به روز افزایش می یابد . در کتابMeasuring websuccess نویسندگان ادعا می کنند که افراد پیشرو از واحدهای متدی برای ایجاد خصوصی سازی استفاده می کنند و اینکه شرکت ها به هوش شبکه نیاز دارند نه به تحلیل موارد ثبت شده .
ابزار data mining به کشف الگوهای داده ها کمک می کنند . تاکنون شرکتها یی که بر روی ساختار افقی وسایل الگو ساز data mining متمرکز شده بودند ، پیشرفت تجارت کمی داشتند . میزان خرید بسیاری از شرکت ها بدین قرار است : دریافت علوم فشرده توسط Gentia در حدود 3 میلیارد دلار ، هماهنگی بسیار بالا توسط yahoo در حدود 3/2 میلیون دلار ، معتدل سازی به وسیله spss در حدود 7 میلیون دلار و ماشین های متفکر بوسیله oracle در حدود چیزی کمتر از 25 میلیون دلار افزایش یافته اند . KD1 توسط Net Perception در حدود 116 میلیون دلار به دست امد . right point که قبلاً نام data mind داشت توسط E.Piphany برای حدود 400 میلیون دلار و Nero vista توسط Acro برای حدود 140 میلیون دلار به دست آمده است . تغییر این ارزیابی ها تاکید می کند که باید توجه بیشتری را بر ارزش تکنیک های الگو سازیdata mining در زمینه تجارت الکترونیکی داشته باشیم .
تجارت الکترونیکی یک حوزه موثر برای data mining است. این روش ایده ال است زیرا بسیاری از مواد مورد نیاز برای data mining موفق به راحتی به دست می آید : ثبت داده ها بسیار متعدد است، مجموعه الکترونیک داده های قابل اطمینان را فراهم سازد، افکار به راحتی به مرحله اجرا در می آید و بازگشت سرمایه اندازه گیری می شود. اگر چه برای پیشرفت در این حوزه، باید data mining در سیستم های تجارت الکترونیکی با پل های انتقال داده ها از سیستم پردازش گردش کار به محل انبار داده ها و بر عکس مجتمع شود. چنین ترکیبی به طور قابل توجهی زمان آماده سازی داده ها را کاهش می دهد که طی تحقیقات بدست آمده حدود 80 درصد زمان تکمیل یک تحلیل را بر عهده می گیرد. یک راه حل تلفیقی همچنین می تواند برای کاربران یک رابطه مستقیم بین کاربر و پردازش کامل فوق داده ها را ایجاد کند.
این تحقیق بر اساس مواردی که بعدا ذکر خواهد شد، شکل گرفته است. بخش 2 معماری تلفیقی را توصیف می کند و در مورد اجزای سازنده مهم و پل هایی که آنها را به هم وصل می کنند توضیح می دهد. بخش 3 به تفصیل در مورد جمع آوری داده ها صحبت می کند. یعنی باید داده های بیشتری را نسبت به فایل های ثبتی سرویس دهنده شبکه تاکنون مورد استفاده بوده اند، جمع آوری کرد. بخش 4 در مورد اجزای تحلیل گر صحبت می کند که باید طیف وسیعی از وسایل انتقال داده ها و وسایل آنالیز کردن را فراهم کرد. و در ارتباط با بعضی از مشکلات چالش انگیز در بخش 5 صحبت خواهیم کرد. و در بخش 6 با یک جمع بندی مطلب را به پایان خواهیم برد.
معماری تلفیقی :
در این بخش ما در مورد معماری مورد نظر یک بازبینی کلی در زمینه سیستم تجارت الکترونیکی با استفاده از data mining تلفیقی خواهیم داشت. از جزئیات بخش های بسیار مهم معماری و سودمندی آنها در بخش های بعدی بحث خواهیم کرد. این سیستم که در مورد آن شرح دادیم یک معماری ایده آل است که براساس تجارب ما در شرکت نرم افزاری Blue martini بدست آمده است. اگر چه ما هیچ گونه ادعایی نداریم که هر آنچه در اینجا توضیح داده می شود آنرا در شرکت خود اجرا کرده ایم. در معماری مورد نظر ما سه جزء بسیار مهم وجود دارد : تعریف داده تجاری، تاثیر متقابل خریدار و آنالیز. برای اتصال چنین اجزایی سه پل انتقال داده وجود دارد : stage data, deploy Results و customer Interaction. رابطه بین شرکت ها و پل های انتقال داده ها در شکل 1 نشان داده شده است. سپس هر یک از اجزای معماری و پل هایی که این اجزا را به هم متصل می کنند در موردشان توضیح می دهیم.