You are currently viewing داده کاوی چیست؟

داده کاوی چیست؟


Data یا همان داده واژه ای که این روز ها بیشتر بر سر زبان ها افتاده است. از داده به عنوان کوچکترین و ساده‌ترین واحد محتوا یاد می کنند. تمامی علائم ها، اعداد و ارقام و آمار هایی که به وسیله پژوهشگران و یا سیستم جمع آوری شده و توضیح و شرح اضافه نداشته باشند، داده محسوب می شوند.
تعریف دیگری که می توان برای داده توصیف کرد« علم استخراج الگو ها، دانش و تحلیل داده های خام از بین مجموعه ای از داده ها را داده کاروی می گویند.»
برخی ها داده و اطلاعات را یکسان می دانند. به طوری که داده دارای محتوای خام و تفسیر نشده است به عبارتی اطلاعات محتوایی گسترده به حساب می آید و داده زیر مجموعه ی اطلاعات می باشد. این دو مبحث معنای کاملا متفاوتی دارند و در ادامه به طور کامل تفاوت داده و اطلاعات را بیان می کنیم. همه این ابهامات در سوال داده کاوی چیست جمع شده که در ادامه این مقاله به آن پاسخ داده ایم.

(داده کاوی استخراج اطلاعات مفید از مجموعه داده های خام و نامفهوم.)


تفاوت داده با اطلاعات

در مطالب قبلی به تفاوت داده و اطلاعات اشاره کردیم تا هیچ گونه ابهامی در این مورد جا نماند. علم داده کاوی شرایطی را ایجاد کرده که می توان با بهره گیری از تلکنولوژی جدید مانند هوش مصنوعی، یادگیری ماشین و… مطابق اهداف تعیین شده، داده ها پنهان را تحیل و استخراج کرد و از آن ها درتصمیم گیری های مهم به کار برد.
یک نکته درمورد داده این که خام و دست نخورده است که می تواند بلا استفاده باشد. گروهی ازاعداد و ارقام نامنظم و بی معنا به عنوان داده در نظرگرفته می شود اما نتایجی که از پردازش این مجموعه به دست می آید همان اطلاعت است و اطلاعات می تواند دوباره به عنوان داده ورودی سیستم به کار گرفته شوند. پس با توجه به این مطالب می توان نتیجه گرفت که به طور کلی ورودی های خام و اطلاعات را داده می نامند.
اگر باز هم به درک درستی از تفاوت داده با اطلاعات نرسیدید و جواب سوال داده کاوی چیست را پیدا نکردید، آن را با یک مثال ساده شرح می دهیم تا به آسانی با داده کاوی اشنا شوید :
نمرات دانش آموزان یک کلاس، داده ها و نتایج پردازش روی این نمرات، میانگین نمرات، افزایش یا کاهش نمرات درسی، نمودارها و…را به عنوان اطلاعات در نظر می گیرند. به عبارتی داده مجموعه ای از امار وداده های خام است که معنایی ندارند و اطلاعات نسخه پیشرفته داده تلقی می شود.
بعد از تحلیل داده ها با هدفی معین، اطلاعات به دست می آید. اطلاعات برخلاف داده که به دلیل داشتن مفهومی کوچک نمی توان دیدگاه های مختلفی از آن به دست آورد. از قابلیت های اطلاعات به این مورد اشاره کرد که هر کسی با هر عقیده و دیدگاهی می تواند برداشت متفاوتی از آن داشته باشد.

کاربرد های داده کاوی


پیش از این اشاره کردیم، داده کاوی اطلاعات مفیدی را از مجموعه داده های خام و نا مفهوم استخراج می کند که این اطلاعات بخش های مختلفی دارند. تا اینجا تقریبا پی بردید که داده کاوی چیست و چه تفاوتی با اطلاعات دارد، در ادامه به چند مورد از کاربرد های داده کاوی پرداخته این تا بتوانید بیشتر از پیش داده کاویرا بشناسید:


۱) شناسایی خودکارالگوها
۲) پیش بینی نتایج
۳)کشف الگوهای میان داده ها
۴) تولید اطلاعات قابل اجرا
۵) تمرکز بر روی مجموعه های داده های بزرگ و پایگاه داده ها
۶) به دست آوردن اطلاعات کاربردی


به نظر من تا اینجای کار دستتان آمده که داده کاوی چیست و چه کاربرد هایی دارد. در حالت کلی داده کاوی به ما کمک می کند تا داده های نامفهوم و بی کاربرد را از مجموعه خود حذف کنیم. علاوه بر این ها اطلاعات موثر و مفیدی را در اختیار ما قرار می دهد و باعث سرعت بخشیدن به فرایند تصمیم گیری می شود.
داده کاوی علاوه بر مواردی که که گفته شد دربانکداری، خرده فروشی، شبکه های اجتماعی پرکاربرد است. و یا یک مثال جالب و علمی دیگر درباره داده کاوی میتوان به یوتیوب استفاده اشاره کرد. همانطور که می دانید یوتیوب فضای اشتراک انواع ویدیو است. حتما می دانید که پیش از پخش ویدیوی موردنظر، تبلیغات چند ثانیه ای پخش می شود. اگر به محتوای این تبلغات دقت کنید، قطع به یقین یک تبلیغ از بین این تبلیغات مطابق علافه و خواسته های شما خواهد بود و یا اگر وارد حساب کاربری خود در گول شدید تبلیغاتی برای شما به نمایش میگذارد که عینا با علاقه شما مرتبط است.
آیا تا بحال به این موضوع فکر کرده اید که گوگل از کجا تشخیص می دهد که شما به دنبال چه چیزی هستید؟ پاسخ سوال این است که گوگل به وسیله موتور جستجوی خود و تاریخچه جستجوی شما می تواند به سایت هایی که بیشتر از آن ها بازدید می کنید، دسترسی داشته باشد و به علایق و سلایق شما در موضوعات مختلف پی می برد. همه این موارد داده های خام و نامفهومی هستند که از نظر ما کاربرد چندانی ندارند.
اما گوگل به کمک الگوریتم های به روز داده کاوی می تواند اطلاعات خوبی را از داده هایی که از شما دارد، به دست آورد. به همین دلیل این غول جستجو به راحتی می تواند به علایقتان پی ببرد و از این اطلاعات شخصی در تبلیغات خود استفاده کند. این کار در کمال ناباوری به افزایش درآمد گوگل کمک زیادی کرده و خواهد کرد. این مورد یکی از ساده ترین کاربرد های داده کاویست که برای شما توضیح دادیم.


مدل سازی در داده کاوی


درفرایند داده کاوی ابعاد مختلفی وجود دارد که درک اهداف پروژه و راه اندازی و انجام تغییرات لازم را شامل می شود. این فرایند در سه گام انجام می شود:
• یادگیری مدل
• ارزیابی مدل
• استفاده از مدل
این تقسیم بندی ها در داده کاوی جزتقسیم بندی های منظم و کاربردی محسوب می شود. مدل یادگیری زمانی کاربرد دارد که یک الگوریتم بر روی گروه یا کلاسی از داده ها که دارای مقدار رده بندی کننده هستند اجرا و یا بررسی داده ها، الکوریتم تازه ای شناسایی می شود. این مقدار طبقه بندی شده با مجموعه ای مستقل از داده ها که خصوصیات مورد نظر را دارند، تست می شوند. هر چقدر میزان برابری پارامتر های رده بندی شده مدل از خصوصیات مجموعه بیشتر باشد، میزان دقت هم باید بالا برود. در نتیجه اگر مدل به حد کافی دقیق باشد می توان از برای رده بندی سازمان و مجموعه های داده با خصوصیات نامرتبط استفاده کرد.


مشکلاتی که در داده کاوی وجود دارد!


با توجه به اهمیتی که داده کاوی درکسب و کار های امروزی دارد و همچنین دستاورهای حاصل از داده کاوی، مشکلات و چالش هایی را دراین زمینه به وجود آورده است.
از جمله مشکلات داده کاوی عبارت اند از:
 حجم زیاد داده های موجود در ورودی
 مسائل امنیتی و حفظ حریم خصوصی
 سختی ارائه برخی مفاهیم شهودی پدیده های پنهان در داده ها
 دشواری در پی بردن به پیچیدگی هایموجود در داده ها
 عدم اطمینان کامل به اطلاعات خروجی
 نیاز به انتخاب روش تحلیل درست برای به دست آوردن نتایج مفید


از این رو داده های خام مجموعه ها و سازمان ها ممکن است دارای اطلاعات موثر و ارزشمندی از بخش های مختلف زندگی کاربران باشد، حفظ و نگهداری و همچنین امنیت داده ها کار آسانی نیست. علاوه بر این ها باید تا حدالامکان از خدشه دار شدن حریم خصوصی کاربران جلوگیری شود.
از طرفی دیگر داد های خام برای انجام داده کاوی و کسب اطلاعات راحت به دست نمی آیند و یا اگر هم به دست می آیند، به آسانی نمیتوان آن ها را از میان داده های زائد و بیهوده جدا و دسته بندی کرد. بنابراین پاکسازی داده های پراکنده جز دشواری ومشکلات داده کاوی می باشد.
نتایجی که از داده کاوی به دست می آید باید از اعتبار و کارامدی خاصی برخوردار باشد و انتخاب روش های تحلیل داده باید با دقت بیشتری انجام شود که همه این موارد از چالش های داده کاوی می باشد.


سخن آخر


با این حساب دوره تصمیم گیری های نسنجیده به پایان رسیده و حالا این داده ها هستند که در مسائل مهم اقتصادی، اجتماعی و سیاسی نقش اساسی دارند. بهره گیری ازداده کاوی در مدیریت کسبو کار لازم است چرا که استفاده از روش های مختلف داده کاوی در کسب و کار، آن را از شکست نجات می دهد و بهره مند نشدن از شیوه های این علم، شما را از داشتن فرصت های مختلف منع می کند.

اگر قصد دارید به کسب و کارتان سروسامان دهید و کمی علمی تر و اصولی تر امورات خود را انجام دهید، بهتر است آن را به متخصصان و یا کسانی که در حوزه برنامه نویسی فعالیت دارند، بسپارید. شرکت ها و مجموعه های زیادی در این زمینه فعالیت دارند با کمی جستجو می توانید با این مجموعه ها ارتباط برقرار کنید. شرکت گونش بیلگی سایار سهند نیز یکی از همین مجموعه های برنامه نویسی است که تمامی امور مربوط به این حوزه را دربر می گیرد.