بعنوان یکی از پیشکسوتان طراحی سایت در اصفهان ، خدمات طراحی سایت را در اصفهان دستخوش تغییرات بنیادی نموده ، بطوریکه در چند سال گذشته الگویی بوده ایم برای همکاران و هم اکنون کادر خلاق گروه طراحی سایت اصفهان وب با ایده های نو، نسل جدیدی از برنامه های طراحی سایت را درجهت افزایش رنکینگ وب سایت ها در موتورهای جستجوی و افزایش رضایت مشتری به پیش می برند .
درباره ماامروزه با پیشرفت فناوری و حضور گستردهی آن در زندگی روزمرهمان شاهد کاربرد پررنگ داده و اطلاعات هستیم، یکی از روشهای استخراج اطلاعات از دادههای خام دیتاماینیگ یا داده کاوی میباشد، در ادامه با همیار آیتی همراه باشید تا با مفاهیم داده کاوی و کاربردهای آن آشنا شویم.
قبل از اینکه با مفهموم Data Mining آشنا شویم بهتر است ابتدا تعریف داده (Data) و اطلاعات (Information) را بشناسیم و پس از آن به سراغ دادهکاوی و کاربردهای آن برویم.
داده (Data) که بعضا از آن با عنوان دادهی خام نیز یاد میشود، گونهای از اطلاعات به صورت خام و دست نخورده است که میتواند بسیار درهم و حتی به صورت عادی غیر قابل استفاده باشد، مجموعهای از اعداد و ارقام درهم و شاید بدون معنای خاص میتوانند به عنوان داده در نظر گرفته شوند. اما نتایج حاصل از پردازش و تجزیه و تحلیل این دادهها به عنوان اطلاعات تلقی میشوند، حتما متوجه شدهاید که اطلاعات نیز میتوانند مجددا به عنوان دادهی ورودی سیستم مورد استفاده قرار گیرند.
بنابراین با توجه به توضیحات بالا در حالت کلی اطلاعات و ورودیهای خام را داده (Data) و نتایج حاصل از پردازش دادههای خام را اطلاعات (Information) مینامیم.به عنوان مثال نمرات دانشجویان یک کلاس، داده و نتایج حاصل از پردازش روی این نمرات، شامل میانگین، میزان افزایش یا کاهش نمرات، نمودارها و… میتوانند به عنوان اطلاعات در نظر گرفته شوند.
به فرایند استخراج و کشف همبستگیها و الگوهای مفید از میان حجم زیادی از دادههای خام که با استفاده از الگوریتم و سازوکارهای هوشمند انجام میگیرد دیتاماینینگ یا داده کاوی میگویند، به زبان سادهتر، استخراج دانش از میان مجموعهای از دادهها را دادهکاوی مینامند.البته لازم به ذکر است، برای اینکه این الگوریتم بتواند دانش را به خوبی استخراج کند نیاز به یکسری پیشپردازش بر روی دادههای اولیه و همچنین یکسری پسپردازش بر روی اطلاعات خروجی خواهد داشت.
اگر از سایت اشتراک ویدئوی یوتیوب استفاده کرده باشید حتما میدانید که قبل از نمایش ویدئوی اصلی یک تبلیغ چند ثانیهای به شما نمایش داده میشود، اما آیا تا به حال به محتوای این تبلیغ دقت کردهاید؟ میدانستید اگر وارد حساب کاربری گوگل خود شده باشید، بهطور صد درصد یک تبلیغ مرتبط با علاقهی خود را مشاهده خواهید کرد؟!
در فرایند دادهکاوی، اطلاعات با ارزش از حجم انبوهی از دادههای به ظاهر نامرتبط استخراج میشود.گوگل به واسطهی موتور جستجوی خود و تاریخچهی جستجویهای شما (در صورتی که وارد حساب کاربری خود شده باشید) میتواند به سایتهایی که معمولا به آنها سر میزنید دسترسی داشته باشد، بدین ترتیب پس از گذشت مدت زمانی به علایق شما پی خواهد برد،
این موارد دادههای خام و به ظاهر نامرتبطی هستند که شاید از نظر ما چندان مفید و کاربری نباشند.اما این غول جستجو، با کمک الگوریتمهای پیشرفتهی داده کاوی خود میتواند اطلاعات بسیار با ارزشی را از انبوه دادههایی که از شما در اختیار دارد به دست آورد.بدین ترتیب به راحتی به علایق شما پی برده و از این اطلاعات در شخصیسازی تبلیغات نمایش دادهشده به شما استفاده کند،
این کار علاوهبر اینکه میتواند شما را به مشاهدهی ادامهی تبلیغات ترغیب کند، به طرز حیرتانگیزی به افزایش درآمد گوگل از نمایش تبلیغات و افزایش نرخ تبدیل آن نیز کمک خواهد کرد، این مورد به ظاهر ساده یکی از ابتداییترین کاربردهای داده کاوی بود، اما در ادامه برخی کاربردهای دیگر فرایند داده کاوی را با هم مرور میکنیم.
همانطور که گفتیم، دادهکاوی یعنی استخراج اطلاعات مفید از مجموعهی دادههای خام و نامفهوم که این اطلاعات شامل اجزای مختلفی هستند، از جمله کاربردهای دیگر دادهکاوی عبارتند از:
بهطور کلی فرایند دادهکاوی علاوهبر اینکه به ما کمک میکند دادههای نامرتبط و بلااستفاده را از مجموعهی خود حذف کنیم، از طرفی اطلاعات بسیار مفید و کاربردی را در اختیار ما (سازمان) قرار میدهد و همچنین به فرایندهای تصمیمگیری سرعت میبخشد.
درحالی که «داده» محتوایی خام و تفسیر نشده است، «اطلاعات» را میتوان نسخه پرورشیافته مجموعه ای از «دادهها» دانست. به عبارتی دیگر، «داده» زیرمجموعه «اطلاعات» است. با مجموعه مشخصی از داده، میتوان اطلاعات متعدد و متفاوتی ایجاد کرد. مثلا بسته به اینکه آن دادهها با چه ترتیبی و تحت چه ساختاری دستهبندی شوند و یا در چه حوزهای مورد بررسی و تحلیل قرار بگیرند، اطلاعات متفاوتی ایجاد میشود.
پس از تفسیر، تحلیل و پروراندن دادهها در بستری خاص و متناسب با هدف و رویکردی مشخص، اطلاعات به دست میآید. برخلاف داده که به واسطه تجزیه ناپذیر بودن آن به مفهومی کوچکتر، نمیتوان برداشتهای متفاوتی از آن داشت، اطلاعات قابلیت این را دارند که هر فردی متناسب با ذهنیتی که دارد، برداشت متفاوتی از آن داشته باشد.
اما آنچه باعث شده علم دادهکاوی تا این حد مورد توجه قرار بگیرد، ضریب اطمینان بالای تصمیمات اتخاذ شده بر اساس تحلیلهای دادهای و نتایجی است که ایجاد میشود. زمانی که مدیران بر اساس احساسات و شهود اقدام به سیاستگذاری و تصمیمگیری در مورد موضوعی میکنند، احتمال خطا در تشخیص مشکل و ارائه راهکار بسیار زیاد است.
در نتیجه ریسک زیادی منابع سازمان را تهدید میکند. درحالی که با تصمیم گیری بر اساس تحلیلهای حاصل از داده کاوی، از هدررفت منابع شرکت در یک اقدام ناکارآمد و غیرضروری جلوگیری میشود. داده کاوی به مدیران کمک میکند تا پیش از هرچیزی، دید درستی از جامعه مورد بررسی پیدا کنند و پس از عارضه یابی درست، راهکاری بهینه برای حل آن مشکل ارائه دهند.
توجه داشته باشید که نباید مفهوم داده کاوی را صرفا به جمع آوری و ذخیره سازی دادهها محدود دانست. زیرا تا زمانی که نتوان الگوهای نهفته در دادهها را برای ارائه تحلیل و راهکار استخراج کرد، این دادهها ارزش چندانی ندارند. در واقع داده کاوی با ایجاد ابزارهایی که استخراج این اطلاعات ارزشمند را ممکن میکند، به دادهها ارزش میبخشد و باعث میشود بتوان از آن دادهها برای برآوردن یک هدف و یا حل یک مشکل استفاده کرد.
همانگونه که در نمودار پایین مشاهده میکنید، دادهکاوی به صورت کلی و عمومی در 6 مرحلهی اصلی انجام میشود، در ابتدا دادههای مورد نیاز (دادههای هدف) جمعآوری میشوند و مورد پردازش و پاکسازی قرار میگیرند، یعنی دادههای اضافه حذف شده و تنها دادههای مورد نیاز وارد سیستم میشوند.
در مرحلهی بعدالگوی میان دادهها کشف و ارزیابی و سپس الگوریتم و متدهای Data Mining بر روی دادهها انجام خواهد شد.در نهایت نیز اطلاعات بهدست آمده از فرایند دادهکاوی در قالب فرمتهای قابل درک برای انسان مانند نمودار، تصویر، گزارش و… ارائه شده و دانش مورد نظر که از میان انبوه دادههای خام استخراج شدهاست در اختیار سازمان قرار خواهد گرفت.
به طور کلی اکثر سیستمهای دادهکاوی با دو مشکل اساسی دستوپنجه نرم میکنند، این مشکلات عبارتند از:
برای حل مشکل اول یعنی حجم بالای دادهها میتوان از الگوریتمهای سریعتر، روشهای کاهش پیچیدگی زمانی، بهینهسازی ، پردازش موازی و… استفاده کرد، همچنین میتوانیم با استفاده از روشهایی مانند نمونه گیری، گسستهسازی، کاهش ابعاد و… حجم دادههای ورودی را با توجه به نیاز دادهکاوی کاهش دهیم و یا اینکه در نهایت با استفاده از قابلیتهای ذخیره و بازیابی اطلاعات موجود در دیتابیسها از روشهای ارائهی رابطهای استفاده کنیم.
برای حل مشکل دوم یعنی عدم اطمینان کامل به اطلاعات خروجی باید ورودی خود را کنترل کنیم، در صورتی که در دادههای ورودی اطلاعات کامل نباشند، یعنی در دادهها مشخصههایی وجود داشته باشد که مقدار معتبری برای آنها درج نشده است و یا اینکه اطلاعات ناسازگار باشند (دادهها با تداخل رو به رو شده باشند) و در نتیجه مقادیر ثبتشده با مقادیر واقعی یکسان نباشند، میتواند باعث ایجاد عدم اطمینان (عدم قطعیت) در اطلاعات خروجی گردد، که راه برطرف کردن آن بررسی صحت دادههای ورودی میباشد.
دادهکاوی معمولا در سازمانهایی مانند ادارات بیمه، مراکز آموزشی بزرگ، تولید کنندگان، بانکها و سازمانهای مالی، خرده فروشیها و… کاربردهای بسیاری دارد، اکثر سازمانهای از ابزارهای زیر برای انجام فرایند دادهکاوی استفاده میکنند:
واژهی CRISP (کریسپ) از سرواژههای عبارت CRoss Industry Standard Process for Data Mining و به معنی فرایندهای استاندارد صنعت متقابل برای دادهکاوی در اصل یکی از روشهای تحلیلی متفاوت برای فرایند دادهکاوی است، همانگونه که در نمودار زیر مشاهده میکنید متدلوژی CRISP شامل 6 مرحلهی اصلی میشود که عبارتند از:
در نهایت باید گفت که دوره تصمیمگیریهای شهودی و کورکورانه به پایان رسیده است و اکنون چیزی جز داده ها، حکمرانی ارکان مهم اقتصادی، اجتماعی و سیاسی دنیا را بر عهده ندارند. تا چندی قبل استفاده از داده کاوی برای کسب مزیت نسبت به رقبا، یک امکان بود که مدیران به نسبت دوراندیشی خود از آن استفاده میکردند.
اما به کارگیری دادهکاوی در مدیریت کسبوکارها و سازمانهای امروزی دیگر یک الزام است نه یک امکان. با توجه به گرایش روزافزون کسبوکارهای مختلف به استفاده از علمداده و روشهای مختلف دادهکاوی، به جرات میتوان گفت کسبوکارهایی که از پیوستن به این جریان سرباز بزنند محکوم به شکستند و تردید در به کارگیری متدهای این علم، تنها شما را از بهرهمندی از فرصتهای مختلف باز میدارد.
برای مشاهده مقالات بیشتر در مورد سئو سایت و طراحی سایت به صفحه مقالات سایت پوشش مراجعه نمایید.
نظر دهید