در این مقاله به توضیح مواردی نظیر تعاریف و تمایزات موجود در بین دو موضوع اصلی یادگیری ماشین (Machine Learning) و داده کاوی (Data Mining) پرداخته ایم.
روند توضیحات در این مقاله به شرح زیر خواهد بود:
- صحبت از داده های بزرگ (big data) و اینکه چرا یادگیری ماشین امروزه این چنین محبوب شده است؟
- تاریخچه و تعریف نکاتی که منجر به ایجاد سردرگمی در بین زمینه های داده کاوی و یادگیری ماشین میشود
- تعاریف داده کاوی و یادگیری ماشین
- تفاوت بین داده کاوی و یادگیری ماشین
نویسنده: امیررضا جهانی
بشر از بدو تولد شروع به تجزیه و تحلیل داده ها کرده است. انسان از دوران کودکی در معرض انبوهی از سیگنال ها قرار داشته که قادر به دریافت آنها از طریق چشم ، گوش، بینی، زبان و اعصاب بوده است. همچنین مغز او به سرعت آموخته که چگونه این سیگنال ها را تجزیه و تحلیل کند و نسبت به آنها واکنش نشان دهد. پس از زبان گفتار، زبان نوشتاری شکل گرفت و مخازن وسیعی از داده ها را ایجاد کرد که تا به امروز قابل تجزیه و تحلیل می باشند.
بنابراین بسیاری از مردم اظهار می کنند که همین حالا وارد عصر بزرگ داده ها شده اند، اما باید به این نکته توجه داشت که داده ها همیشه در اطراف ما بوده اند و فقط مقدار داده های ثبت شده شروع به شکوفایی کرده و محبوبیت زیادی پیدا کرده اند. کسب محبوبیت داده های ثبت شده را می توان به دلیل 4 عامل اصلی دانست که در ادامه به آن ها خواهیم پرداخت. (4 نکته زیر در یک راهنمای آموزنده توسط Vidhya Analytics ارائه شده است.)
- هزینه اندک جهت ذخیره سازی
- هزینه های محاسباتی پایین
- تعداد فوق العاده زیاد دستگاه های موجود که اکنون به اینترنت متصل هستند (تقریبا 50 میلیارد دستگاه متصل تا سال 2020)
- و البته ، فناوری ابری که توانسته دموکراسی را در دنیای دیتا به ارمغان بیاورد.
تاریخچه
اکنون کمی بیشتر در مورد تاریخچه صحبت خواهیم کرد تا دو زمینه داده کاوی و یادگیری ماشین را بهتر درک کنیم.
داده کاوی (Data Mining) در دهه 1930 به وجود آمد، که در ابتدا با عنوان کشف دانش در پایگاه های داده شناخته می شد و یادگیری ماشین در حدود دهه 1950 هنگامی معرفی شد که اولین برنامه یادگیری ماشین Samuel’s Checker انتشار یافت.
نکات موجود بین داده کاوی و یادگیری ماشین
- هر دو فرآیند تحلیلی بوده و بخش جدایی ناپذیر از صنعت علوم داده می باشند.
- هر دو از موارد استفاده اولیه در تشخیص الگو به وجود آمدند.
- هر دو باعث یادگیری مقادیر زیادی از داده ها می شوند.
تعاریف مورد ارائه از داده کاوی و یادگیری ماشین
داده کاوی
در تعریفی کوتاه، داده کاوی فرایند منظم کشف الگوهای موجود در مجموعه دیتا می باشد.
یادگیری ماشین
این زمینه از پژوهش، علاقمند به توسعه الگوریتم های رایانه ای برای تبدیل داده ها به انجام اعمالی هوشمند بوده که به عنوان یادگیری ماشین تلقی می گردد.
بدون پرداختن به انبوهی از تعاریف خسته کننده، شما را به جالب ترین قسمت از تفاوت های موجود بین داده کاوی و یادگیری ماشین دعوت می کنیم.
تفاوت بین داده کاوی و یادگیری ماشین
داده کاوی زیر مجموعه ای از علم تجزیه و تحلیل تجارت بوده و بر آموزش کامپیوتر متمرکز می باشد. همچنین نحوه شناسایی الگوها ، روابط یا ناهنجاری های ناشناخته در مجموعه داده های بزرگ بوده که بعداً انسان ها می توانند از آنها برای حل یک مشکل تجاری استفاده کنند. این فرآیند به صورتی می باشد که نیاز به مداخله و تصمیم گیری انسان دارد و همچنین توسط انسان با معرفی ویژگی های هوشمند می تواند عملکردی هوشمندانه داشته باشد.
برای مثال اگر کارت اعتباری یک شرکت، اطلاعات زیادی در رابطه با رفتار مشتری داشته باشد و شرکت بخواهد متوجه الگوهای جذب مشتری شود، می تواند از تکنیک های داده کاوی برای پیدا کردن ارتباط بین ویژگی های مختلف مشتریان خود استفاده کند. این امر می تواند به شدت اشاره بر جذب مشتری در آینده داشته باشد.
اما در حقیقت یادگیری ماشین زیر مجموعه ای از هوش مصنوعی بوده و تمرکز آن بر آموزش کامپیوتر است. همچنین اشاره بر نحوه یادگیری تجزیه و تحلیل داده های بزرگ و “یادگیری” الگوهای موجود در آن (از مجموعه داده های آموزش) دارد که می تواند به پیش بینی داده های جدید کمک کند. جدا از برنامه نویسی اولیه و تنظیمات دقیق، رایانه به هیچ وجه برای یادگیری داده ها و بهبود پیش بینی های خود به هیچگونه مداخله انسانی نیازمند نیست. این دستگاه از آنجایی که از داده های بیشتر و بیشتری تغذیه می کند، به خودی خود هوشمند خواهد شد.
به عنوان مثال: رسانه Netflix یک مثال عالی از یادگیری ماشین است. من امروز سریال Money Heist را در لیست پیشنهادات خود دیدم، بنابراین، چگونه این رسانه می تواند تشخیص دهد که چه چیزی جز علاقمندی های من بوده و دوست دارم آن را در نوبت بعدی تماشا کنم؟ یک الگوریتم یادگیری ماشین بسیار قوی در بخش پس زمینه کار و یا به اصطلاح Backend وجود دارد که بطور مداوم در حال تجزیه و تحلیل ترجیحات سایر کاربران با علایق و سلایق آن ها نسبت به تماشای فیلم و سریال می باشد که از این رو پیشنهاداتی را بر اساس این موارد ارائه می دهد. هرچه شما با عنوان کاربر با پروفایل خود فیلم و سریال بیشتری تماشا می کنید، الگوریتم درباره ترجیحات شما از ژانرهای مختلفی که مورد پسند شما بوده و به تماشای آن ها می پردازید اطلاعات بیشتری بدست می آورد و بر اساس آن پیشنهادات را برای شما نمایش می دهد.
سخن پایانی
در واقع ، تمام موارد داده کاوی شامل استفاده از یادگیری ماشین می باشد، اما تمام یادگیری ماشین شامل داده کاوی نیست.
به عنوان مثال ممکن است شما از یادگیری ماشین برای داده های ترافیک اتومبیل جهت ایجاد الگوهای مربوط به نرخ تصادف استفاده کنید. اما از طرفی اگر بخواهیم در مورد اتومبیل هایی با رانندگی خودکار صحبت کنیم، باید به این نکته اشاره داشت که آنها کاملا مبتنی بر یادگیری ماشین بوده و درگیر هیچ نوع داده کاوی نمی باشند.
دیدگاه ها