ورود به حساب کاربری

نام کاربری *
رمز عبور *
مرا به خاطر بسپار.

بنیاد توسعه رایانش سریع و ابری

HPC and Cloud Computing Development Foundation

علم داده ترکیبی از کدام علوم است؟

علم داده گستره ای از چندین علم و مهارت است.

1- یک متخصص داده باید توانایی طراحی Query های پیچیده برای استخراج اطلاعات از حجم عظیم داده های را داشته باشد. این فرد همچنین باید دارای پس زمینه علمی قوی در حوزه علوم کامپیوتر باشد(Computer Science).
2- یک دانشمند علم داده همچنین باید توانایی های قابل قبولی در علم ریاضی و آمار داشته باشد تا توانایی درک الگوریتمها، اجرا و بهینه سازی آنها را کسب نماید. یکی از مهترین کاربردهای این مهارت در تشخیص نویز و داده های پرت است که به وی در آماده سازی داده ها کمک می کند. از ترکیب دانش کامپیوتر و علم ریاضی و آمار داده کاوی شکل می گیرد(Math & Statistics).
3- یک متخصص علم داده همچنین باید آگاهی هایی در حوزه تخصصی مسئله ای که در حال حل آن است داشته باشد. تشخیص روابط بین داده ها، منطق گزاره ها و ... از نیازمندیهای یک متخصص علم داده است(Domain Expert).
 
 

علم داده ترکیبی از کدام علوم است؟

علم داده گستره ای از چندین علم و مهارت است.
1- یک متخصص داده باید توانایی طراحی Query های پیچیده برای استخراج اطلاعات از حجم عظیم داده های را داشته باشد. این فرد همچنین باید دارای پس زمینه علمی قوی در حوزه علوم کامپیوتر باشد(Computer Science).
2- یک دانشمند علم داده همچنین باید توانایی های قابل قبولی در علم ریاضی و آمار داشته باشد تا توانایی درک الگوریتمها، اجرا و بهینه سازی آنها را کسب نماید. یکی از مهترین کاربردهای این مهارت در تشخیص نویز و داده های پرت است که به وی در آماده سازی داده ها کمک می کند. از ترکیب دانش کامپیوتر و علم ریاضی و آمار داده کاوی شکل می گیرد(Math & Statistics).
3- یک متخصص علم داده همچنین باید آگاهی هایی در حوزه تخصصی مسئله ای که در حال حل آن است داشته باشد. تشخیص روابط بین داده ها، منطق گزاره ها و ... از نیازمندیهای یک متخصص علم داده است(Domain Expert).
 
در یک نگاه کلی علم داده شامل چندین مرحله است و یک متخصص در این حوزه باید بتواند گامهای زیر را مدیریت و اجرا نماید:
1- درک تجاری مسئله (Business Understanding)
2- درک داده (Data Understanding)
3- آماده سازی داده (Data Preparation)
4- مدل سازی مسئله (Modeling)
5- ارزیابی توسط اعضای تیم داده (DS team evaluation)
6- ارزیابی توسط سایر ذینفعان (Stakeholder evaluation)
7- استقرار مدل (Deployment) 
 
آنچه که در مرحله مدل سازی توسط متخصصین داده انجام می شود همان یادگیری ماشینی (Machine learning) است. یادگیری ماشین در یک بیان ساده استفاده از علم ریاضی و کامپیوتر برای استخراج تمایلات، خصوصیات، الگوها، اجزا و ساختارهای درونی داده برای رسیدن و شکل دهی به یک تصمیم در آینده است.
الگوریتمهای یادگیری ماشین دارای تنوع زیادی هستند که از آن جمله می توان به:
- Linear Regression
- Logistic Regression
- Decision Tree
- Support Vector Machines (SVM)
- Naive Bayes
- K- Nearest Neighbor
- K-Means, Random Forest
- Principal Component Analysis (PCA)
- Gradient Boost & Adaboost
- Neural Networks
- Deep Learning Neural Networks (“Deep Learning”)
اشاره کرد.
به طور کلی الگوریتمهای یادگیری ماشین را می توان در سه دسته کلی قرار داد:
1- یادگیری با ناظر (Supervised Learning)
2- یادگیری بدون ناظر (Unsupervised Learning)
3- یادگیری تقویتی (Reinforcement Learning)
یکی دیگر از مباحثی که در حوزه علم داده مورد استفاده قرار میگیرد و زیرمجموعه ای علم کامپیوتر است هوش مصنوعی است (Artificial intelligence (AI)). هوش مصنوعی دارای تاریخچه و سبقه طولانی است که قصد ندارم در این مبحث توضیحاتی راجع به آن بدهم اما پیشرفتهای زیادی که طی سالیان گذشته در حوزه هوش مصنوعی اتفاق افتاده باعث شده است هوش مصنوعی نفوذ بیشتری در زندگی اطراف ما داشته باشد و کاربردهای زیادی از آن را می توان ملاحظه کرد، کاربردهای پردازش تصاویر پزشکی، خودروهای خودراننده، درک گفتار کاربران، پردازش داده های حجیم حمل و نقل شهری و ... از آن جمله اند. تمامی این کاربردها و تحقیقاتی که در ذیل آنها در حال انجام است در شاخه ای به نام هوش مصنوعی کاربردی (Applied or Narrow AI) قرار می گیرند. امروزه به جای واژه هوش مصنوعی کاربردی از واژه جدیدی به نام رایانش ادراکی (Cognitive Computing) استفاده می شود. در واقع رایانش ادراکی استفاده از شبکه های عصبی یادگیری عمیق به منظور رسیدن به مدلهای یادگیری تقویتی است.

 

 نویسنده: دکتر امین نظارات

عضو هیئت علمی دانشگاه پیام نور یزد

hpclab.ir