پکیج علوم داده

Data Science

با تدریس ابراهیم اخزری

حدود 100 ساعت

110 جلسه

پشتیبانی

پکیج علوم داده

متخصص علم‌داده براساس آخرین آمارهای رسمی جز سه شغل برتر در سال 2022 هست. شغلی که علاوه بر جذابیت شغلی دارای حقوق و مزایای بسیار بالاتری به نسبت سایر مشاغل بوده است. متخصص علم‌داده فردی است که مهارت‌های خود را در زمینه آمار و ساختن مدل‌های یادگیری ماشین بکار می‌برد تا پیش‌بینی‌ها را انجام دهد و به سؤالات کلیدی در کسب‌وکار پاسخ دهد. همچنین یک متخصص علم‌داده باید درست مانند یک تحلیلگر داده قادر به پاک‌سازی، تجزیه‌وتحلیل و تجسم داده‌ها باشد. بااین‌حال، یک متخصص داده، عمق و تخصص بیشتری در این مهارت‌ها دارد و همچنین قادر به آموزش و بهینه‌سازی مدل‌های یادگیری ماشین است. متخصص علم‌داده فردی است که می‌تواند با پرداختن به سؤالات نامحدود و دگرگون پذیر و استفاده از دانش خود در مورد آمار و الگوریتم‌های پیشرفته، ارزش زیادی را خلق کند.

این دوره برای چه کسانی مناسـب اسـت؟

این دوره برای چه کسانی مناسـب نیست؟

ویژگی های دوره

  • پشتیبانی دوره توسط مدرس و تعامل با دانش آموختگان در شبکه های اجتماعی

برگزاری دوره به‌صورت پروژه محور و در قالب چندین مورد کاربردهای مختلف

پس از اتمام دوره از دانشجو آزمون مهارتی عملی گرفته می شود تا از نتیجه غملکرد خود مطلع شود و بعد از اعلام نتیجه برنامه برای ادامه مسیر و … ارلائه می شود

جلسات دوره

علم داده و داده کاوی

بخش اول : مقدمات و مفاهیم

آشنایی با علم داده و کاربردهای آن در صنعت/تجارت/آموزش

چند مطالعه‌ی موردی در حوزه‌ی کاربرد داده کاوی در صنعت و استارتاپ‌ها

بررسی زبان‌های برنامه نویسی حوزه‌ی داده کاوی و یادگیری ماشین (پایتون، R، جاوا، Scala، Go و…)

تکنولوژی مجازی‌سازی و داکر و کاربر آن در حوزه‌ی علوم داده

آشنایی با متدولوژی CRISP در پیاده‌سازی پروژه‌های داده کاوی

آشنایی با ورژن‌های مختلف زبان پایتون و نسخه‌ی آناکوندا در لینوکس

آموزش نصب و کار با پایتون و آناکوندا در ویندوز

آشنایی با ژوپیتر نوتبوک و برنامه نویسی پایتون با این ابزار

آشنایی با Visual Studio Code و Pycharm

پکیج‌ها و ماژول‌ها در پایتون

کار با محیط‌های مجازی و Virtual Environment در پایتون

آشنایی با زبان R و نرم افزار R Studio

مبانی ماتریس و فضای دکارتی 

مثالِ تبدیل تصویر به ماتریس جبر خطی 

تبدیل ویژگی‌های غیر عددی به عددی با استفاده از OHE  

تبدیل متن به ماتریس جبر خطی 

آموزش کتابخانه‌ی Numpy برای کار با ماتریس‌های جبر خطی 

مقایسه‌ی سرعت و بهینگی کتابخانه‌ی Numpy با لیست‌های پایتون 

کتابخانه‌ی Pandas  

معرفی نمودار هیستوگرام بر روی داده‌ها 

نمودارهای خطی و پراکندگی 

نمودار KDE مبتنی بر غلظت و نمودار جعبه‌ای یا همان Box-plot  

داده‌های سری زمانی (Time Series) و نمایش آن‌ها 

آشنایی و رسم نمودار با bokeh  

کار با کتابخانه‌ی bokeh جهت مصورسازی داده‌ها 

آموزش طراحی داده‌ها به صورت تعاملی با bokeh به عنوان سرور 

آموزش طراحی داشبورد مدیریتی با bokeh (پروژه عملی)

دیپلوی یک پروژه علم داده با bokeh server روی یک سرور آنلاین

بخش دوم : آمار و آماده سازی داده ها

مقدمات آمار و احتمال و توزیع نرمال 

توزیع‌های احتمالی (نرمال، یکنواخت، برنولی و باینومیال) 

توزیع‌های احتمالی (چند جمله‌ای، پواسون و نمایی) 

توابع PDF، CDF و PMF و کاربرد آن‌ها در توزیع‌های احتمالی 

تست Kullback-Leibler برای توزیع‌های آماری 

معیار جنسون شنون (Jenson Shanon) برای محاسبه‌ی دو توزیع آماری 

معیار Kolmogorov-Smirnov برای مقایسه‌ی توزیع‌های احتمالی 

کتابخانه‌ی PyIDD و تخمین توزیع‌های آماری 

آشنایی با P Value کاربرد آن در تست‌های آماری 

تست‌های فرضیه‌ی آماری A-B – مثال کاربردی تغییر صفحه‌ی خرید برای مشتریان

درجه‌ی آزادی (Degree of Freedom)، توزیع F و توزیع Chi2  

آزمون Z و آزمون T – مثال عملی آزمون داده‌های بیماری کرونا

تحلیل واریانس (ANOVA) برای آزمون‌های آماری

هوش تجاری (BI) و تصمیم‌گیری داده محور 

فرآیند ETL و ELT در جمع‌آوری داده‌ها 

آشنایی با آپاچی AirFlow برای انتقال داده‌های حجیم و زمان‌بندی شده 

کلان داده (Big Data) و انواع مختلف داده‌ها 

روش نگاشت-کاهش (Map-Reduce) و سیستم فایل توزیع شده (DFS)  

آشنایی با هدوپ (Hadoop) و اکوسیستم آن 

پایگاه داده‌های توزیع شده و تئوری CAP  

آشنایی با پایگاه داده‌های SQL و NoSQL  

انبار داده، OLAP و مکعب داده

بازار داده (Data Mart) و دریاچه‌ی داده (Data Lake)  

معرفی ابزار python cubes جهت ساخت مدل‌های OLAP و مکعب‌های داده

معرفی کتابخانه‌ی scikit-learn و کتابخانه‌های مرتبط با داده کاوی 

روش‌های مقدماتی پیش پردازش داده‌ها (Data Preprocessing) –

مباحث تکمیلی در پیش پردازش داده‌ها – نرمال‌سازی و استانداردسازی داده‌ها، روش K نزدیک‌ترین همسایه برای داده‌های گم شده

مباحث تکمیلی در پیش پردازش داده‌ها – نرمال‌سازی L1 و L2 و باینرایزر

همبستگی (Correlation) و روش‌های Pearson، Spearman و Kendalls Tau در تحلیل داده‌های همبسته 

همبستگی داده‌ها در پایتون (مثال عملی مجموعه داده‌ی فوتبال آمریکایی) 

مباحث تکمیلی EDA و آماده سازی داده‌ها (مثال مجموعه داده‌ی بازی‌های تخته‌ای) 

مثال مجموعه داده‌ی اتومبیل و EDA بر روی داده‌ها

بخش سوم : مدل سازی

طبقه بندی مجموعه داده‌ی MNIST بخش مقدماتی 

معرفی الگوریتم SVM و استفاده از آن در داده کاوی 

معیارهای Accuarcy، Precision، Recall و F1 برای ارزیابی دقت، صحت و پوشش یک الگوریتم طبقه بندی 

الگوریتم KNN (نزدیک‌ترین همسایه) در طبقه بندی 

الگوریتم درخت تصمیم و مجموعه‌ی داده‌ی گل‌های زنبق

ناخالصی جینی (Gini Impurity) و بهره اطلاعاتی (Information Gain)  

بررسی مفهوم bias و variance در طبقه بندی 

الگوریتم جنگل تصادفی (Random Forest)  

الگوریتم Adaboost  

نگاهی دقیق‌تر به پارامترهای الگوریتم SVM

نگاهی دقیق‌تر به پارامترهای الگوریتم RandomForest  

نگاهی دقیق‌تر به پارامترهای الگوریتم KNN  

متن کاوی (Text Mining) و پردازش زبان طبیعی (NLP) –

شناسایی بیماران قلبی با استفاده از الگوریتم‌های طبقه بندی 

پیدا کردن بهترین پارامترها در الگوریتم‌ها با استفاده از جستجوی مشبک (Grid Search)  

آشنایی با مسائل رگرسیون و حل مسئله‌ی پیش‌بینی دما

الگوریتم Gradient Boosting و XGBoost برای طبقه‌بندی و رگرسیون 

الگوریتم XGBoost و حل مسئله‌ی تخمین قیمت منزل 

الگوریتم CatBoost و حل مسئله‌ی تخمین خسارت حادثه شرکت بیمه

کاهش ابعاد

الگوریتم PCA و KernelPCA در کاهش ابعاد

الگوریتم Factor Analysis در کاهش ابعاد 

الگوریتم ICA و ISOMAP برای کاهش ابعاد 

الگوریتم TSNE و UMAP برای کاهش ابعاد 

ترکیب الگوریتم‌های کاهش ابعاد برای حل مسائل طبقه بندی 

کار کردن با داده‌های غیر متوازن (Imbalance) –

طبقه بندی تصاویر رنگی با استفاده از تکنیک‌های پردازش تصویر

تحلیل و پیش‌بینی سری زمانی با استفاده از SARIMAX –

معرفی کتابخانه‌ی Prophet برای پیش‌بینی سری‌های زمانی 

آشنایی با خوشه بندی (Clustering) و کاربردهای آن 

معرفی الگوریتم KMeans و DBSCAN برای خوشه بندی داده‌ها 

خوشه‌بندی بر اساس مدل RFM بر روی مشتریان فروشگاه اینترنتی

خوشه‌بندی، معیار WCSS و تکنیک Elbow  

بررسی روش Silhouette و الگوریتم DBSCAN  

تقسیم‌بندی تصاویر (Image Segmentation) با استفاده از الگوریتم‌های خوشه‌بندی

خوشه بندی بر روی متون (Text Clustering) –

تشخیص داده‌های پرت (Outlier Detection) –

آشنایی با شبکه‌های عصبی و پرسپترون

پیاده‌سازی یک شبکه‌ی ساده عصبی با پایتون 

چهارچوب تنسرفلو (tensorflow) و کراس (keras)  

پیاده‌سازی شبکه‌های عصبی برای حل مسئله‌ی تشخیص بیماری قلبی عروقی با تنسرفلو و کراس 

شبکه‌های عصبی کانولوشن (CNN) و مدل عمیق یادگیری 

پیاده‌سازی یادگیری عمیق کانولوشنی (CNN) برای طبقه بندی تصاویر

پیاده‌سازی شبکه‌های عصبی کانولوشنی (CNN) و استفاده از تکنیک dropout  

آشنایی با انواع توابع فعال‌سازی (activation functions)  

کار با داده‌های حجیم در یادگیری عمیق

مسئله‌ی شناخت بیماری از روی تصاویر xray قفسه سینه و کار با داده‌های نامتوازن در یادگیری عمیق

آشنایی با مدل‌های معروف یادگیری عمیق کانولوشنی در حل مسائل 

پیاده‌سازی مدل ResNet و مدل پیش یادگیری شده در یادگیری عمیق با Tensorflow و Keras  

پیاده‌سازی Resnet برای تشخیص تصاویر از وبکم لپ‌تاپ 

کار بر روی داده‌های متنی (تحلیل احساس) با شبکه‌های عصبی عمیق کانولوشنی

شبکه‌های عصبی عمیق چند کاناله (حل مسئله‌ی تحلیل احساس متن) 

شبکه‌های عصبی عمیق چندکاناله با ورودی چندگانه

شبکه‌های عصبی بازگشتی (RNN)  

پیش‌بینی داده‌های بورس با استفاده از شبکه‌های عصبی ساده بازگشتی (simple RNN)  

پیاده‌سازی شبکه‌های عصبی بازگشتی (RNN) در تنسورفلو و کراس 

شبکه‌های عصبی LSTM و GRU و معماری‌های مختلف شبکه‌های عصبی بازگشتی 

پیش‌بینی خرید/فروش رمزارز با شبکه‌های عصبی بازگشتی

یادگیری انتقالی (Transfer Learning) –

ساخت الگوریتم تولید شعر با شبکه‌های عصبی عمیق – (web scraping)  

سیستم ترجمه‌ی ماشینی ساده با الگوریتم یادگیری عمیق بازگشتی

طراحی سیستم ترجمه‌ی ماشینی کامل با شبکه‌های Attention Network –

مقدمه‌ای در مورد یادگیری تقویتی (Reinforcement Learning)

حل مسئله‌ی تاکسی خودران با یادگیری تقویتی  

یادگیری تقویتی عمیق (Deep Reinforcement Learning) و شبکه‌های DDQN –

بخش چهارم : هوش مصنوعی
مفاهیم هوش مصنوعی
عاملهاي هوشمند
حل مسائل به وسیله جستجو
انواع جستجوهاي هوشمند و غیرهوشمند
حل مسائل با محدودیت به وسیله جستجو
جستجوي مینیمم ماکزیمم

مفاهیم منطق و منطق استنتاجی
عاملهاي منطقی منطق گزارهاي، رزولوشن، زنجیر جلورو و عقبرو
منطق رتبه اول و انواع استنتاج در آن
سیستمهاي مبتنی بر استنتاج منطقی
عدم قطعیت و سیستمهاي مبتنی بر استنتاج احتمالی
سیستمهاي تصمیمگیري
ساخت پایگاه دانش، روشهاي ارائه دانش
سیستمهاي خبره مبتنی بر قانون
استنتاج مبتنی بر حالت استدلال موردي

بخش پنجم :  پروژه

همین الان ثبت نام کن

7 میلیون تومان

این فرصت استثنایی رو از دست نده!

7 میلیون تومان
نیاز به مشاوره تخصصی دارید؟
data
علوم داده
به جمع متخصصین بپیوندید ...