پکیج علوم داده
Data Science
با تدریس ابراهیم اخزری

حدود 100 ساعت
110 جلسه
پشتیبانی
پکیج علوم داده
متخصص علمداده براساس آخرین آمارهای رسمی جز سه شغل برتر در سال 2022 هست. شغلی که علاوه بر جذابیت شغلی دارای حقوق و مزایای بسیار بالاتری به نسبت سایر مشاغل بوده است. متخصص علمداده فردی است که مهارتهای خود را در زمینه آمار و ساختن مدلهای یادگیری ماشین بکار میبرد تا پیشبینیها را انجام دهد و به سؤالات کلیدی در کسبوکار پاسخ دهد. همچنین یک متخصص علمداده باید درست مانند یک تحلیلگر داده قادر به پاکسازی، تجزیهوتحلیل و تجسم دادهها باشد. بااینحال، یک متخصص داده، عمق و تخصص بیشتری در این مهارتها دارد و همچنین قادر به آموزش و بهینهسازی مدلهای یادگیری ماشین است. متخصص علمداده فردی است که میتواند با پرداختن به سؤالات نامحدود و دگرگون پذیر و استفاده از دانش خود در مورد آمار و الگوریتمهای پیشرفته، ارزش زیادی را خلق کند.
این دوره برای چه کسانی مناسـب اسـت؟
- .افراد تازه کاری که تا به حال تجربه برنامه نویسی نداشته و به تازگی شروع کرده اند.
- افراد علاقه مند به علوم داده و هوش مصنوعی
- به طور خلاصه هر کسی که میخواهد کار خود را تحلیل کند
این دوره برای چه کسانی مناسـب نیست؟
- کسانی که وقت کافی برای انجام تمرینات را ندارند
- کسانی که مایل به ارتقای سطح فنی خود در حوزه علوم داده نیستند
- کسانی که با انجام امور خود به صورت ساده و دستی راحت هستند و دنبال ارتقای کار خود نیستند
ویژگی های دوره
- پشتیبانی دوره توسط مدرس و تعامل با دانش آموختگان در شبکه های اجتماعی
برگزاری دوره بهصورت پروژه محور و در قالب چندین مورد کاربردهای مختلف
پس از اتمام دوره از دانشجو آزمون مهارتی عملی گرفته می شود تا از نتیجه غملکرد خود مطلع شود و بعد از اعلام نتیجه برنامه برای ادامه مسیر و … ارلائه می شود
جلسات دوره
علم داده و داده کاوی
بخش اول : مقدمات و مفاهیم
آشنایی با علم داده و کاربردهای آن در صنعت/تجارت/آموزش
چند مطالعهی موردی در حوزهی کاربرد داده کاوی در صنعت و استارتاپها
بررسی زبانهای برنامه نویسی حوزهی داده کاوی و یادگیری ماشین (پایتون، R، جاوا، Scala، Go و…)
تکنولوژی مجازیسازی و داکر و کاربر آن در حوزهی علوم داده
آشنایی با متدولوژی CRISP در پیادهسازی پروژههای داده کاوی
آشنایی با ورژنهای مختلف زبان پایتون و نسخهی آناکوندا در لینوکس
آموزش نصب و کار با پایتون و آناکوندا در ویندوز
آشنایی با ژوپیتر نوتبوک و برنامه نویسی پایتون با این ابزار
آشنایی با Visual Studio Code و Pycharm
پکیجها و ماژولها در پایتون
کار با محیطهای مجازی و Virtual Environment در پایتون
آشنایی با زبان R و نرم افزار R Studio
مبانی ماتریس و فضای دکارتی
مثالِ تبدیل تصویر به ماتریس جبر خطی
تبدیل ویژگیهای غیر عددی به عددی با استفاده از OHE
تبدیل متن به ماتریس جبر خطی
آموزش کتابخانهی Numpy برای کار با ماتریسهای جبر خطی
مقایسهی سرعت و بهینگی کتابخانهی Numpy با لیستهای پایتون
کتابخانهی Pandas
معرفی نمودار هیستوگرام بر روی دادهها
نمودارهای خطی و پراکندگی
نمودار KDE مبتنی بر غلظت و نمودار جعبهای یا همان Box-plot
دادههای سری زمانی (Time Series) و نمایش آنها
آشنایی و رسم نمودار با bokeh
کار با کتابخانهی bokeh جهت مصورسازی دادهها
آموزش طراحی دادهها به صورت تعاملی با bokeh به عنوان سرور
آموزش طراحی داشبورد مدیریتی با bokeh (پروژه عملی)
دیپلوی یک پروژه علم داده با bokeh server روی یک سرور آنلاین
بخش دوم : آمار و آماده سازی داده ها
مقدمات آمار و احتمال و توزیع نرمال
توزیعهای احتمالی (نرمال، یکنواخت، برنولی و باینومیال)
توزیعهای احتمالی (چند جملهای، پواسون و نمایی)
توابع PDF، CDF و PMF و کاربرد آنها در توزیعهای احتمالی
تست Kullback-Leibler برای توزیعهای آماری
معیار جنسون شنون (Jenson Shanon) برای محاسبهی دو توزیع آماری
معیار Kolmogorov-Smirnov برای مقایسهی توزیعهای احتمالی
کتابخانهی PyIDD و تخمین توزیعهای آماری
آشنایی با P Value کاربرد آن در تستهای آماری
تستهای فرضیهی آماری A-B – مثال کاربردی تغییر صفحهی خرید برای مشتریان
درجهی آزادی (Degree of Freedom)، توزیع F و توزیع Chi2
آزمون Z و آزمون T – مثال عملی آزمون دادههای بیماری کرونا
تحلیل واریانس (ANOVA) برای آزمونهای آماری
هوش تجاری (BI) و تصمیمگیری داده محور
فرآیند ETL و ELT در جمعآوری دادهها
آشنایی با آپاچی AirFlow برای انتقال دادههای حجیم و زمانبندی شده
کلان داده (Big Data) و انواع مختلف دادهها
روش نگاشت-کاهش (Map-Reduce) و سیستم فایل توزیع شده (DFS)
آشنایی با هدوپ (Hadoop) و اکوسیستم آن
پایگاه دادههای توزیع شده و تئوری CAP
آشنایی با پایگاه دادههای SQL و NoSQL
انبار داده، OLAP و مکعب داده
بازار داده (Data Mart) و دریاچهی داده (Data Lake)
معرفی ابزار python cubes جهت ساخت مدلهای OLAP و مکعبهای داده
معرفی کتابخانهی scikit-learn و کتابخانههای مرتبط با داده کاوی
روشهای مقدماتی پیش پردازش دادهها (Data Preprocessing) –
مباحث تکمیلی در پیش پردازش دادهها – نرمالسازی و استانداردسازی دادهها، روش K نزدیکترین همسایه برای دادههای گم شده
مباحث تکمیلی در پیش پردازش دادهها – نرمالسازی L1 و L2 و باینرایزر
همبستگی (Correlation) و روشهای Pearson، Spearman و Kendalls Tau در تحلیل دادههای همبسته
همبستگی دادهها در پایتون (مثال عملی مجموعه دادهی فوتبال آمریکایی)
مباحث تکمیلی EDA و آماده سازی دادهها (مثال مجموعه دادهی بازیهای تختهای)
مثال مجموعه دادهی اتومبیل و EDA بر روی دادهها
بخش سوم : مدل سازی
طبقه بندی مجموعه دادهی MNIST بخش مقدماتی
معرفی الگوریتم SVM و استفاده از آن در داده کاوی
معیارهای Accuarcy، Precision، Recall و F1 برای ارزیابی دقت، صحت و پوشش یک الگوریتم طبقه بندی
الگوریتم KNN (نزدیکترین همسایه) در طبقه بندی
الگوریتم درخت تصمیم و مجموعهی دادهی گلهای زنبق
ناخالصی جینی (Gini Impurity) و بهره اطلاعاتی (Information Gain)
بررسی مفهوم bias و variance در طبقه بندی
الگوریتم جنگل تصادفی (Random Forest)
الگوریتم Adaboost
نگاهی دقیقتر به پارامترهای الگوریتم SVM
نگاهی دقیقتر به پارامترهای الگوریتم RandomForest
نگاهی دقیقتر به پارامترهای الگوریتم KNN
متن کاوی (Text Mining) و پردازش زبان طبیعی (NLP) –
شناسایی بیماران قلبی با استفاده از الگوریتمهای طبقه بندی
پیدا کردن بهترین پارامترها در الگوریتمها با استفاده از جستجوی مشبک (Grid Search)
آشنایی با مسائل رگرسیون و حل مسئلهی پیشبینی دما
الگوریتم Gradient Boosting و XGBoost برای طبقهبندی و رگرسیون
الگوریتم XGBoost و حل مسئلهی تخمین قیمت منزل
الگوریتم CatBoost و حل مسئلهی تخمین خسارت حادثه شرکت بیمه
کاهش ابعاد
الگوریتم PCA و KernelPCA در کاهش ابعاد
الگوریتم Factor Analysis در کاهش ابعاد
الگوریتم ICA و ISOMAP برای کاهش ابعاد
الگوریتم TSNE و UMAP برای کاهش ابعاد
ترکیب الگوریتمهای کاهش ابعاد برای حل مسائل طبقه بندی
کار کردن با دادههای غیر متوازن (Imbalance) –
طبقه بندی تصاویر رنگی با استفاده از تکنیکهای پردازش تصویر
تحلیل و پیشبینی سری زمانی با استفاده از SARIMAX –
معرفی کتابخانهی Prophet برای پیشبینی سریهای زمانی
آشنایی با خوشه بندی (Clustering) و کاربردهای آن
معرفی الگوریتم KMeans و DBSCAN برای خوشه بندی دادهها
خوشهبندی بر اساس مدل RFM بر روی مشتریان فروشگاه اینترنتی
خوشهبندی، معیار WCSS و تکنیک Elbow
بررسی روش Silhouette و الگوریتم DBSCAN
تقسیمبندی تصاویر (Image Segmentation) با استفاده از الگوریتمهای خوشهبندی
خوشه بندی بر روی متون (Text Clustering) –
تشخیص دادههای پرت (Outlier Detection) –
آشنایی با شبکههای عصبی و پرسپترون
پیادهسازی یک شبکهی ساده عصبی با پایتون
چهارچوب تنسرفلو (tensorflow) و کراس (keras)
پیادهسازی شبکههای عصبی برای حل مسئلهی تشخیص بیماری قلبی عروقی با تنسرفلو و کراس
شبکههای عصبی کانولوشن (CNN) و مدل عمیق یادگیری
پیادهسازی یادگیری عمیق کانولوشنی (CNN) برای طبقه بندی تصاویر
پیادهسازی شبکههای عصبی کانولوشنی (CNN) و استفاده از تکنیک dropout
آشنایی با انواع توابع فعالسازی (activation functions)
کار با دادههای حجیم در یادگیری عمیق
مسئلهی شناخت بیماری از روی تصاویر xray قفسه سینه و کار با دادههای نامتوازن در یادگیری عمیق
آشنایی با مدلهای معروف یادگیری عمیق کانولوشنی در حل مسائل
پیادهسازی مدل ResNet و مدل پیش یادگیری شده در یادگیری عمیق با Tensorflow و Keras
پیادهسازی Resnet برای تشخیص تصاویر از وبکم لپتاپ
کار بر روی دادههای متنی (تحلیل احساس) با شبکههای عصبی عمیق کانولوشنی
شبکههای عصبی عمیق چند کاناله (حل مسئلهی تحلیل احساس متن)
شبکههای عصبی عمیق چندکاناله با ورودی چندگانه
شبکههای عصبی بازگشتی (RNN)
پیشبینی دادههای بورس با استفاده از شبکههای عصبی ساده بازگشتی (simple RNN)
پیادهسازی شبکههای عصبی بازگشتی (RNN) در تنسورفلو و کراس
شبکههای عصبی LSTM و GRU و معماریهای مختلف شبکههای عصبی بازگشتی
پیشبینی خرید/فروش رمزارز با شبکههای عصبی بازگشتی
یادگیری انتقالی (Transfer Learning) –
ساخت الگوریتم تولید شعر با شبکههای عصبی عمیق – (web scraping)
سیستم ترجمهی ماشینی ساده با الگوریتم یادگیری عمیق بازگشتی
طراحی سیستم ترجمهی ماشینی کامل با شبکههای Attention Network –
مقدمهای در مورد یادگیری تقویتی (Reinforcement Learning)
حل مسئلهی تاکسی خودران با یادگیری تقویتی
یادگیری تقویتی عمیق (Deep Reinforcement Learning) و شبکههای DDQN –
بخش چهارم : هوش مصنوعی
مفاهیم هوش مصنوعی
عاملهاي هوشمند
حل مسائل به وسیله جستجو
انواع جستجوهاي هوشمند و غیرهوشمند
حل مسائل با محدودیت به وسیله جستجو
جستجوي مینیمم ماکزیمم
مفاهیم منطق و منطق استنتاجی
عاملهاي منطقی منطق گزارهاي، رزولوشن، زنجیر جلورو و عقبرو
منطق رتبه اول و انواع استنتاج در آن
سیستمهاي مبتنی بر استنتاج منطقی
عدم قطعیت و سیستمهاي مبتنی بر استنتاج احتمالی
سیستمهاي تصمیمگیري
ساخت پایگاه دانش، روشهاي ارائه دانش
سیستمهاي خبره مبتنی بر قانون
استنتاج مبتنی بر حالت استدلال موردي
بخش پنجم : پروژه
همین الان ثبت نام کن
7 میلیون تومان
این فرصت استثنایی رو از دست نده!
7 میلیون تومان
نیاز به مشاوره تخصصی دارید؟
