ماشین بردار پشتیبانی و پیش بینی سری زمانی داده های آب

۲۱ بهمن ۹۹ ، ۲۱:۵۸ نويسنده: بهزاد سرهادی

ماشین بردار پشتیبانی (Support vector machines - SVMs) یکی از روش‌های یادگیری با نظارت است که از آن برای طبقه‌بندی و رگرسیون استفاده می‌کنند. این روش از جملهٔ روش‌های نسبتاً جدیدی است که در سال‌های اخیر کارایی خوبی نسبت به روش‌های قدیمی‌تر برای طبقه‌بندی نشان داده‌است. مبنای کاری دسته‌بندی کنندهٔ SVM دسته‌بندی خطی داده‌ها است و در تقسیم خطی داده‌ها سعی می‌کنیم خطی را انتخاب کنیم که حاشیه اطمینان بیشتری داشته باشد. حل معادله پیدا کردن خط بهینه برای داده‌ها به وسیله روش‌های QP که روش‌های شناخته شده‌ای در حل مسائل محدودیت‌دار هستند صورت می‌گیرد. قبل از تقسیمِ خطی برای اینکه ماشین بتواند داده‌های با پیچیدگی بالا را دسته‌بندی کند داده‌ها را به وسیلهٔ تابعِ phi به فضای با ابعاد خیلی بالاتر می‌بریم. برای اینکه بتوانیم مسئله ابعاد خیلی بالا را با استفاده از این روش‌ها حل کنیم از قضیه دوگانی لاگرانژ برای تبدیلِ مسئلهٔ مینیمم‌سازی مورد نظر به فرم دوگانی آن که در آن به جای تابع پیچیدهٔ phi که ما را به فضایی با ابعاد بالا می‌برد، تابعِ ساده‌تری به نامِ تابع هسته که ضرب برداری تابع phi است ظاهر می‌شود استفاده می‌کنیم. از توابع هسته مختلفی از جمله هسته‌های نمایی، چندجمله‌ای و سیگموید می‌توان استفاده نمود.

ماشین های بردار پشتیبانی (SVM) مجموعه ای از روش های یادگیری نظارت شده است که برای طبقه بندی، رگرسیون و تشخیص داده های پرت استفاده می شود.

مزایای ماشین های بردار پشتیبانی عبارتند از:

در فضاهای با ابعاد بالا موثر است.
هنوز هم در مواردی که تعداد ابعاد از تعداد نمونه بیشتر باشد، موثر است.
در عملکرد تصمیم گیری از زیر مجموعه ای از نکات آموزشی استفاده می کند (بردارهای پشتیبانی نامیده می شوند)، بنابراین حافظه نیز کارآمد است.
همه کاره: توابع مختلف هسته را می توان برای عملکرد تصمیم گیری کرد. هسته های متداول ارائه شده است، اما امکان تعیین هسته های سفارشی نیز وجود دارد.

از معایب ماشین های بردار پشتیبانی می توان به موارد زیر اشاره کرد:

اگر تعداد ویژگی ها بسیار بیشتر از تعداد نمونه ها است، از انتخاب بیش از حد در توابع هسته جلوگیری کنید و اصطلاح تنظیم آن بسیار مهم است.

SVM ها تخمین احتمالات را مستقیماً ارائه نمی دهند، اینها با استفاده از اعتبار سنجی متقابل پنج برابر گران محاسبه می شوند (به نمرات و احتمالات در زیر مراجعه کنید).

ماشین های بردار پشتیبانی در scikit-learn از بردارهای نمونه متراکم (numpy.ndarray و قابل تبدیل به آن توسط numpy.asarray) و تجزیه (هر scipy.sparse) پشتیبانی می کنند. با این حال، برای استفاده از SVM برای پیش بینی داده های پراکنده، باید بر روی چنین داده هایی تناسب داشته باشد. برای عملکرد مطلوب، از numpy.ndarray (متراکم) یا scipy.sparse.csr_matrix (پراکنده) با دستور C با dtype = float64 استفاده می شود.

رگرسیون

روش طبقه بندی بردار پشتیبانی را می توان برای حل مسائل رگرسیون گسترش داد. به این روش Support Vector Regression گفته می شود.

مدل تولید شده توسط طبقه بندی بردار پشتیبانی فقط به زیرمجموعه ای از داده های آموزش بستگی دارد، زیرا تابع هزینه ساخت مدل به نقاط آموزشی فراتر از حاشیه اهمیتی نمی دهد. به طور مشابه، مدل تولید شده توسط Support Vector Regression تنها به زیرمجموعه ای از داده های آموزش بستگی دارد، زیرا تابع هزینه نمونه هایی را که پیش بینی آنها نزدیک به هدف است، نادیده می گیرد.

سه پیاده سازی مختلف از رگرسیون برداری پشتیبانی وجود دارد: SVR ،NuSVR و LinearSVR. LinearSVR پیاده سازی سریع تری نسبت به SVR فراهم می کند اما فقط هسته خطی را در نظر می گیرد، در حالی که NuSVR فرمولی کمی متفاوت از SVR و LinearSVR را پیاده سازی می کند.

همانند کلاسهای طبقه بندی، روش fit به عنوان بردارهای آرگومان X، y در نظر گرفته می شود، فقط در این حالت انتظار می رود y به جای مقادیر صحیح، دارای مقادیر شناور باشد:

>>> from sklearn import svm
>>> X = [[0, 0], [2, 2]]
>>> y = [0.5, 2.5]
>>> regr = svm.SVR()
>>> regr.fit(X, y)
SVR()
>>> regr.predict([[1, 1]])
array([1.5])

مدیر سایت: بهزاد سرهادی

شماره تلفن: 09190622992

شناسه تلگرام مدیر سایت: SubBasin@

نشانی ایمیل: behzadsarhadi@gmail.com

(سوالات تخصصی را در گروه تلگرام ارسال کنید)

_______________________________________________________

پروژه تخصصی در لینکدین

براي پيوستن به بزرگترين گروه تلگرام علوم و مهندسي آب با امکان تبادل نظر بين اعضاء کليک کنيد

کتاب کاربرد مدل QUAL2KW

کتاب کاربرد GIS در منابع آب

کتاب محاسبه سيل طرح

نظرات (۰)

هيچ نظري هنوز ثبت نشده است

فرم ارسال نظر

ارسال نظر آزاد است، اما اگر قبلا در بیان ثبت نام کرده اید می توانید ابتدا وارد شوید.

نام *

پست الکترونيک

سایت یا وبلاگ

پیام *

شما میتوانید از این تگهای html استفاده کنید:

یا ، یا ، ، <strike> یا <s>، ، ، <blockquote>، <code>، <pre>، <hr>، ، ، <a href="" title="">، ، <div align="">

کد امنیتی *

ارقام فارسی و انگلیسی پذیرفته می‌شوند

نظر بصورت خصوصی ارسال شود

پست الکترونیک برای عموم قابل مشاهده باشد

ويدئوهاي آموزش جامع نرم افزار HEC-HMS - مدل بارش رواناب

ويدئو مدلسازي کمي جريان آب زيرزميني با SEAWAT- GMS

پروژه جامع هيدرولوژي-آناليز منطقه اي، فيزيوگرافي، مدل بارش-رواناب

کتاب تحلیل مدل های تعادلی و ارائه مدل ایزوترم جذب

آموزش مدل سازی سیل با Aquaveo SMS - TUFLOW + کتاب

پروژه تخلیه آب زیرسطحی از فونداسیون یک برج

درباره بهترين هاي بيسيـــن بدانيد...

يکي از مهمترين اهداف اين سايت تهيه آموزش هاي روان از ابزارهاي کاربردي علوم آب است.

اهميت مطالعات محيطي با ابزارهاي نوين در چيست؟

امروز با فارغ التحصيلي جمع کثير دانشجويان سالهاي گذشته و حال، با گذر از کمي گرايي ديگر صرف وجود مدارک دانشگاهي حرف اول را در بازار کار نمي زند؛ بلکه سنجش ديگري ملاک؛ و شايسته سالاري به ناچار! باب خواهد شد. يکي از مهم ترين لوازم توسعه علمي در هر کشور و ارائه موضوعات ابتکاري، بهره گيري از ابزار نوين است، بيسين با همکاري مخاطبان مي تواند در حيطه علوم آب به معرفي اين مهم بپردازد.

جستجو در بيسين