رگرسیون در لغت به معنی بازگشت می باشد و در اصطلاح کاربردی یعنی پی بردن به رفتار یک متغیر به کمک رفتار متغیر دیگر در آمار رگرسیون یعنی یک نوع رابطه یا تابع ریاضی که بین متغیر وابسته از یک سو y و متغیرهای مستقل از سوی دیگر برقرار می باشد . دریافت روابط علت و معلولی بین عوامل تاثیرگذار (x) و تاثیرپذیر (y) ، حصول اطمینان از وجود همبستگی معنی دار بین دو متغیر و همچنین هدف گذاری برای برآورد یک متغیر بر حسب متغیر دیگر است . تحلیل رگرسیونی یک ابزار آماری مفید برای دیدن رابطه ی بین متغیرها به کار می رود .

تحلیل رگرسیون فن و تکنیکی آماری برای بررسی و به مدل در آوردن ارتباط بین متغیرهاست . کاربردهای رگرسیون متعدد است . و تقریباً در هر زمینه ای از جمله مهندسی ، فیزیک ، اقتصاد ، مدیریت ، علوم زیستی و بیولوژی و علوم اجتماعی صورت می پذیرد . در حقیقت تحلیل رگرسیونی ممکن است فن و تکنیک آماری با بیشترین و وسیع ترین کاربرد بین تکنیک های آماری باشد .

 

کاربردهای رگرسیون : مدل های رگرسیونی برای مقاصدی چند مشتمل بر موارد زیر مورد استفاده قرار می گیرند . 1-     توصیف داده ها

2-     برآورد پارامترها

3-     پیشگویی و برآورد

4-     کنترل

منبع :   http://sepideh_statistic.persianblog.ir/

دو بخش اصلی رگرسیون در آمار وجود دارد : پارامتری و ناپارامتری.

در رگرسیون پارامتری نوع ارتباط بین متغیر های وابسته و مستقل شناخته شده است، اما ممکن است پارامترها مقادیری را شامل شوند که ناشناخته بوده و صلاحیت برآورد مجموعهء داده ها را نداشته باشند. برای مثال یک خط راست برازش داده شده،

f(x)=ax+b

بر حسب یک دسته از نقاط،      

{( xi , ŷi )} : i=1,…,p

 

رگرسیون پارامتری می باشد چرا که نوع ارتباط وابستگی y را روی x نشان می دهد هر چند تمام مقادیر a و b نیستند.

نوعاً در هر مسئله پارامتری معین، پارامترهای آزاد بهتر از متغیر های وابسته و مستقل دارای تفسیر معنادار هستند، مانند " سطح میزان آب اولیه" یا " میزان سرعت حرکت آب".

علائم ویژه رگرسیون ناپارامتری زمانی مشاهده می شود که آگاهی قبلی در مورد نوع واقعی تابعی که قرار برآورد شود وجود ندارد.تابع مورد استفاده مدلی است با معادله ای که در بردارندهء پارامترهای آزاد می باشد، اما روشی که کلاس پهناوری از توابعی که نمایانگر مدل می باشند را می پذیرند.

در رگرسیون پارامتری نوعاً یک تعداد کم از پارامترها، که اغلب آنها تفسیر فیزیکی( طبیعی) دارند، وجود دارد. به عبارت دیگر هدف اصلی رگرسیون می تواند، و اغلب هم هست، برآورد مقادیر پارامتری باشد چرا که مفهوم اصلی آنها می باشد.

 

مقدمات رگرسیون ناپارامتری :

 

تحلیل رگرسیون ناپارامتری، رگرسون بدون فرض خطی می باشد . هدف رگرسو ن ناپارامتری پهنه وسیعی از هموار سازی می باشد که ارتباط بین دو متغیر در نمودار پرا کنش، تحلیل رگر سیون چند گانه و مدلهای رگرسیونی کلی را دربردارد. ( برای مثال رگرسیون لجستیک ناپاراتی برای یک متغیر پاسخ دو تایی )

تا چند سال پیش روشهایی از تجزیه و تحلیل رگرسیون ناپاراتی که به طور کاربردی به وسیله پیشرفت در آمار و علم حساب به عمل حساب آمده باشد، دور از ذهن به نظر می رسد و هم اکنون یک شق مهمتر از مدلسازی سنت گرای رگرسیون پارامتری می باشد. این حرکت کوتاه پهنه از مقدمه رگرسیون ناپاراتی راکه عناوین ارائه شده راپوشش می دهد تامین می کند.

معرفی رگرسیون ناپارامتری :

 معدل گیری موضعی برآورگرها ی کرنل رگرسیون ناپارامتری نیرومند،رگرسیون و هموار سازی دسته های باریک، استناج آماری برای رگرسیون ناپارامتری در تجزیه و تحلیل داده ها ، رگرسیون چند متغیر ناپارامتری به انضمام مدلهای رگرسیون افزایشی ، رگرسیون ناپارامتری تعمیم یافته و مدلهای تعمیم یافته افزایشی.

رگرسیون ناپارامتری معمولاً در فرضیات خطی آزاد می باشد و شما را به

شرح داده های بصری ، ساختار غیرپوششی در داده ها که ممکن است

به نحوی گمشده باشد ، قادر می سازد. بنابراین خیلی از روشهای

رگرسیون ناپارامتری هنگامی که تعداد متغیر های مستقل در مدل زیاد

می باشد به خوبی اجرا نمی شوند.پراکندگی داده ها در این مجموعه

سبب می شود بر آوردهای واریانس به اندازه غیر قابل پذیرش بزرگ شود،

مگر آنکه حجم نمونه فوق العاده بزرگ باشد. قابلیت تفسیر یکی دیگر از

مسایل رگرسیون ناپارامتری است که بر پایه کرنل و هموارسازی برآورد

گرهای خط  sp می باشد. اطلاعات این برآورد گرها شامل رابطه بین متغیرهای مستقل و وابسته می باشد که اغلب درک آنها دشوار است.

برای بر طرف کردن این مشکلات،استون(1985)مدلهای جمع پذیر را پیشنهاد کرد.این مدلها یک تقریب فزآینده ی تابع رگرسیون چند متغیره را

برآورد می کنند. مزایای یک تقریب فز آینده حداقل دو مورد است.اول اینکه هر کدام از اصطلاحات جمع پذیر با استفاده از یک صافی یک متغیری منحصر فرد تخمین زده می شوند. دوم اینکه ظوابط منحصر به فرد توضیح می دهند که چگونه متغیر وابسته با وجود متغیرهای مستقل برآورد می شود.

توسعه مدل جمع پذیر به سوی یک میدان وسیع از خانواده های توزیع؛ هاستی و تیب شیرانی (1990) مدلهای جمع پذیر تعمیم یافته را پیشنهاد دادند. این مدلها قادرند میانگین متغیر وابسته را به یک دستگاه جمع پذیر از طریق یک تابع خطی ربط دهند. این مدل اجازه می دهد توزیع احتمال متغیر پاسخ هر عضو، از طریق خانوادهء نمائی باشد.

در خیلی مواردمدلهای آماری در یک دستهء خاص مورد استفاده قرار می گیرند؛ آنها مدلهای جمع پذیر برای داده های نرمال، مدلهای لجستیک ناپارامتری برای داده های دوجمله ای و مدلهای لگ خطی ناپارامتری برای داده ها ی پواسن را در بر دارند.

تحلیل رگرسیون ناپارامتری:

رگرسیون ناپارامتری فرضیات کمینه در مورد وابستگی میانگین Y بر روی X ها را درست می کند. این جریان کوتاه برآوردگرهای رگرسیون ناپارامتری را به دو صورت برای تحلیل رگرسیون ساده(یک X تنها) - - موسوم به نمدار پراگندگی هموارساز- - و تحلیل  رگرسیون چند متغیره(چندین X) معرفی می کند.

ما به طور طبیعی این برآوردگرها را، برآوردگر کرنل( میانگین وزن دار شده)، برآوردگرهای چندجمله ای(lowess) و مدلهای جمع پذیر رگرسیون ناپارامتری، توضیح می دهیم. چند ملاحظه نیز برای روشهای استنتاج آماری برای رگرسیون ناپارامتری وجود دارد، که شبیه بکار گرفته شده برای حداقل مربعات خطی می باشد.


 http://espadana.mihanblog.com/Post-35.aspx

 

 

+ نوشته شده در 87/02/18ساعت توسط ندا امانیان |