ضریب تعیین و تحلیل آن در خروجی ایویوز مدل رگرسیون

آموزش های جلسه ای ایویوزضریب تعیین که به آن ضریب تشخیص نیز گفته می‌شود (Coefficient of Determination)، و تقریباً همه‌جا با علامت R2 نمایش داده می‌شود، معروف‌ترین معیار سنجش نیکویی برازش مدل است و عبارت است از: مجذور ضریب همبستگی بین y و ý (یعنی توان ۲ ضریب همبستگی بین مقادیر واقعی متغیر وابسته و مقادیر برآورد شده حاصل از مدل).

بنا بر تعریف، ضریب همبستگی می‌بایست بین ۱- و ۱ قرار گیرد. درنتیجه R2 که توان ۲ آن است بین صفر و یک قرار خواهد داشت. اگر این همبستگی زیاد باشد، مدل داده‌ها را خوب برازش کرده است، درحالی‌که اگر همبستگی پایین (نزدیک به صفر) باشد، مدل برازش خوبی از داده‌ها ارائه نداده است.

در حقیقت “ضریب تعیین” بیانگر نسبت تغییرات توضیح داده‌شده (ESS) به تغییرات کل (TSS) است:

R2 = ESS / TSS = (TSS – RSS) / TSS = ۱ – (RSS / TSS)

که RSS تغییرات باقیمانده‌ها (جملات خطا) مدل است.

عبارت فوق نشان می‌دهد که R2 بیانگر قدرت توضیح دهندگی یا ضریب خوبی مدل است.

ضریب همبستگی بین متغیر وابسته و مقادیر پیش‌بینی‌شده آن

ریشه ۲ ضریب تعیین را ضریب همبستگی بین y (متغیر وابسته مدل رگرسیون) و ý (مقدارهای پیش‌بینی‌شده برای y) می‌نامند. هر چه مقدار این ضریب بیشتر باشد، همبستگی بین متغیر وابسته و مقادیر پیش‌بینی‌شده آن بیشتر خواهد بود و مدل رگرسیون بهتری برازش شده است.

نیکویی برازش چیست

لازم است که همواره شاخص‌هایی برای سنجش چگونگی و میزان دقت برازش داده‌ها، به‌وسیله مدل‌های رگرسیونی داشته باشیم. به‌عبارت‌دیگر مایلیم برای سؤال زیر، ۱ پاسخ داشته باشیم:

مدل رگرسیون شامل متغیرهای توضیحی تا چه حد توانسته است تغییرات در متغیر وابسته را توضیح دهد؟

معیارهایی به نام “نیکویی برازش” وجود دارند که برای آزمون چگونگی و میزان دقت برازش داده‌ها توسط تابع رگرسیون مورداستفاده قرار می‌گیرند.

ضریب تعیین یکی از معروف‌ترین شاخص‌های نیکویی برازش است.

معایب ضریب تعیین به‌عنوان شاخص نیکویی برازش

محاسبه R2 یا ضریب تعیین آسان و تفسیر آن ساده است، ولی بااین‌حال این معیار معروف نیکویی برازش معایبی نیز به شرح زیر دارد:

۱-۳- عیب اول
R2 برحسب تغییرات y نسبت به ý تعریف می‌شود؛ حال اگر مقادیر و متغیر وابسته کمی تغییر کند، حتی اگر مدل حاصله نسبت به مدل قبلی تفاوت چندانی نداشته باشد و RSS (تغییراتی که مدل قادر به توضیح آن نیست) ۲ مدل نیز برابر باشد، R2 تغییر می‌کند. بنابراین، مقایسه R2 در مدل‌هایی که متغیر وابسته متفاوت دارند معقول نیست.

۲-۳- عیب دوم
اگر متغیرهای توضیحی (X ها) بیشتری وارد مدل شوند، R2 افزایش می‌یابد و یا ثابت می‌ماند. زیرا متغیر اضافه‌شده جدید، نقشی هرچند کم در تبیین متغیر y خواهد داشت. این ویژگی، R2 را به‌عنوان معیاری جهت انتخاب مدل و متغیرهای آن، غیرمعقول جلوه می‌دهد.

۳-۳- عیب سوم
برای رگرسیون‌های سری زمانی (برخلاف رگرسیون‌های مقطعی)، R2 می‌تواند بیش‌ازحد نشان داده شود و بنابراین برای تمایز بین مدل‌ها R2 معیار خوبی نخواهد بود، چراکه رده گسترده‌ای از مدل‌ها، مقادیر R2 بالایی دارند.

منظور از رگرسیون سری زمانی، مدل رگرسیون با داده‌های سری زمانی است. برای آشنایی کامل با انواع داده‌ها در اقتصادسنجی و شیوه ورود داده‌ها به نرم‌افزار ایویوز.

ضریب تعیین تعدیل‌شده

به‌منظور اجتناب از عیب دوم، تعدیلی روی ضریب تعیین صورت می‌گیرد به این طریق که، کاهش درجه آزادی به وجود آمده ناشی از افزایش متغیرهای اضافی، که در محاسبه ضریب تعیین لحاظ نمی‌شود، در نظر گرفته می‌شود (زیرا با افزایش متغیرهای توضیحی (X ها) جدید به مدل، درجه آزادی کاهش می‌یابد).

این R2 جدید یا ضریب تعیین تعدیل‌شده به‌صورت زیر تعریف می‌شود:

adj.R2 = ۱ – { (T-1)/(T-k) * (۱-R2) }

در این صورت با اضافه شدن یک متغیر مستقل جدید به مدل، تعداد پارامترها (k) افزایش می‌یابد و اثر افزایش R2 را خنثی می‌کند. بنابراین در مدل‌سازی، R2 تعدیل‌شده می‌تواند به‌عنوان ابزار تصمیم‌گیری، جهت تعیین وجود یا عدم وجود متغیر موردنظر، در مدل استفاده شود. اگر با اضافه شدن متغیر مستقل به مدل، R2 تعدیل‌شده افزایش یابد، متغیر اضافه‌شده در مدل باقی می‌ماند و اگر R2 تعدیل‌شده کاهش یابد، متغیر از مدل حذف می‌شود.

۱-۴- معایب ضریب تعیین تعدیل‌شده
البته هنوز مشکلاتی در رابطه با حداکثر سازی R2 تعدیل‌شده به‌عنوان معیار انتخاب مدل وجود دارد؛ اصلی‌ترین مشکل این است که این معیار بسیار انعطاف‌پذیر یا به‌اصطلاح “نرم” است و لذا محققان با پیروی از آن به یک مدل بزرگ، با تعداد زیادی متغیر مستقل می‌رسند که بیشتر متغیرهای آن به‌صورت مرزی معنادارند یا اصلاً معنادار نمی‌باشند.

اگر مدل رگرسیون، عرض از مبدأ داشته باشد، حداقل مقدار R2 صفر خواهد شد، اما بدون وجود عرض از مبدأ در مدل، ممکن است مقدار R2 منفی شود. درحالی‌که اگر مدل، داده‌ها را به شکل ضعیفی برازش کند و مدل دارای عرض از مبدأ نیز باشد، امکان منفی شدن R2 تعدیل‌شده وجود دارد. این مورد نیز از معایب ضریب تعیین تعدیل‌شده است.

ضریب تعیین در خروجی نرم‌افزار ایویوز و تفسیر آن

در خروجی‌های نرم‌افزار ایویوز، ضریب تعیین بانام R-squared و ضریب تعیین تعدیل‌شده بانام Adjusted R-squared نمایش داده می‌شود. تصویر زیر یک نمونه خروجی نرم‌افزار ایویوز (مدل رگرسیون پانل دیتا) را نشان می‌دهد و ضریب تعیین در آن مشخص‌شده است:

ضریب تعیین و تحلیل آن در خروجی ایویوز مدل رگرسیون

در مدل داده‌های تابلویی فوق، متغیر Y متغیر وابسته و متغیرهای X1, X2, X3 متغیرهای مستقل یا توضیحی هستند.

در خروجی فوق، ازآنجایی‌که مقدار احتمال برای متغیرهای X1 و X2 کمتر از ۰.۰۵ می‌باشد، این متغیرهای دارای تأثیر معنی‌داری بر روی متغیر Y دارند.

معمولاً به‌جای ضریب تعیین، ضریب تعیین تعدیل‌شده تفسیر می‌گردد. تفسیر R2 تعدیل‌شده فوق به‌قرار زیر است:

ازآنجایی‌که ضریب تعیین تعدیل‌شده برابر ۰.۵۵۷ می‌باشد، نتیجه گرفته می‌شود که ۵۵.۷ درصد از تغییرات در متغیر وابسته Y توسط مدل فوق (متغیرهای X1, X2, X3) تبیین و توضیح داده‌شده است.

در نوشت یار یک دوره آموزشی ایویوز ویژه تحلیل پایان نامه تهیه کرده ایم.

برای ورود به صفحه دوره آموزش ایویوز اینجا کلیک کنید.

ضریب تعیین و تحلیل آن در خروجی ایویوز مدل رگرسیون
4.5 (90%) 2 votes

ممکن است شما دوست داشته باشید

ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.