داده های پانلی در آمار و اقتصادسنجی، مجموعه داده های پانلی شامل مشاهداتی برای چندین بخش (خانوار، بنگاه و...) هستند که در طی زمان های مختلف جمع آوری شده اند. یعنی یک مدل داده های پانل حاوی اطلاعاتی در زمان و مکان است که شامل N مؤلفه در T دورهٔ زمانی است.
http://en.wikipedia.org/wiki/Random_effects_model
http://en.wikipedia.org/wiki/Fixed_effects_model
http://en.wikipedia.org/wiki/Hausman_test
اگر تعداد مشاهدات زمانی برای تمام مؤلفه های موجود در پانل یکسان باشد، به آن پانل متوازن (Balanced Panel) گفته می شود، اما درصورتی که مشاهدات مفقوده ای برای تعدادی از مؤلفه ها وجود داشته باشد، پانل را نامتوازن می نامیم.
۱- محققان می توانند از داده های پانلی برای مواردی که مسائل را نمی توان صرفاً به صورت سری زمانی یا برشهای مقطعی بررسی کرد، بهره گیرند. مثلاً در بررسی تابع تولید مسئله ای که وجود دارد این است که بتوان تغییرات تکنولوژیک را از بهره وری نسبت به مقیاس TFP تفکیک کرد. در این گونه موارد داده های مقطعی فقط اطلاعاتی را در مورد صرفه های به مقیاس فراهم می آورد. در حالی که داده های سری زمانی اثرات هردو را بدون هیچ گونه تفکیکی نشان می دهد. تلفیق داده های سری زمانی با داده های مقطعی نه تنها می تواند اطلاعات سودمندی را برای تخمین مدل های اقتصادسنجی فراهم آورد، بلکه بر مبنای نتایج به دست آمده می توان استنباط های سیاست گزاری درخور توجهی نیز به عمل آورد.
۲- داده های پانلی حاوی اطلاعات بیشتر، تنوع گسترده تر و هم خطی کمتر میان متغیرها بوده و در نتیجه کاراتر می باشند. درحالی که در سری های زمانی هم خطیِ بیشتری را بین متغیرها مشاهده می کنیم. با توجه به اینکه داده های پانلی ترکیبی از سری های زمانی و مقطعی می باشد، بعد مقطعی موجب اضافه شدن تنوع زیادی شده و در نتیجه برآوردهای معتبرتری را می توان انجام داد. در اینجا تعداد مشاهدات ما به NT افزایش یافته که منجر به برآوردهای کاراتری از متغیرها می شود. این امر را می توان در محاسبه واریانس جامعه مشاهده کرد. در داده های سری زمانی این واریانس به صورت σ^2=σ2/N-K محاسبه می شود ولی در داده های پانلی به صورت σ^2=σ2/NT-N-K قابل محاسبه است. چون مخرج کسر دومی بزرگتر از کسر اولی است، پس واریانس داده های پانلی کمتر بوده و بنابراین تخمین کاراتری خواهد داشت.
http://en.wikipedia.org/wiki/Random_effects_model
http://en.wikipedia.org/wiki/Fixed_effects_model
http://en.wikipedia.org/wiki/Hausman_test
اگر تعداد مشاهدات زمانی برای تمام مؤلفه های موجود در پانل یکسان باشد، به آن پانل متوازن (Balanced Panel) گفته می شود، اما درصورتی که مشاهدات مفقوده ای برای تعدادی از مؤلفه ها وجود داشته باشد، پانل را نامتوازن می نامیم.
۱- محققان می توانند از داده های پانلی برای مواردی که مسائل را نمی توان صرفاً به صورت سری زمانی یا برشهای مقطعی بررسی کرد، بهره گیرند. مثلاً در بررسی تابع تولید مسئله ای که وجود دارد این است که بتوان تغییرات تکنولوژیک را از بهره وری نسبت به مقیاس TFP تفکیک کرد. در این گونه موارد داده های مقطعی فقط اطلاعاتی را در مورد صرفه های به مقیاس فراهم می آورد. در حالی که داده های سری زمانی اثرات هردو را بدون هیچ گونه تفکیکی نشان می دهد. تلفیق داده های سری زمانی با داده های مقطعی نه تنها می تواند اطلاعات سودمندی را برای تخمین مدل های اقتصادسنجی فراهم آورد، بلکه بر مبنای نتایج به دست آمده می توان استنباط های سیاست گزاری درخور توجهی نیز به عمل آورد.
۲- داده های پانلی حاوی اطلاعات بیشتر، تنوع گسترده تر و هم خطی کمتر میان متغیرها بوده و در نتیجه کاراتر می باشند. درحالی که در سری های زمانی هم خطیِ بیشتری را بین متغیرها مشاهده می کنیم. با توجه به اینکه داده های پانلی ترکیبی از سری های زمانی و مقطعی می باشد، بعد مقطعی موجب اضافه شدن تنوع زیادی شده و در نتیجه برآوردهای معتبرتری را می توان انجام داد. در اینجا تعداد مشاهدات ما به NT افزایش یافته که منجر به برآوردهای کاراتری از متغیرها می شود. این امر را می توان در محاسبه واریانس جامعه مشاهده کرد. در داده های سری زمانی این واریانس به صورت σ^2=σ2/N-K محاسبه می شود ولی در داده های پانلی به صورت σ^2=σ2/NT-N-K قابل محاسبه است. چون مخرج کسر دومی بزرگتر از کسر اولی است، پس واریانس داده های پانلی کمتر بوده و بنابراین تخمین کاراتری خواهد داشت.
wiki: داده های پانلی