شاخص لینکلن یک معیار اندازه گیری آماری در زمینه های مختلف است که به منظور برآورد تعداد موردهایی است که هنوز مشاهده نشده است که بر اساس دو مجموعه مستقل که هردو به صورت جداگانه مشاهده شده اند. توسط فردریک چارلز لینکلن در سال ۱۹۳۰ توضیح داده شده است که این شاخص را به به عنوان روش لینکلن-پترسون پس از C. G. یوهانس پترسن که اولین نفری بود که از روش مشابه علامت زدن و بازگرفتن استفاده کرد.
نمونه نظریه
دریک معادله
دو ناظر را در نظر بگیرید که به طور جداگانه به شمارش تعداد گونه مختلف از گیاهان یا حیوانات در یک منطقه می پردازند. اگر هر یک از آن ها برگردد و پس از پیدا کردن ۱۰۰ گونه که تنها ۵ گونه خاص یکسان توسط هر دو ناظر پیدا شده اند، بنابراین ۹۵ گونه حداقل توسط یک ناظر از بین رفته است. (که این عدد یعنی ۹۵ گونه دیگر توسط ناظر دیگر پیدا شده است). بنابراین هر دو ناظر مقداری زیادی گونه ناشناخته را از دست داده اند. از سوی دیگر، اگر ۹۹ از ۱۰۰ گونه هر ناظر مشابه ناظر دیگر باشد، این انتظار منصفانه است که درصد بالایی از گونه هایی که در آنجا زندگی می کنند را پیدا کردند.
همان استدلال برای روش علامت زدن و بازگرفتن انجام می شود. اگر برخی از حیوانات در یک منطقه مشخص شده علامت زده شوند و سپس آزاد شوند، و سپس بعداً دور دومی همین کار صورت بگیرد: تعداد حیوانات علامت زده شده در دور دوم می تواند برای تولید تخمینی از کل جمعیت استفاده شود.
مثال دیگری مطرح در زبانشناسی محاسباتی برای برآورد کل واژه های یک زبان است. با توجه به دو نمونه مستقل، از همپوشانی بین واژه های آن ها، این ویژگی مفید برآورد که چه بسیار واژه هایی وجود دارند اما در هیچ نمونه ای مشاهده نشده است. یک مثال مشابه شامل برآورد تعداد اشتباهات تایپی باقی مانده در یک متن از شمارش دو ویرایشگر متن می توان اشاره کرد.
نمونه نظریه
دریک معادله
دو ناظر را در نظر بگیرید که به طور جداگانه به شمارش تعداد گونه مختلف از گیاهان یا حیوانات در یک منطقه می پردازند. اگر هر یک از آن ها برگردد و پس از پیدا کردن ۱۰۰ گونه که تنها ۵ گونه خاص یکسان توسط هر دو ناظر پیدا شده اند، بنابراین ۹۵ گونه حداقل توسط یک ناظر از بین رفته است. (که این عدد یعنی ۹۵ گونه دیگر توسط ناظر دیگر پیدا شده است). بنابراین هر دو ناظر مقداری زیادی گونه ناشناخته را از دست داده اند. از سوی دیگر، اگر ۹۹ از ۱۰۰ گونه هر ناظر مشابه ناظر دیگر باشد، این انتظار منصفانه است که درصد بالایی از گونه هایی که در آنجا زندگی می کنند را پیدا کردند.
همان استدلال برای روش علامت زدن و بازگرفتن انجام می شود. اگر برخی از حیوانات در یک منطقه مشخص شده علامت زده شوند و سپس آزاد شوند، و سپس بعداً دور دومی همین کار صورت بگیرد: تعداد حیوانات علامت زده شده در دور دوم می تواند برای تولید تخمینی از کل جمعیت استفاده شود.
مثال دیگری مطرح در زبانشناسی محاسباتی برای برآورد کل واژه های یک زبان است. با توجه به دو نمونه مستقل، از همپوشانی بین واژه های آن ها، این ویژگی مفید برآورد که چه بسیار واژه هایی وجود دارند اما در هیچ نمونه ای مشاهده نشده است. یک مثال مشابه شامل برآورد تعداد اشتباهات تایپی باقی مانده در یک متن از شمارش دو ویرایشگر متن می توان اشاره کرد.
wiki: شاخص لینکلن