فرایند دستیابی به اطلاعات از یک مجموعه
بازیابی اطلاعات
فرهنگ فارسی
دانشنامه عمومی
بازیابی اطلاعات (به انگلیسی: Information Retrieval) فعالیت بدست آوردن منابع سیستم اطلاعاتی که مربوط به اطلاعات لازم از یک مجموعه است را می گویند. جستجوها می توانند برپایه جستجوی تمام متن یا سایر جستجوهای مبتنی بر محتوا نمایه گذاری شوند. بازیابی اطلاعات علم جستجو اطلاعات در یک سند، جستجو برای خود سندها، جستجو برای فراداده ها که داده ها را توصیف می کنند و برای پایگاه داده های متنی، عکسی یا آوایی است.سیستم های بازیابی اطلاعات خودکار برای کاهش چیزی که آن را سرریز داده ها (اضافه بار اطلاعات) میگوییند، استفاده می شوند. سیستم بازیابی اطلاعات نرم افزاری است که دسترسی، ذخیره و مدیریت کتاب ها، مقالات و دیگر سندها را فراهم می کند.
مدل دودویی (یا دوگانی): در مدل دودویی (یا دوگانی) هر سند (document) به صورت کیفی پر از کلمات (bag of words) در نظر گرفته می شود.
مدل بُرداری: در مدل بُرداری، هر سند به صورت برداری از کلمات در یک فضای برداری چند بُعدی در نظر گرفته می شود که ابعاد آن را کلمات تشکیل می دهند. مؤلفه های این بردار سند، در واقع وزن هایی هستند که نشان می دهند هر یک از کلمات چقدر در متمایز کردن آن سند دخیل هستند.
مدل احتمالاتی: در مدل احتمالاتی، به هر سند احتمالی اختصاص داده می شود که مربوط بودن آن مستند را به نیاز کاربر به صورت احتمال بین صفر و یک بیان می کند.
موتورهای جستجوگر وب (موتور جستجوی وب) از قابل مشاهده ترین برنامه های کاربردی بازیابی اطلاعات هستند.
با افزایش روزافزون حجم اطلاعات ذخیره شده در منابع قابل دسترس و گوناگون، فرایند بازیابی و استخراج اطلاعات اهمیت ویژه ای یافته است. اطلاعات مورد نظر ممکن است شامل هر نوع منبعی مانند متن، تصویر، صوت و ویدئو باشد. بر خلاف پایگاه داده ها، اطلاعات ذخیره شده در منابع اطلاعاتی بزرگ مانند وب و زیرمجموعه های آن مانند شبکه های اجتماعی از ساختار مشخصی پیروی نمی کنند و عموماً دارای معانی تعریف شده و مشخصی نیستند. هدف بازیابی اطلاعات در چنین شرایطی، کمک به کاربر برای یافتن اطلاعات موردنظر در انبوهی از اطلاعات ساختار نایافته است.
جستجوگرهای گوگل، یاهو و بینگ سه نمونه از پراستفاده ترین سیستم های بازیابی اطلاعات هستند که به کاربران برای بازیابی اطلاعات متنی، تصویری، ویدئویی و غیره کمک می کنند.
مدل دودویی (یا دوگانی): در مدل دودویی (یا دوگانی) هر سند (document) به صورت کیفی پر از کلمات (bag of words) در نظر گرفته می شود.
مدل بُرداری: در مدل بُرداری، هر سند به صورت برداری از کلمات در یک فضای برداری چند بُعدی در نظر گرفته می شود که ابعاد آن را کلمات تشکیل می دهند. مؤلفه های این بردار سند، در واقع وزن هایی هستند که نشان می دهند هر یک از کلمات چقدر در متمایز کردن آن سند دخیل هستند.
مدل احتمالاتی: در مدل احتمالاتی، به هر سند احتمالی اختصاص داده می شود که مربوط بودن آن مستند را به نیاز کاربر به صورت احتمال بین صفر و یک بیان می کند.
موتورهای جستجوگر وب (موتور جستجوی وب) از قابل مشاهده ترین برنامه های کاربردی بازیابی اطلاعات هستند.
با افزایش روزافزون حجم اطلاعات ذخیره شده در منابع قابل دسترس و گوناگون، فرایند بازیابی و استخراج اطلاعات اهمیت ویژه ای یافته است. اطلاعات مورد نظر ممکن است شامل هر نوع منبعی مانند متن، تصویر، صوت و ویدئو باشد. بر خلاف پایگاه داده ها، اطلاعات ذخیره شده در منابع اطلاعاتی بزرگ مانند وب و زیرمجموعه های آن مانند شبکه های اجتماعی از ساختار مشخصی پیروی نمی کنند و عموماً دارای معانی تعریف شده و مشخصی نیستند. هدف بازیابی اطلاعات در چنین شرایطی، کمک به کاربر برای یافتن اطلاعات موردنظر در انبوهی از اطلاعات ساختار نایافته است.
جستجوگرهای گوگل، یاهو و بینگ سه نمونه از پراستفاده ترین سیستم های بازیابی اطلاعات هستند که به کاربران برای بازیابی اطلاعات متنی، تصویری، ویدئویی و غیره کمک می کنند.
wiki: بازیابی اطلاعات
فرهنگستان زبان و ادب
{information retrieval, IR} [رمزشناسی، علوم کتابداری و اطلاع رسانی] فرایند دستیابی به اطلاعات از یک مجموعه
پیشنهاد کاربران
بازیابی اطلاعات: [ اصطلاحات کتابداری]پیدا کردن اسناد و مدارک یا دانسته ها و اطلاعات خاص مورد نیاز که در اسناد و مدارک کتابخانه یا مجموعه های دیگر موجود است.
ریکاوری
کلمات دیگر: