کلمه جو
صفحه اصلی

ماتریس وزن موقعیت خاص

دانشنامه عمومی

ماتریس وزن موقعیت خاص (به انگلیسی: PWM) یک روش متداول برای نمایش موتیف ها (الگوها) در رشته های زیستی است.پی دبلیوام (PWM) ماتریس امتیازدهی است که که به هر زیررشته با طول مشخص یک امتیاز (وزن) اختصاص می دهد. در ماتریس به ازای هر یک از حروف الفبا (مثلا در رشته های اسید نوکلئیکی A,T,C و G) یک سطر و به ازای هر موقعیت الگو یک ستون وجود دارد. امتیازی که پی دبلیوام به یک زیررشته اختصاص می دهد s = ( s j ) j = 1 N {\displaystyle s=(s_{j})_{j=1}^{N}} به شکل ∑ j = 1 N m s j , j {\displaystyle \textstyle \sum _{j=1}^{N}{m_{s_{j},j}}} تعریف می شود که در آن j {\displaystyle j} موقعیت در زیررشته، s j {\displaystyle s_{j}} حرف ظاهر شده در موقعیت j {\displaystyle j} و m α , j {\displaystyle m_{\alpha ,j}} امتیازی است که در درایهٔ ( α , j ) {\displaystyle (\alpha ,j)} ماتریس وجود دارد. به بیان دیگر امتیاز پی دبلیوام مجموع امتیازات تک تک حروف ظاهر شده در زیررشته است.
پی دبلیوام فرض می کند که موقعیت ها در الگو از هم مستقل هستند، از این رو امتیاز هر موقعیت را بدون در نظر گرفتن سایر موقعیت ها محاسبه می کند. امتیاز زیررشته ای که با پی دبلیوام همتراز شده می تواند به صورت لگاریتم درست نمایی، تحت ضرب توزیع چندجمله ای ترجمه شود. از آنجایی که هر ستون لگاریتم درست نمایی را برای هر یک از حروف مشخص می کند، در حالی که جمع درست نمایی روی هر ستون برابر مقدار یک می شود، ماتریس پی دبلیوام به توزیع چندجمله ای مرتبط می شود. امتیاز پی دبلیوام جمع لگاریتم های درست نمایی است که در واقع به معنای ضرب درست نمایی هاست.امتیازات پی دبلیوام را همچنین می توان در قالب فیزیکی نیز ترجمه کرد، که بیانگر مجموع انرژی های همهٔ نوکلئوتیدهایی (حرووف زیررشته) است که با پی دبلیوام همتراز شده اند.
بجای استفاده از لگاریتم درست نمایی که در پاراگراف قبل بحث شد، بسیاری از روش ها از امتیازهای لوجیت در پی دبلیوام استفاده می کنند. یک درایه در پی دبلیوام با m i , j = l o g ( p i , j / b i ) {\displaystyle m_{i,j}=log(p_{i,j}/b_{i})}   محاسبه می شود که در آن p i , j {\displaystyle p_{i,j}}   احتمال مشاهدهٔ حرف i در موقعیت j ام موتیف بوده و b i {\displaystyle b_{i}}   احتمال مشاهدهٔ حرف i در مدل پس زمینه (background) است. در نتیجه در مدل تولیدی، امتیاز پی دبلیوام برابر لوجیت زیررشته ای است که توسط موتیف تولید شده است (در مقابل تولید توسط پس زمینه).
محتوای اطلاعات یک پی دبلیوام بیانگر این است که چقدر ماتریس پی دبلیوام از توزیع یکنواخت فاصله دارد.خویش-اطلاعات مشاهدهٔ یک حرف خاص در موقعیت خاص موتیف از رابطهٔ زیر به دست می آید:


کلمات دیگر: