Classification of microRNA-disease associations and microRNA-species associations based on k-mer sequence representation
Özet
The dysregulated gene expression brings about a variety of diseases, and dysregulation of microRNA (miRNA) has a wide impact on disease development and cellular physiology. Thus, miRNAs play important roles in a variety of fundamental and significant biological processes related to human diseases. There are a lot of research about changes in the function of miRNAs have been published in many human diseases. Computational methods serve as a complementary process to traditional wet-lab experiments, which require many resources and time in terms of detecting potential miRNA-Disease associations. Furthermore, there is a need to present a novel approach that allows assignment of an unknown miRNA to its most likely species. An easy way to filter new data would be to ensure that the new miRNA is classified below the maximum distance to the species known to originate from. In this thesis, a computational model has been proposed for identifying miRNA-disease and miRNA-Species associations by depicting the miRNAs with their k-mer sequence representation and by utilizing machine learning methodologies. The difference of our approach is which we reveal disease and species associated the sequences of miRNA store information. This put a question about the miRNA's chemical compounds and their associations with different types of species and diseases. With this study, the new disease-disease and species-Species associations disclosed can be calculated for many different species and diseases, these approaches can develop to species and disease classification. Lastly, our study may open a door to redefine species and diseases classifications which have been used nowadays, also it may provide the improvement of treatment strategies and early diagnosis Düzensiz gen ekspresyonu, çeşitli hastalıkları beraberinde getirir ve mikroRNA'nın (miRNA) düzensizliğinin, hastalık gelişimi ve hücresel fizyoloji üzerinde geniş bir etkisi vardır. Bu nedenle miRNA'lar, insan hastalıklarıyla ilgili çeşitli temel ve önemli biyolojik süreçlerde önemli roller oynar. Birçok insan hastalığında miRNA'ların işlevindeki değişiklikler hakkında birçok araştırma yayınlanmıştır. Hesaplamalı yöntemler, potansiyel miRNA-hastalık ilişkilerini saptamak açısından birçok kaynak ve zaman gerektiren geleneksel ıslak laboratuvar deneylerini tamamlayıcı bir süreç olarak hizmet eder. Ayrıca, bilinmeyen bir miRNA'nın en olası türlerine atanmasına izin veren yeni bir yaklaşım sunmaya ihtiyaç vardır. Yeni verileri filtrelemenin kolay bir yolu, yeni miRNA'nın köken aldığı bilinen türlere olan maksimum mesafenin altında sınıflandırılmasını sağlamak olabilir. Bu tezde, miRNA'ları k-mer sekans gösterimleri ile betimleyerek ve makine öğrenme metodolojilerini kullanarak miRNA-hastalığı ve miRNA-tür ilişkilerini tanımlamak için bir hesaplama modeli önerilmiştir. Yaklaşımımızın farklılıkları, miRNA depolama bilgilerinin dizileriyle ilişkili hastalıkları ve türleri ortaya çıkarmamızdır. Bu, miRNA'ların kimyasal bileşikleri ve bunların farklı türler ve hastalıklarla ilişkileri hakkında bir soru ortaya koyar. Bu çalışma ile ortaya çıkan yeni hastalık-hastalık ve tür-tür ilişkileri birçok farklı tür ve hastalık için hesaplanabilmekte, bu yaklaşımlar tür ve hastalık sınıflandırmasını geliştirebilmektedir. Son olarak, çalışmamız günümüzde kullanılan tür ve hastalık sınıflandırmalarının yeniden tanımlanmasına kapı aralayabilir, ayrıca tedavi stratejilerinin geliştirilmesini ve erken teşhis edilmesini de sağlayabilir