Decentralized electronic health record management system and disease prediction with machine learning methods
Abstract
Electronic health records (EHRs) are vital to the advancement of healthcare and can help detect and prevent diseases early. However, EHR sharing faces challenges such as managing large data volumes, ensuring data privacy, security, and interoperability. This thesis aims to develop and analyze a blockchain-based EHR sharing system for disease prediction mechanism integration using SysML. The AguHyper platform, built by merging the InterPlanetary File System (IPFS) with Hyperledger Fabric, ensures the immutability of health records by storing hash values in the blockchain and encrypted records in IPFS. The system architecture and implementation configurations, including CouchDB and the Raft consensus mechanism, are thoroughly examined. The study also presents a novel hybrid approach called CSA-DE-LR, which integrates Differential Evolution (DE) and Clonal Selection Algorithm (CSA) with Logistic Regression (LR) to improve LR weights for precise categorization of cardiovascular diseases. The integration of the AguHyper with the CSA-DE-LR is explained in detail. At the end of our performance evaluations, we concluded that the AguHyper model has the potential to speed up the process of collecting and sharing data, and it offers an efficient platform for the participants. Elektronik sağlık kayıtları (EHRs), sağlık hizmetlerinin ilerlemesi için hayati öneme sahiptir ve hastalıkların erken tespit edilip önlenmesine yardımcı olabilir. Ancak EHR paylaşımı, büyük veri hacimlerinin yönetilmesi, veri gizliliğinin, güvenliğin ve birlikte çalışabilirliğin sağlanması gibi zorluklarla karşı karşıyadır. Bu tez, SysML kullanarak hastalık tahmin mekanizması entegrasyonu için blokzincir tabanlı bir EHR paylaşım sistemi geliştirmeyi ve analiz etmeyi amaçlamaktadır. Gezegenler Arası Dosya Sisteminin (IPFS) Hyperledger Fabric ile birleştirilmesiyle oluşturulan AguHyper platformu, şifrelenmiş kayıtları IPFS'de ve hash değerlerini ise blokzincirde depolayarak sağlık kayıtlarının tahrip edilemezliğini sağlamaktadır. CouchDB ve Raft konsensüs mekanizması da dahil olmak üzere sistem mimarisi ve uygulama konfigürasyonları kapsamlı bir şekilde incelenmektedir. Çalışma ayrıca, kardiyovasküler hastalıkların kesin kategorizasyonu için LR ağırlıklarını iyileştirmek amacıyla Diferansiyel Evrim (DE) ve Klonal Seçim Algoritmasını (CSA) Lojistik Regresyon (LR) ile birleştiren CSA-DE-LR adı verilen yeni bir hibrit yaklaşım da sunmaktadır. AguHyper'ın CSA-DE-LR ile entegrasyonu ayrıntılı olarak anlatılmaktadır. Performans değerlendirmeleri sonucunda AguHyper modelinin veri toplama ve paylaşma sürecini hızlandırma potansiyeline sahip olduğu ve katılımcılara verimli bir platform sunduğu sonucuna varılmıştır.