Suppr超能文献

多源集成学习在源间缺失数据情况下对帕金森病的远程预测

Multi-Source Ensemble Learning for the Remote Prediction of Parkinson's Disease in the Presence of Source-Wise Missing Data.

出版信息

IEEE Trans Biomed Eng. 2019 May;66(5):1402-1411. doi: 10.1109/TBME.2018.2873252. Epub 2018 Nov 5.

Abstract

As the collection of mobile health data becomes pervasive, missing data can make large portions of datasets inaccessible for analysis. Missing data has shown particularly problematic for remotely diagnosing and monitoring Parkinson's disease (PD) using smartphones. This contribution presents multi-source ensemble learning, a methodology which combines dataset deconstruction with ensemble learning and enables participants with incomplete data (i.e., where not all sensor data is available) to be included in the training of machine learning models and achieves a 100% participant retention rate. We demonstrate the proposed method on a cohort of 1513 participants, 91.2% of which contributed incomplete data in tapping, gait, voice, and/or memory tests. The use of multi-source ensemble learning, alongside convolutional neural networks (CNNs) capitalizing on the amount of available data, increases PD classification accuracy from 73.1% to 82.0% as compared to traditional techniques. The increase in accuracy is found to be partly caused by the use of multi-channel CNNs and partly caused by developing models using the large cohort of participants. Furthermore, through bootstrap sampling we reveal that feature selection is better performed on a large cohort of participants with incomplete data than on a small number of participants with complete data. The proposed method is applicable to a wide range of wearable/remote monitoring datasets that suffer from missing data and contributes to improving the ability to remotely monitor PD via revealing novel methods of accounting for symptom heterogeneity.

摘要

随着移动健康数据的收集变得普及,缺失数据可能会导致大部分数据集无法进行分析。对于使用智能手机远程诊断和监测帕金森病 (PD) 来说,缺失数据尤其成问题。本研究提出了多源集成学习方法,该方法结合了数据集解构和集成学习,可以使数据不完整的参与者(即并非所有传感器数据都可用)参与机器学习模型的训练,并实现 100%的参与者保留率。我们在一个由 1513 名参与者组成的队列中展示了该方法,其中 91.2%的参与者在敲击、步态、语音和/或记忆测试中提供了不完整的数据。与传统技术相比,多源集成学习与利用大量可用数据的卷积神经网络 (CNN) 相结合,将 PD 分类准确性从 73.1%提高到 82.0%。准确性的提高部分归因于使用多通道 CNN,部分归因于使用大量不完整数据的参与者来开发模型。此外,通过自举抽样,我们发现对于缺失数据的大量参与者数据,特征选择比对于少量完整数据的参与者数据更有效。所提出的方法适用于广泛的存在缺失数据的可穿戴/远程监测数据集,并有助于通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善通过揭示新的方法来改善 PD 患者的远程监测。

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验