Εξατομικευμένη Ιατρική και μαζικά βιοϊατρικά δεδομένα

  • Μαργαρίτα Ιωάννα Κουφάκη
  • Ιωάννης Γ. Χατζής
  • Γεώργιος Π. Πατρινός

Abstract

Η εξατομικευμένη ιατρική αναπτύχθηκε τα τελευταία χρόνια ως μια νέα θεραπευτική προσέγγιση που αφορά τη θεραπεία και περίθαλψη ενός ασθενή με γνώμονα τις βιολογικές και περιβαλλοντικές πληροφορίες που έχουν συγκεντρωθεί για αυτόν. Κάθε μέρα ένας μεγάλος όγκος βιοϊατρικών δεδομένων συγκεντρώνεται και αποθηκεύεται σε ηλεκτρονικούς φακέλους υγείας, δημιουργώντας έναν τεράστιο όγκο δεδομένων, τα οποία παρουσιάζουν διάφορες προκλήσεις για τη διαχείριση και την ανάλυσή τους. Διάφοροι τομείς γνώσεων είναι απαραίτητοι για την πρόσκτηση των δεξιοτήτων και ικανοτήτων που απαιτούνται για να αξιοποιούνται πλήρως οι δυνατότητες που προσφέρει αυτός ο μεγάλος όγκος των βιοϊατρικών δεδομένων. Αρχίζουμε με μια εισαγωγή στην έννοια «μαζικά δεδομένα» καθώς και στην αποθήκευση και στη διαχείριση τους. Eξετάζουμε τις στατιστικές μεθόδους και την επιστήμη των δεδομένων, που αποτελούν σημαντικά θεμέλια για την τεχνητή νοημοσύνη, τη μηχανική εκμάθηση και την επεξεργασία φυσικής γλώσσας, απαραίτητες προϋποθέσεις για την ανάπτυξη προγνωστικών μοντέλων με σκοπό τη λήψη κλινικών αποφάσεων. Εν κατακλείδι, προτείνουμε ειδική κατάρτιση για την προετοιμασία της νέας γενιάς επιστημόνων για τον χειρισμό των μαζικών βιοϊατρικών δεδομένων.

Author Biographies

Μαργαρίτα Ιωάννα Κουφάκη

Πανεπιστήμιο Πατρών, Σχολή Επιστημών Υγείας, Τμήμα Φαρμακευτικής, Εργαστήριο Φαρμακογονιδιωματικής και Εξατομικευμένης Θεραπείας, Πανεπιστημιούπολη, Ρίο, 265 04, Πάτρα

Ιωάννης Γ. Χατζής

Δημόσιο Ινστιτούτο Επαγγελματικής Κατάρτισης Μεσολογγίου, Μεσολόγγι

Γεώργιος Π. Πατρινός

Πανεπιστήμιο Πατρών, Σχολή Επιστημών Υγείας, Τμήμα Φαρμακευτικής, Πάτρα

References

1. Collins FS, Varmus H. A new initiative on precision medicine. N. Engl. J. Med. 372(9), 793–795 (2015).
2. Council NR. Toward Precision Medicine: Building a Knowledge Network for Biomedical Research and a New Taxonomy of Disease [Internet]. Available from: https://www.nap.edu/catalog/13284/toward-precision-medicine-building-a-knowledge-network-for-biomedical-research.
3. Nimmesgern E, Benediktsson I, Norstedt I. Personalized Medicine in Europe. Clin Transl Sci. 10(2), 61–63 (2017).
4. Erlewyn-Lajeunesse M, Brathwaite N, Lucas JSA, Warner JO. Recommendations for the administration of influenza vaccine in children allergic to egg. BMJ. 339, b3680 (2009).
5. Tran T, Luo W, Phung D, et al. A framework for feature extraction from hospital medical data with applications in risk prediction. BMC Bioinformatics. 15(1), 425 (2014).
6. Albers DJ, Elhadad N, Tabak E, Perotte A, Hripcsak G. Dynamical Phenotyping: Using Temporal Analysis of Clinically Collected Physiologic Data to Stratify Populations. PLOS ONE. 9(6), e96443 (2014).
7. Westphal JF. Macrolide – induced clinically relevant drug interactions with cytochrome P-450A (CYP) 3A4: an update focused on clarithromycin, azithromycin and dirithromycin. British Journal of Clinical Pharmacology. 50(4), 285–295 (2000).
8. Phillips HS, Kharbanda S, Chen R, et al. Molecular subclasses of high-grade glioma predict prognosis, delineate a pattern of disease progression, and resemble stages in neurogenesis. Cancer Cell. 9(3), 157–173 (2006).
9. Warner JL, Denny JC, Kreda DA, Alterovitz G. Seeing the forest through the trees: uncovering phenomic complexity through interactive network visualization. J Am Med Inform Assoc. 22(2), 324–329 (2015).
10. Huang X, Jennings SF, Bruce B, et al. Big data - a 21st century science Maginot Line? No-boundary thinking: shifting from the big data paradigm. BioData Min. 8, 7 (2015).
11. Angles R, Gutierrez C. Survey of Graph Database Models. ACM Comput. Surv. 40(1), 1:1–1:39 (2008).
12. Robinson I, Webber J, Eifrem E. Graph Databases. 1 edition. O’Reilly Media, Beijing ; Sebastopol, CA.
13. Harron K, Dibben C, Boyd J, et al. Challenges in administrative data linkage for research. Big Data Soc. 4(2), 2053951717745678 (2017).
14. Mamun A-A, Aseltine R, Rajasekaran S. Efficient Record Linkage Algorithms Using Complete Linkage Clustering. PLoS ONE. 11(4), e0154446 (2016).
15. Kim D, Joung J-G, Sohn K-A, et al. Knowledge boosting: a graph-based integration approach with multi-omics data and genomic knowledge for cancer clinical outcome prediction. J Am Med Inform Assoc. 22(1), 109–120 (2015).
16. Beaulieu-Jones BK, Moore JH. MISSING DATA IMPUTATION IN THE ELECTRONIC HEALTH RECORD USING DEEPLY LEARNED AUTOENCODERS. Pac Symp Biocomput. 22, 207–218 (2017).
17. Kim D, Li R, Dudek SM, Ritchie MD. Predicting censored survival data based on the interactions between meta-dimensional omics data in breast cancer. J Biomed Inform. 56, 220–228 (2015).
18. Hastie T, Tibshirani R, Friedman J. The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition [Internet]. 2nd ed. Springer-Verlag, New York Available from: //www.springer.com/us/book/9780387848570.
19. Greene CS, Garmire LX, Gilbert JA, Ritchie MD, Hunter LE. Celebrating parasites. Nat. Genet. 49(4), 483–484 (2017).
20. Huber W, Carey VJ, Gentleman R, et al. Orchestrating high-throughput genomic analysis with Bioconductor. Nat. Methods. 12(2), 115–121 (2015).
21. Peng RD. Reproducible research in computational science. Science. 334(6060), 1226–1227 (2011).
22. Wickham H, Grolemund G. R for Data Science: Import, Tidy, Transform, Visualize, and Model Data. 1 edition. O’Reilly Media, Sebastopol, CA.
23. Beaulieu-Jones BK, Greene CS. Reproducibility of computational workflows is automated using continuous analysis. Nat. Biotechnol. 35(4), 342–346 (2017).
24. Cole BS, Moore JH. Eleven quick tips for architecting biomedical informatics workflows with cloud computing. PLoS Comput. Biol. 14(3), e1005994 (2018).
25. Russell S, Norvig P. Artificial Intelligence: A Modern Approach. 3rd ed. Prentice Hall Press, Upper Saddle River, NJ, USA.
26. Ertel W. Introduction to Artificial Intelligence [Internet]. 2nd ed. Springer International Publishing Available from: //www.springer.com/us/book/9783319584867.
27. Goodfellow I, Bengio Y, Courville A. Deep Learning. The MIT Press.
28. Murphy KP. Machine Learning: A Probabilistic Perspective. The MIT Press.
29. Baldi P. Deep Learning in Biomedical Data Science. Annu. Rev. Biomed. Data Sci. 1(1), 181–205 (2018).
30. Cao C, Liu F, Tan H, et al. Deep Learning and Its Applications in Biomedicine. Genomics Proteomics Bioinformatics. 16(1), 17–32 (2018).
31. Ching T, Himmelstein DS, Beaulieu-Jones BK, et al. Opportunities and obstacles for deep learning in biology and medicine. J R Soc Interface. 15(141) (2018).
32. Ravi D, Wong C, Deligianni F, et al. Deep Learning for Health Informatics. IEEE J Biomed Health Inform. 21(1), 4–21 (2017).
33. Wainberg M, Merico D, Delong A, Frey BJ. Deep learning in biomedicine. Nat. Biotechnol. 36(9), 829–838 (2018).
34. Olson RS, La Cava W, Orzechowski P, Urbanowicz RJ, Moore JH. PMLB: a large benchmark suite for machine learning evaluation and comparison. BioData Min. 10, 36 (2017).
35. Olson RS, Cava WL, Mustahsan Z, Varik A, Moore JH. Data-driven advice for applying machine learning to bioinformatics problems. Pac Symp Biocomput. 23, 192–203 (2018).
36. Nantasenamat C, Worachartcheewan A, Jamsak S, et al. AutoWeka: toward an automated data mining software for QSAR and QSPR studies. Methods Mol. Biol. 1260, 119–147 (2015).
37. Feurer M, Klein A, Eggensperger K, Springenberg J, Blum M, Hutter F. Efficient and Robust Automated Machine Learning [Internet]. In: Advances in Neural Information Processing Systems 28. Cortes C, Lawrence ND, Lee DD, Sugiyama M, Garnett R (Eds.). . Curran Associates, Inc., 2962–2970 (2015) [cited 2018 Mar 2]. Available from: http://papers.nips.cc/paper/5872-efficient-and-robust-automated-machine-learning.pdf.
38. Olson RS, Bartley N, Urbanowicz RJ, Moore JH. Evaluation of a Tree-based Pipeline Optimization Tool for Automating Data Science [Internet]. In: Proceedings of the Genetic and Evolutionary Computation Conference 2016. ACM, New York, NY, USA, 485–492 (2016) [cited 2018 Mar 2]. Available from: http://doi.acm.org/10.1145/2908812.2908918.
39. Olson RS, Sipper M, Cava WL, et al. A System for Accessible Artificial Intelligence. In: Genetic Programming Theory and Practice XV. Banzhaf W, Olson RS, Tozier W, Riolo R (Eds.). . Springer International Publishing, 121–134 (2018).
40. Hobbs JR, Appelt D, Bear J, et al. FASTUS: A Cascaded Finite-State Transducer for Extracting Information from Natural-Language Text. arXiv:cmp-lg/9705013 [Internet]. (1997). Available from: http://arxiv.org/abs/cmp-lg/9705013.
41. Leser U, Hakenberg J. What makes a gene name? Named entity recognition in the biomedical literature. Brief. Bioinformatics. 6(4), 357–369 (2005).
42. Yeh A, Morgan A, Colosimo M, Hirschman L. BioCreAtIvE task 1A: gene mention finding evaluation. BMC Bioinformatics. 6 Suppl 1, S2 (2005).
43. Leaman R, Gonzalez G. BANNER: an executable survey of advances in biomedical named entity recognition. Pac Symp Biocomput. , 652–663 (2008).
44. Garten Y, Altman RB. Pharmspresso: a text mining tool for extraction of pharmacogenomic concepts and relationships from full text. BMC Bioinformatics. 10 Suppl 2, S6 (2009).
45. Yang H-T, Ju J-H, Wong Y-T, Shmulevich I, Chiang J-H. Literature-based discovery of new candidates for drug repurposing. Brief. Bioinformatics. 18(3), 488–497 (2017).
46. Crim J, McDonald R, Pereira F. Automatically annotating documents with normalized gene lists. BMC Bioinformatics. 6 Suppl 1, S13 (2005).
47. Chen L, Liu H, Friedman C. Gene name ambiguity of eukaryotic nomenclatures. Bioinformatics. 21(2), 248–256 (2005).
48. Miwa M, Thompson P, McNaught J, Kell DB, Ananiadou S. Extracting semantically enriched events from biomedical literature. BMC Bioinformatics. 13, 108 (2012).
49. Velupillai S, Mowery D, South BR, Kvist M, Dalianis H. Recent Advances in Clinical Natural Language Processing in Support of Semantic Analysis. Yearb Med Inform. 10(1), 183–193 (2015).
50. Wolfe BA, Mamlin BW, Biondich PG, et al. The OpenMRS system: collaborating toward an open source EMR for developing countries. AMIA Annu Symp Proc. , 1146 (2006).
51. Huang X, Bruce B, Buchan A, et al. No-boundary thinking in bioinformatics research. BioData Min. 6(1), 19 (2013).
Published
2021-02-09
Section
Άρθρα ανασκόπησης