מקורות נתונים גדולים ברפואה

מקורות נתונים גדולים ברפואה

הגדרה פשוטה של ​​נתונים גדולים ברפואה היא "מכלול הנתונים הקשורים לבריאות ולרווחת המטופל" (Raghupathi 2014). אבל מה בדיוק אלה סוגים של נתונים, ואיפה הם באים?

להלן סקירה רחבה של סוגי ומקורות נתונים גדולים של עניין לספקי שירותי בריאות, חוקרים, משלמים, קובעי מדיניות, ותעשייה.

קטגוריות אלה אינן מקובלות זו מזו, מכיוון שאותם נתונים יכולים לנבוע ממגוון מקורות.

גם רשימה זו אינה ממצה, שכן היישום המעשי של ניתוח נתונים גדול ימשיך להתרחב.

מערכות מידע קליניות

אלה הם מקורות מסורתיים של נתונים קליניים כי ספקי שירותי בריאות רגילים להציג.

תביעות נתונים מן המשלמים

משכורות ציבוריות (למשל Medicare) ומשלמים פרטיים יש מאגרים גדולים של נתונים תביעות על המוטבים שלהם. כמה מבטחים הבריאות עכשיו גם להציע תמריצים לשיתוף נתונים הבריאות שלך.

מחקרים

מאגרי מחקר מכילים מידע על משתתפי המחקר, טיפולים ניסיוניים ותוצאות קליניות. מחקרים גדולים ממומנים בדרך כלל על ידי חברות התרופות או סוכנויות ממשלתיות. יישום של רפואה מותאמת אישית הוא להתאים אישית חולים עם טיפולים יעילים, על בסיס דפוסי נתונים ניסויים קליניים.

גישה זו נעשית מעבר לעקרונות הרפואה המבוססים על ראיות, אשר על-פיה נותן שירותי הבריאות קובע אם המטופל חולק מאפיינים רחבים (כגון גיל, מין, גזע, מעמד קליני) עם משתתפי המחקר. עם ניתוח נתונים גדול, ניתן לבחור טיפול המבוסס על מידע מפורט יותר, כגון הפרופיל הגנטי של סרטן של המטופל (ראה להלן).

מערכות תמיכה החלטה קלינית (CDSS) יש גם בפיתוח במהירות ועכשיו מייצגות חלק גדול של בינה מלאכותית (AI) ברפואה.

הם משתמשים בנתוני החולה כדי לסייע לרופאים בקבלת ההחלטות שלהם ומשולבים לעיתים קרובות עם EHR.

מאגרים גנטיים

מאגר המידע הגנטי האנושי ממשיך לצבור בקצב מהיר. מאז הושלם פרויקט הגנום האנושי ב -2003, העלות של רצף הדנ"א האנושי צומצמה פי מיליון. פרויקט הגנום האישי (PGP), שהושק בשנת 2005 על ידי בית הספר לרפואה של הרווארד, מבקש לרשום ולפרסם את הגנום המלא של 100,000 מתנדבים מרחבי העולם. PGP עצמו הוא דוגמה מעולה לפרויקט נתונים גדול בשל נפח עצום ומגוון של נתונים.

גנום אישי מכיל כ -100 ג 'יגה בייט של נתונים. בנוסף לרצף הגנומים, ה- PGP אוסף גם נתונים ממאמרים EHR, סקרים ופרופילי microbiome.

מספר חברות מציעות רצף גנטי ישיר לצרכן לבריאות, תכונות אישיות ופרמקוגנטיקה על בסיס עסקי.

מידע אישי זה יכול להיות כפוף לניתוח נתונים גדול. לדוגמה, 23andMe הפסיקה להציע דוחות גנטיים הקשורים לבריאות ללקוחות חדשים נכון ל -22 בנובמבר 2013, כדי לעמוד בדרישות של מנהל המזון והתרופות האמריקני. עם זאת, בשנת 2015, החברה החלה להציע רכיבים בריאותיים מסוימים בבדיקת רוק גנטי שלהם שוב, הפעם עם אישור ה- FDA.

עדויות פומביות

הממשלה שומרת תיעוד מפורט של אירועים הקשורים לבריאות, כגון הגירה, נישואין, לידה ומוות. מפקד האוכלוסין האמריקני אסף כמויות אדירות של מידע כל 10 שנים מאז 1790. באתר הסטטיסטיקה של המפקד היו 370 מיליארד תאים נכון לשנת 2013, עם כ -11 מיליארד נוספים נוספים מדי שנה.

חיפושים באינטרנט

מידע חיפוש באינטרנט שנאסף על ידי Google וספקי חיפוש אחרים באינטרנט יכול לספק תובנות בזמן אמת הקשורים לבריאות האוכלוסייה. עם זאת, הערך של נתונים גדולים של דפוסי החיפוש באינטרנט עשוי להשתפר על ידי שילוב עם מקורות מסורתיים של נתונים בריאותיים.

מדיה חברתית

פייסבוק, טוויטר ופלטפורמות מדיה חברתית אחרות יוצרות מגוון עשיר של נתונים מסביב לשעון, ומאפשרים להציג את המיקומים, את ההתנהגויות הבריאותיות, את הרגשות ואת האינטראקציות החברתיות של המשתמשים. היישום של מדיה חברתית נתונים גדולים לבריאות הציבור כבר המכונה גילוי מחלות דיגיטליות או אפידמיולוגיה דיגיטלית. טוויטר, למשל, שימש כדי לנתח מגיפות שפעת בקרב האוכלוסייה הכללית.

פרויקט הרווחה העולמי, שהחל באוניברסיטת פנסילבניה, הוא דוגמה נוספת ללימוד המדיה החברתית כדי להבין טוב יותר את הניסיון והבריאות של אנשים. הפרויקט מפגיש פסיכולוגים, סטטיסטיקאים ומדעני מחשבים המנתחים את השפה המשמשת בעת אינטראקציה מקוונת, למשל, בעת כתיבת עדכוני סטטוס בפייסבוק ובטוויטר. מדענים בודקים כיצד שפת המשתמשים מתייחסת לבריאותם ולאושרם. ההתקדמות בעיבוד שפה טבעית ולמידה של מכונות מסייעת במאמציהן. פרסום שפורסם לאחרונה מאוניברסיטת פנסילבניה בדק דרכים לחזות מחלת נפש על ידי ניתוח מדיה חברתית. נראה כי סימפטומים של דיכאון ומצבים בריאותיים אחרים יכולים להיות מזוהים על ידי לימוד השימוש שלנו באינטרנט. מדענים מקווים כי בעתיד שיטות אלה יוכלו לזהות טוב יותר ולסייע לאנשים בסיכון.

האינטרנט של דברים (IoT)

כמויות גדולות של מידע הקשור לבריאות נאספות ומאוחסנות גם בהתקנים ניידים ובבית .

עסקאות פיננסיות

עסקאות כרטיס האשראי של המטופלים נכללות במודלים הניבוייים המשמשים את מערכת הבריאות של קרולינאס כדי לזהות מטופלים הנמצאים בסיכון גבוה לקבלתם מחדש לבית החולים. שירות הבריאות של שרלוט משתמש בנתונים גדולים כדי לחלק את החולים לקבוצות שונות, למשל, על בסיס מחלה ומיקום גיאוגרפי.

השפעות אתיות ופרטיות

יש להדגיש כי במקרים מסוימים, ייתכן שיהיו השלכות אתיות ופרטיות חשובות בעת איסוף וגישה לנתונים בתחום הבריאות. מקורות חדשים של נתונים גדולים יכולים לשפר את ההבנה שלנו מה משפיע על הפרט ועל בריאות האוכלוסייה, עם זאת, סיכונים שונים צריכים להיות בזהירות נחשב. זה עכשיו גם הוכרה כי נתונים בעבר נחשב אנונימי, ניתן לזהות מחדש. לדוגמה, פרופ 'לטניה סוויני מהמעבדה לפרטיות נתונים של הרווארד סקרה 1,130 מתנדבים המעורבים בפרויקט הגנום האישי. היא והצוות שלה יכלו לציין שמות של 42% מהמשתתפים בהתבסס על המידע שהם שיתפו (מיקוד, תאריך לידה, מין). ידע זה יכול להגביר את המודעות שלנו לסיכונים פוטנציאליים ולעזור לנו לקבל החלטות טובות יותר לשיתוף נתונים.

> מקורות:

> Conway M, O'Connor D. מדיה חברתית, נתונים גדולים, בריאות הנפש: ההתקדמות הנוכחית ואת ההשלכות האתיות. הדעה הנוכחית בפסיכולוגיה 2016; 9: 77-82.

> פרננדס L, או'קונור M, וויבר V. נתונים גדולים, תוצאות גדולות יותר. Journal of American Health Information Management Association 2012: 83 (10): 38-43

> Guntuku S, Yaden D, קרן M, אונגר L, Eichstaedt ג זיהוי דיכאון ומחלות נפש על מדיה חברתית: סקירה אינטגרטיבית . חוות דעת נוכחית במדעי ההתנהגות 2017; 18: 43-49.

> Lazer D, קנדי ​​R, המלך G, Vespignani א המשל של שפעת Google: מלכודות ניתוח נתונים גדולים . מדע 2014; 343 (6176): 1203-1205.

> Raghupathi W, Raghupathi V. ניתוח נתונים גדול בתחום הבריאות: מבטיח potenti אל. מידע ומדעי בריאות ; 2: 3.

> סוויני ל ', אבו א', ווין ג ' זיהוי המשתתפים בפרויקט הגנום האישי לפי שם . אוניברסיטת הרוורד. מעבדה לפרטיות נתונים. נייר לבן 1021-1. 24 באפריל, 2013.