मशीन लर्निंग शरीर के डार्क मैटर को रोशन करता है

एक स्टार्टअप को ऐसे पैटर्न मिलते हैं जो वैयक्तिकृत चिकित्सा के विशेषज्ञों का कहना है कि वे पहले नहीं देख सकते थे।

लैरी स्मर कहते हैं कि तकनीक ने माइक्रोबायोम के बारे में नई अंतर्दृष्टि को खोल दिया। (निक वॉके द्वारा चित्रण; रोजडेल / विकिपीडिया के फोटो सौजन्य)

जब मेडिकल डेटा का विश्लेषण करने के लिए कंप्यूटर का उपयोग करने की बात आती है, तो लैरी स्मर को प्रभावित करने में बहुत कुछ लगता है।

Smarr, एक UC सैन डिएगो / UC इरविन अनुसंधान संस्थान, जो Calit2 कहा जाता है, में एक कंप्यूटर वैज्ञानिक, क्वांटिफाइड-सेल्फ मूवमेंट का अग्रणी है। वह नियमित रूप से 150 बायोमार्कर के लिए अपने रक्त और मल का विश्लेषण करता है। यदि वह कुछ अजीब नोटिस करता है, तो वह अपनी दैनिक गतिविधि को समायोजित करेगा, चाहे इसका मतलब है कि अधिक कैलोरी जलाने या प्रोबायोटिक के पूरक के तनाव को कम करने के लिए परिसर के आसपास कुछ अतिरिक्त अंतराल लेना। इन सभी आंकड़ों के लिए धन्यवाद, कुछ साल पहले उन्होंने महसूस किया कि उन्हें क्रोहन की बीमारी है इससे पहले कि उनके डॉक्टर ने किया था और जब उन्हें अंततः सर्जरी की आवश्यकता थी, तो उन्होंने अपने सर्जन को अपने बृहदान्त्र के 3-डी मॉडल के साथ आपूर्ति की ताकि वह खुद को परिचित कर सके। ऑपरेशन से पहले लेआउट।

चूँकि स्मरर मेडिकल डेटा को प्राप्त करने और उसका विश्लेषण करने में बहुत माहिर है, यह सुनकर हड़बड़ा गया कि एक नया मशीन-लर्निंग स्टार्टअप, पैटर्न कंप्यूटर, उसे दिखाने के लिए कुछ नया था।

स्मर के जुनून में से एक है आंत में बैक्टीरिया की परस्पर क्रिया-हमारे सूक्ष्म जीव-और हम इसके बारे में कितना कम जानते हैं। ("शरीर का गहरा मामला," वह इसे कहते हैं।) स्मर यह पता लगाने की कोशिश कर रहा है कि माइक्रोबायोम में किन बदलावों और उतार-चढ़ाव सामान्य हैं, और जिससे बीमारी हो सकती है। ऐसा करने के लिए, उन्होंने और उनके सहयोगियों ने स्वस्थ लोगों के आंत बैक्टीरिया की तुलना भड़काऊ आंत्र रोग के विभिन्न चरणों वाले लोगों के माइक्रोबायोम से की। इस अध्ययन में केवल 62 लोगों को नमूने प्रदान करने के बावजूद, इसने बड़े पैमाने पर डेटा उत्पन्न किया, क्योंकि हमारे हिम्मत में बैक्टीरिया लगभग 10,000 विभिन्न प्रकार के प्रोटीन का उत्पादन करते हैं जो प्रत्येक एक अलग जैविक कार्य करते हैं। और इन प्रोटीन परिवारों की सापेक्ष बहुतायत मानव विषयों में से प्रत्येक में भिन्न थी।

यह ज्ञात है कि इन प्रोटीन परिवारों का एक निश्चित उप-समूह स्वस्थ लोगों की तुलना में आईबीडी वाले लोगों में कम आम है। लेकिन जब Smarr ने पैटर्न कंप्यूटर को वह डेटा दिया, तो वह काफी हद तक सबसेट को कम करने में सक्षम था। यह पता चला कि उन 10,000 प्रोटीन परिवारों में से नौ भड़काऊ आंत्र रोग के साथ सबसे अधिक जुड़े हुए दिखाई दिए। उन नौ और उनके जैव रासायनिक रास्ते पर शून्य करने से हमारे माइक्रोबायोम हमारे स्वास्थ्य को प्रभावित करने वाले तरीकों के बारे में नए सुराग दे सकते हैं और नए हस्तक्षेप खोल सकते हैं।

"यह वास्तव में एक खोज थी," स्मर कहते हैं। कई प्रकार के सॉफ्टवेयर टूल के साथ इस डेटा को देखने के बाद, उन्होंने देखा नहीं "डेटा बिंदुओं के इस बड़े हिस्से के अंदर अवरुद्ध पैटर्न।"

यह पैटर्न कंप्यूटर का वादा है: कि इसकी मशीन-लर्निंग प्रणाली उन सहसंबंधों को पा सकती है जो अन्य सिस्टम नहीं कर सकते हैं, भले ही यह नहीं बताया गया है कि क्या देखना है। कंपनी का कहना है कि टेक फोरकास्टर मार्क एंडरसन ने नेतृत्व किया है और इस सप्ताह लगभग 6 मिलियन डॉलर फंडिंग और क्लाइंट्स के साथ लॉन्च किए हैं, जो "कंपनियों से देशों तक" हैं। समय के साथ, यह विभिन्न उद्योगों में स्थानांतरित हो जाएगा, एंडरसन कहते हैं, लेकिन अभी यह बायोमेडिसिन पर ध्यान केंद्रित कर रहा है।

मार्क एंडरसन, बाईं ओर, स्मर्ट के साथ पैटर्न कंप्यूटर लॉन्च पर।

इसमें बहुत प्रतिस्पर्धा है। चिकित्सा शोधकर्ता, दवा कंपनियां, अस्पताल और डॉक्टर डेटा में अंतर्दृष्टि खोजने की कोशिश करने के लिए उन्नत कंप्यूटिंग तकनीकों की एक विस्तृत श्रृंखला की कोशिश कर रहे हैं। विशेष रूप से मुश्किल यह है कि यह डेटा कई रूपों में आता है, जिसमें रक्त परीक्षण में मात्रा से लेकर जीनोम के रीडआउट तक जर्नल लेख और रोगी रिकॉर्ड में पाठ तक होते हैं। न तो पैटर्न कंप्यूटर और न ही किसी अन्य एकल कंपनी या एल्गोरिथ्म में इसके मास्टर होने की संभावना है। आईबीएम ने जितना दिखाया है। अपनी वॉटसन तकनीकों के बारे में बहुत सारी प्रचार-प्रसार के बावजूद- जो कि खतरे में जीती प्रणाली पर आधारित है! - मेमोरियल स्लोन केटरिंग कैंसर सेंटर और अन्य अस्पतालों में इस्तेमाल किया जा रहा है, उन्होंने यह बदलने के लिए बहुत कम प्रयास किया कि डॉक्टर कैसे रोग का निदान और इलाज करते हैं।

दवा में मशीन सीखने का उपयोग करने में प्रगति इसके बजाय छोटे चरणों में आ रही है। बेन ब्राउन, लॉरेंस बर्कले नेशनल लेबोरेटरी के एक कम्प्यूटेशनल जीवविज्ञानी, यह पता लगाने की कोशिश कर रहे हैं कि जीन के बीच बातचीत कैसे स्तन कैंसर का कारण बनती है। लेकिन स्तन कैंसर के ट्यूमर में इतनी व्यापक भिन्नता होने के कारण, हमारे लिए सभी प्रासंगिक जीन इंटरैक्शन का अध्ययन करना असंभव है "ब्रूट बल," ब्राउन कहते हैं। उन्होंने तीन-तरफा जीन इंटरैक्शन को खोजने के लिए पैटर्न कंप्यूटर की तकनीक का उपयोग किया है, जिसके साथ सहसंबद्ध है। कम कैंसर से बचे रहने की दर। अनुवर्ती अनुसंधान उस बातचीत के लिए लक्षित चिकित्सा का पता लगा सकता है।

उच्च संकल्प

2009 में, जीन-सीक्वेंसिंग तकनीक के डेवलपर्स में से एक लेरॉय हुड और स्वास्थ्य के व्यापक दृष्टिकोण के लिए एक ट्रेलब्लेज़र जिसे "सिस्टम बायोलॉजी" कहा जाता है, ने न्यूज़वीक के लिए "ए डॉक्टर ऑफ़ विज़न ऑफ़ द फ्यूचर ऑफ़ मेडिसिन" नामक एक लेख लिखा। उन्होंने कल्पना की, लोग घरेलू उपकरणों के साथ अपने स्वयं के रक्त का परीक्षण कर रहे थे, जिससे उनके डॉक्टरों को उनके स्वास्थ्य के बारे में दिमाग की गहन मात्रा का विश्लेषण करने की अनुमति मिली, जो जीन के स्तर तक नीचे थे। यह लेख जून 2018 में सेट किया गया था।

हम वहां नहीं हैं जहां हुड की कल्पना की गई है, क्योंकि हम अब तक समीकरण का केवल एक हिस्सा आ चुके हैं। "हमारे पास भारी मात्रा में डेटा है," हूड कहते हैं। "हम अभी उसके साथ क्या कर सकते हैं उसकी सतह को खरोंचने लगे हैं।"

आरिवेल और अन्य शोध नामक एक स्वास्थ्य-कोचिंग सेवा के माध्यम से, हुड पी 4 दवा को कॉल करने के लिए समर्पित है: भविष्य कहनेवाला, निवारक, व्यक्तिगत और भागीदारी। चुनौती, जैसा कि उन्होंने कहा था, कई अलग-अलग प्रकारों के डेटा का विश्लेषण करना है। एक उदाहरण के रूप में, उन्होंने अपने दोस्तों में से 108 पर एक पी 4 पायलट अध्ययन की ओर इशारा किया। नौ महीनों के लिए, उनकी टीम ने उनके जीनोम को क्रमबद्ध करके, नियमित रूप से रक्त और मल परीक्षण करके, और उनकी नींद और शारीरिक गतिविधि के लिए उन्हें स्व-ट्रैकर देकर उनके बारे में जानकारी एकत्र की। डेटा की पूरी तरह से समझ बनाने और उसमें से कई कार्रवाई योग्य सुझावों को खींचने के लिए, हूड कहते हैं कि उन्हें पैटर्न कंप्यूटर जैसे और अधिक टूल की आवश्यकता होगी।

स्मर नोट करते हैं कि उनके शोध में बनाया गया ब्रेकिंग पैटर्न कंप्यूटर सिर्फ एक "प्रयोग" है, यह सुनिश्चित करने के लिए, स्टार्टअप डेटा-संचालित दवा के अग्रिम में एक छोटी भूमिका निभाने के लिए साबित हो सकता है। लेकिन हूड का कहना है कि वह आशावादी है कि पी 4 बहुत पहले एक वास्तविकता हो सकती है। अंत में, वे कहते हैं, शोधकर्ता "पहले कभी नहीं हुए संकल्प के साथ डेटा और बीमारी को देख सकते हैं।"