من فضلك تسجيل الدخول أو تسجيل لتفعل ذلك.
“main” الدور=”main” نوع البيانات بعد=”articles”>”content”>

“pad4228c5b8db82f414a1030d9eca0d22″>”(min-width: 429px)” اكتب=”image/webp”>”(max-width: 428px)” اكتب=”image/webp”>”https://www.bgr.com/img/gallery/scientists-created-a-genetic-code-search-engine-like-google-for-dna/intro-1762976635.jpg” data-slide-url=”https://www.bgr.com/2028116/metagraph-genetic-code-search-engine-google-for-dna-explained/” معرف ما بعد البيانات=”2028116″ شريحة البيانات رقم=”0″ data-slide-title=”Scientists Created A Genetic Code Search Engine Like ‘Google For DNA’: ” العرض=”780″ الارتفاع=”438″ البديل=”A scientist examines a sample besides an artistic rendering of DNA structures.”>

فوتوغرين / شترستوك

يعد تسلسل الحمض النووي أحد أكثر المجالات العلمية أهمية اليوم، حيث يعمل على تحقيق قفزات في فهم البشرية للأسباب الوراثية للسرطان، والأمراض التنكسية العصبية، والسكري. إحدى المشكلات التي تواجه الصناعة هي الوفرة المفرطة في المعلومات. ومع مشاركة العلماء لنتائج التسلسل الخاصة بهم في مجموعات كبيرة لم يتم تحقيقها من قبل، بدأ تخزين مجموعات البيانات الضخمة المرقمة بالبيتابايت في مستودعات مثل أرشيف قراءة التسلسل الأمريكي وأرشيف النوكليوتيدات الأوروبي. نظرًا لاحتوائها على قدر كبير من المعلومات تقريبًا مثل جميع النصوص الموجودة على الإنترنت، فقد ثبت أن الاستفادة من مجموعات البيانات الضخمة هذه لا تقل صعوبة عن تحليلها. بدأ الباحثون في ETH Zurich في معالجة هذه المشكلة من خلال إنشاء محرك بحث للحمض النووي يسمح للعلماء بالبحث عن التسلسلات الجينية وعزلها. في أ”https://www.nature.com/articles/s41586-025-09603-w” الهدف=”_blank”> بحث منشور في المجلة العلمية Natureيصف الفريق كيف يقوم محرك البحث الخاص به، المسمى MetaGraph، بتحويل قواعد البيانات الضخمة والمتباينة هذه إلى قاعدة بيانات واحدة قابلة للبحث تحتوي على ما يقرب من 600 مليون تسلسل متميز و21 مليون جيجابايت من بيانات التسلسل.

تبني مثل هذه التطورات أساليب إنهاء السلسلة التي اتبعها فريد سانجر الحائز على جائزة نوبل، والذي كان رائدًا في هذا المجال من خلال اختراقه عام 1977 في تسلسل الجينوم. ومنذ ذلك الحين، تابع العلماء تقنيات الجيل التالي لتحديد التسلسل”https://www.bgr.com/science/revolutionary-test-can-identify-nearly-any-infection-in-a-patient/” الهدف=”_blank”> تطوير اختبارات للتعرف على أي عدوى تقريبًا، قم بفهرسة جينوم SARS-CoV-2 وراء جائحة كوفيد-19، وحتى”https://www.bgr.com/science/a-genetics-company-just-revived-the-dire-wolf-sort-of/” الهدف=”_blank”> إحياء الذئب الرهيب صِنف. الموصوف أ “Google for DNA” بقلم البروفيسور جونار راتش، عالم البيانات في قسم علوم الكمبيوتر في ETH زيوريخ، يأمل الباحثون أن وظائف البحث في MetaGraph ستؤدي إلى تسريع هذا النوع من البحث الجيني بشكل كبير.

قاعدة بيانات الجينوم قابلة للبحث

“p259370637ad4e7ebcf1fd64030e2d9bc”>”(min-width: 429px)” اكتب=”image/webp”>”(max-width: 428px)” اكتب=”image/webp”>”https://www.bgr.com/img/gallery/scientists-created-a-genetic-code-search-engine-like-google-for-dna/a-searchable-genonome-database-1762976638.jpg” data-slide-url=”https://www.bgr.com/2028116/metagraph-genetic-code-search-engine-google-for-dna-explained/” معرف ما بعد البيانات=”2028116″ شريحة البيانات رقم=”1″ data-slide-title=”Scientists Created A Genetic Code Search Engine Like ‘Google For DNA’: A searchable genonome database” العرض=”780″ الارتفاع=”438″ البديل=”A digital rendering of a helixed DNA structure represents sequences within a database.”>

بيموراتدينيز / جيتي إيماجيس

قام فريق البحث في ETH Zurich ببناء MetaGraph منذ عام 2020. وتكمن قوته في قدرته على تبسيط البحث من خلال بيانات تسلسل الحمض النووي والحمض النووي الريبوزي (RNA) عن طريق ضغطها في فهارس نصية كاملة قابلة للبحث، مما يقلل متوسط حجم البيانات بعامل 300. وللقيام بذلك، تخضع جميع البيانات داخل النظام لعملية تنقيح، حيث يتم أخذ البيانات الأولية وتحويلها إلى رسوم بيانية مصححة للأخطاء ومنقحة يتم دمجها لاحقًا في الرسم البياني الموحد للمجموعة. مؤشر. وقد سمح هذا للباحثين بضغط 100 تيرابايت من مجموعات البيانات مثل GTEx وTCGA إلى 10 جيجابايت فقط لكل منهما.

تتميز مجموعات البيانات بتسلسلات الفيروسات والميكروبات والفطريات والنباتات والبكتيريا والحمض النووي البشري، بما في ذلك عينات ميتاجينوم الأمعاء البشرية والميتازون. أضاف العلماء أيضًا بيانات ميتاجينومية أولية ومجموعات بيانات مهمة أخرى. استخدم الفريق رسومًا بيانية رياضية متقدمة لتنظيم مجموعات البيانات بكفاءة، على غرار كيفية ترتيب القيم في جدول البيانات. أتاحت الروابط بين البيانات الأولية والبيانات الوصفية للفريق إزالة العديد من التكرارات، مما أدى إلى ضغط مجموعة البيانات إلى حد كبير.

إحدى فوائد MetaGraph هي أنه يسمح للباحثين بالبحث في مجموعة البيانات دون تنزيل كميات كبيرة من المعلومات. في السابق، كان الباحثون بحاجة إلى تنزيل مجموعات البيانات الفردية قبل البحث في تسلسل البيانات الأولية، مما يجعل عملية البحث بطيئة ومكلفة. فائدة أخرى هي أن هذا النوع من البحث أكثر فعالية من حيث التكلفة من طرق جمع البيانات السابقة. على سبيل المثال، يمكن الآن احتواء النطاق الكامل لبيانات التسلسل البيولوجي المتاحة للجمهور على عدد قليل من محركات الأقراص الثابتة، حيث يتكلف كل بحث بضعة سنتات، مما يجعل التكلفة الإجمالية حوالي 2500 دولار.

مستقبل تسلسل الحمض النووي

“pc19e22531541ddb26d1701aee5f5fcef”>”(min-width: 429px)” اكتب=”image/webp”>”(max-width: 428px)” اكتب=”image/webp”>”https://www.bgr.com/img/gallery/scientists-created-a-genetic-code-search-engine-like-google-for-dna/the-future-of-dna-sequencing-1762976639.jpg” data-slide-url=”https://www.bgr.com/2028116/metagraph-genetic-code-search-engine-google-for-dna-explained/” معرف ما بعد البيانات=”2028116″ شريحة البيانات رقم=”2″ data-slide-title=”Scientists Created A Genetic Code Search Engine Like ‘Google For DNA’: The future of DNA sequencing” العرض=”780″ الارتفاع=”438″ البديل=”A DNA sequencing database shows various processes for analyzing genetic structures.”>

بلاك_كيرا / جيتي إيماجيس

في الوقت الحالي، ما يقرب من نصف مجموعات البيانات التسلسلية في العالم متاحة حاليًا من خلال وظائف البحث في MetaGraph. يتوقع فريق ETH أن تكون بقية مجموعة البيانات المتاحة للجمهور متاحة على الإنترنت بحلول نهاية عام 2025. والأهم من ذلك، أن نهج MetaGraph قابل للتطوير، مما يضمن استمرار المستخدمين في تجربة سرعات بحث عالية حتى مع تضاعف مجموعة البيانات الخاصة به. يعتقد MetaGraph، وهو مورد مفتوح المصدر، أنه سيجذب العديد من المستخدمين، بدءًا من شركات الأدوية والمعلمين والعلماء والباحثين وربما الأفراد. وكما قال الدكتور أندريه كاليس، عضو مجموعة المعلوماتية الطبية الحيوية في ETH زيورخ، في إحدى الجامعات”https://ethz.ch/en/news-and-events/eth-news/news/2025/10/a-dna-search-engine.html” الهدف=”_blank”> بيان صحفي, “In the early days, even Google didn’t know exactly what a search engine was good for. If the rapid development in DNA sequencing continues, it may become commonplace to identify your balcony plants more precisely.”

ويأمل فريق المطورين في MetaGraph أن يسهل برنامجهم الجديد البحث الجيني. على سبيل المثال، استخدم العلماء أجهزة التسلسل الجيني لرسم خريطة لفيروس SARS-CoV-2، وهي خطوة رئيسية في تطوير لقاح كوفيد. آخرون لديهم”https://www.bgr.com/science/earthworm-dna-may-challenge-everything-we-know-about-evolution/” الهدف=”_blank”>تحليل تسلسل الحمض النووي لديدان الأرض لدراسة التطور. يمكن لقاعدة بيانات MetaGraph أن تسهل هذا البحث من خلال تسهيل البحث عن تسلسل الجينوم وبنيته واختباره بسرعة أكبر وبتكلفة أقل. ومن شأن مثل هذه التطورات أن تجعل الجيل القادم من تقنيات تسلسل الجينوم أفضل، وأرخص، وأكثر صحة في نهاية المطاف.

إذا كنت تريد اللعب بها، يمكنك زيارتها”https://github.com/ratschlab/metagraph-open-data” الهدف=”_blank”> مستودع البيانات المفتوحة في MetaGraph لتنفيذ عمليات البحث داخل قاعدة البيانات السحابية للمجموعة. بالنسبة للهواة والمستخدمين المحتملين الذين يتطلعون إلى تصور نتائج قواعد البيانات، تتوفر العديد من الأمثلة على موقعهم الإلكتروني، بما في ذلك تصورات البروتينات الشهيرة وجينات مقاومة مضادات الميكروبات.

اقرأ المزيد

معركة جوجل والحكومة الأمريكية حول مستقبل الإعلان عبر الإنترنت
يلوح في الأفق قرار بشأن تفكيك احتكار Google لتكنولوجيا الإعلانات

Reactions

0
0
0
0
0
0
بالفعل كان رد فعل لهذا المنصب.

ردود الفعل