
يستطيع الذكاء الاصطناعي كتابة الجينومات، فكم من الوقت سيستغرق حتى يخلق حياة اصطناعية؟
على الرغم من كل ما يتحدث عنه العلماء عن “فك تشفير الجينوم”، فإن الحقيقة الفوضوية هي أن الجينوم ليس مكتوبًا بلغة واحدة. يتقن العلماء استخدام كودونات النوكليوتيدات الثلاثة التي تشكل جينات ترميز البروتين في الحمض النووي، لكنها لا تمثل سوى حوالي 2% من النص الجينومي. والباقي مكتوب بلغة مختلفة تمامًا، والتي لم يتمكن الباحثون من حلها بعد.
يقول ناداف أهيتوف، عالِم الوراثة بجامعة كاليفورنيا بسان فرانسيسكو: “عندما نقوم بتسلسل فرد بشري، نحصل على حوالي 3.5 مليون متغير، و0.6% فقط منها ستكون في مناطق الترميز”. يقول أهيتوف إن هذا الجزء من السهل نسبيًا تفسيره، لكن بالنسبة للبقية، “نحن لا نفهم حقًا ما الذي يفعله – ليس لدينا قانون تنظيمي”.

يستطيع الذكاء الاصطناعي كتابة الجينومات، فكم من الوقت سيستغرق حتى يخلق حياة اصطناعية؟
لكن الباحثين يحرزون تقدمًا في فك تشفير المنطقة التنظيمية للجينوم، وتعلم القواعد الأساسية للعناصر التي تحكم متى وأين يتم تشغيل الجينات وإيقافها. وللقيام بذلك، لجأوا إلى مجموعة من الأساليب المعروفة باسم فحوصات المراسل المتوازية على نطاق واسع (MPRAs). تقيس هذه الأدوات كيفية تأثير ملايين العناصر الجينية المعزولة أو متغيرات التسلسل على التعبير عن جين “المراسل” المختار بعناية. وهذا يساعد الباحثين على تحديد مقابض التحكم في الجينوم وفك تشابك وظيفتها دون أن تطغى عليها جميع الأجزاء الأخرى من الجينوم. يقول رايان تويهي، عالِم الوراثة في مختبر جاكسون في بار هاربور بولاية ماين: «إن الأمر يختصر الأمر إلى هذا النظام الاصطناعي». “لكنك لا تزال تحتفظ بما يكفي من التعقيد لاستكشاف الفضاء (الجينومي) الذي لا نفهمه بالكامل، وهذا نوع من النقطة الجيدة”.
يمكن أن تساعد اختبارات MPRA في توضيح الأسس الجينية للمرض، والكشف عن التغيرات التي أحدثها التطور، وتوجيه تطوير علاجات الجيل التالي. بل ويمكن استخدامها لتدريب أنظمة الذكاء الاصطناعي على تصميم الدوائر الجينية، مع تطبيقات في الرعاية الصحية وغيرها من القطاعات. على سبيل المثال، يمكن للعناصر التنظيمية المخصصة أن تعمل على تشديد الرقابة على العلاجات القائمة على الجينات والتأكد من أن العلاجات تنشط فقط في أنسجة محددة وتحت ظروف معينة، مما يقلل من التهديد الدائم المتمثل في التأثيرات غير المستهدفة. يقول أهيتوف: «إننا نحاول حقًا هندسة أشياء يمكن تشغيلها بسهولة وبساطة، وحتى بدون استخدام دواء».
الجينوم غير المشفر ليس صندوقًا أسودًا كاملاً بالطبع. حدد الباحثون الآلاف من البروتينات، التي تسمى عوامل النسخ، والتي أنشأت أدوارًا في التعبير الجيني وحددت تسلسل الحمض النووي الذي ترتبط به.
من خلال رسم خرائط لهذه التسلسلات عبر الجينوم، يمكن للعلماء التنبؤ أي منها يبدأ التعبير الجيني – والمعروف باسم المحفزات – وأيها يعمل كمقابض حجم، أو معززات، لتضخيم هذا التعبير في ظل ظروف محددة. ويمكنهم أيضًا البحث عن توقيعات العناصر التنظيمية عن طريق فحص المناطق الجينومية التي يكون فيها الحمض النووي مكشوفًا وجاهزًا للنسخ. يلتف الحمض النووي الكروموسومي حول البروتينات، مكونًا مادة تسمى الكروماتين. العناصر الموجودة في الكروماتين المكتظ بشكل عام لا يمكن الوصول إليها من قبل البروتينات التنظيمية وبالتالي فهي غير نشطة.
لكن التحقق من صحة هذه التنبؤات استلزم تاريخيًا عملية مضنية لاختبار كيفية تأثير الطفرات المختلفة في المعززات أو المحفزات الفردية على الجينات القريبة. يقول ألكسندر ستارك، عالم الأحياء الحسابي في معهد أبحاث علم الأمراض الجزيئية في فيينا: “أدركت أننا إذا أردنا تحليل المعززات والتنبؤ بها حسابيًا، فلن نحتاج إلى حفنة من المعززات، بل سنحتاج إلى مئات الآلاف منها”. على مدى السنوات الخمس عشرة الماضية أو نحو ذلك، طوَّر ستارك وآخرون مجموعة من الأساليب، المعروفة عمومًا باسم MPRAs، التي تمكن من إجراء مثل هذه التقييمات الوظيفية على نطاق لم يكن من الممكن تصوره من قبل.

كيف يمكن لجينوم الذكاء الاصطناعي الخاص بـ DeepMind أن يساعد في حل ألغاز الأمراض النادرة
تم وضع المبادئ الأساسية لهذه المقايسات في عام 20091. استخدم جاي شندور وزملاؤه في جامعة واشنطن في سياتل الاستنساخ لإنشاء مكتبات من القطع الدائرية الصغيرة من الحمض النووي المعروفة باسم البلازميدات، والتي يرتبط فيها جين مراسل ارتباطًا ماديًا بمئات الاختلافات لمحفز معين. تمثل هذه المتغيرات كل طفرة محتملة في قاعدة واحدة في هذا التسلسل التنظيمي، مما يسمح للباحثين بمسح دور كل نيوكليوتيد على حدة. ولأغراض تحديد الهوية، تم ربط كل متغير بـ “الرمز الشريطي” الفريد للحمض النووي. قام الباحثون باحتضان مكتبتهم في أنبوب اختبار يحتوي على المكونات الجزيئية المطلوبة للنسخ، ثم قاموا بتسلسل جزيئات الحمض النووي الريبي (RNA) المنقول لتحديد مستوى التعبير الناتج عن كل متغير محفز من وفرة الباركود المرتبط به.
اليوم، يتم إجراء عمليات MPRAs عادةً في الخلايا المستنبتة. يتم تقديمها باستخدام إما نهج “episomal” القائم على البلازميد والذي لا يتم دمجه أبدًا في الجينوم المضيف، أو الفيروسات البطيئة، التي تدمج المكتبات في مواقع الكروموسومات العشوائية. يفضل التويهي الطريقة البينية بسبب كفاءتها العالية. ويقول: “عادة، تحصل على عدد أكبر بكثير من النسخ في أي خلية واحدة، حتى تتمكن من اختبار المزيد من البنيات”. لكن الفيروسات البطيئة لها مزاياها، على سبيل المثال، يمكنها إصابة أنواع الخلايا التي تميل إلى مقاومة توصيل البلازميد، مثل الخلايا الجذعية.
على الرغم من كونه ضروريًا لإنجاح عمليات MPRA، إلا أن التشفير الشريطي يمثل أيضًا أحد التحديات الرئيسية للتكنولوجيا. العديد من المتغيرات التنظيمية التي تم اختبارها في الاختبار تختلف بفارق نيوكليوتيد أو اثنين فقط، في حين يمتد الرمز الشريطي النموذجي إلى 20 قاعدة، مما قد يؤدي إلى حدوث اضطراب أكبر. يوضح هيجونج وون، عالم الوراثة بجامعة نورث كارولينا في تشابل هيل: «إن تأثير الباركود يفوق التأثير المتغير». ونتيجة لذلك، يستخدم الباحثون عادة ما بين 10 إلى 100 رمز شريطي لكل تسلسل تم اختباره. علاوة على ذلك، لتفسير النتائج، يحتاج الباحثون إلى معرفة الباركود المرتبط بكل متغير تسلسل. لكن عملية تبادل الحمض النووي المعروفة باسم إعادة التركيب يمكن أن تخلط بين هذه الارتباطات.
كحل، قام ستارك وزملاؤه بتطوير صيغة MPRA بديلة، تسمى STARR-seq. يستفيد هذا النهج من حقيقة أن المعززات توجد بشكل متكرر في تسلسل الجينات وبالتالي يتم دمجها في الحمض النووي الريبي (RNA) المكتوب2. يقول ستارك: “إنك تستنسخ مكتبة أجزاء واحدة فقط، وتكون مكتبة الأجزاء هذه بعد ذلك رمزًا شريطيًا خاصًا بها”، مضيفًا أن هذا النهج يمكن أن يقلل من تكلفة الفحص والتعقيد.
وضع النظام على الخريطةيمكن تنفيذ عمليات تقييم المخاطر المتعددة (MPRAs) الحديثة على نطاق واسع، مما يدعم إجراء دراسات استقصائية على نطاق الجينوم للمشهد التنظيمي. يقول باس فان ستينسيل، الباحث في علم الجينوم في معهد أونكود، والمعهد الهولندي للسرطان في أمستردام: «إن أكبر عملية تحليل جيني قمنا بها كانت في مجملها ما يقرب من ملياري قطعة».
ركزت العديد من هذه التجارب على رسم خرائط لمواقع المعززات في جميع أنحاء الجينوم وتعلم كيفية تحفيز التعبير الجيني في أنسجة معينة. يقول ستارك إنه عندما بدأ فريقه في إجراء عملية STARR-seq في خلايا ذبابة الفاكهة والثدييات، اكتشف العديد من العناصر التي كان من الممكن أن تكون غير مرئية باستخدام طرق أخرى، لأنها تظل عمومًا غير نشطة في الكروماتين المكتظ. ولكن في السياق المبسط لفحص STARR-seq، يمكن اكتشافها بسهولة. يقول ستارك: “لا يزال بإمكانهم العمل كحمض نووي عاري”.
في العام الماضي، أعلن باحثون بقيادة أهيتوف وشندور عن تحليل منهجي لكل تسلسل تنظيمي معروف تقريبًا في الجينوم البشري. لقد اختبروا كيف تؤثر مجموعات مختلفة من المروجين والمعززات على نشاط الجينات المراسلة في ثلاثة خطوط من الخلايا البشرية3. استخدم فريق فان ستينسل أجهزة MPRAs لاستكشاف التواصل بين العناصر التنظيمية الجينومية4. ويقول: “يظهر المعززون والمروجون درجة من التوافق – درجة ما إذا كان بإمكانهم التحدث مع بعضهم البعض أم لا”. “إنه ليس شيئًا ليلًا ونهارًا – فهذه مستويات متدرجة من التوافق.”
غالبًا ما تكون العناصر التنظيمية في الحمض النووي (البني والبرتقالي) ملفوفة بإحكام حول البروتينات.الائتمان: Mol* صورة من RCSB PDB (RCSB.org) لمعرف PDB 8XRJ (T. Kujirai) وآخرون./الطبيعة المشتركة.)
غالبًا ما يقوم فريقه بتجميع المكتبات عن طريق كسر الحمض النووي الصبغي إلى أجزاء صغيرة، مما يسمح للباحثين باستكشاف المشهد الجينومي الطبيعي. ولكن عندما يكون الهدف هو معرفة سبب عمل عنصر معين بالطريقة التي يعمل بها، فمن الأفضل أحيانًا تركيب الحمض النووي الذي يحتوي على مجموعات من التسلسلات التنظيمية المعروفة. يقول أهيتوف إن فريقه يبدأ بتسلسلات محايدة. “ثم نبدأ بوضع “كلمات” عليها، مثل مواقع ربط عوامل النسخ، والتلاعب بالمسافات، والترتيب، والكمية، والاتجاه، ورؤية ما يصلح وما لا يصلح.” وبدلاً من ذلك، قد تقوم مجموعته بشكل منهجي بإجراء تحوير لمعزز أو محفز محدد لتحديد العواقب.
لكن هذه المناطق لا يمكنها مسح سوى جزء كبير من التضاريس الجينومية. يصبح تصنيع مكتبات الحمض النووي الاصطناعية أمرًا صعبًا ومكلفًا نظرًا لطولها، وهناك حدود لحجم الحمض النووي الذي يمكن تعبئته في البلازميد أو الفيروس البطيء. يقول فان ستينسل إنه من غير المعتاد أن تحتوي مكتبة MPRA على تسلسلات أطول من 1000 قاعدة – وهو قيد خطير، لأن المناطق التنظيمية للجينوم الطبيعي يمكن أن تكون أكبر بكثير.
وبالتالي توفر MPRAs وجهة نظر اختزالية لتنظيم الجينات. على سبيل المثال، هناك أسئلة مفتوحة حول مدى نجاح تصميمات MPRA المختلفة في تكرار التوزيع الطبيعي لبروتينات الكروماتين على تسلسل معين في الجينوم نفسه، وقد لا يعكس سلوك العناصر الجينومية في MPRAs كيفية عملها في سياقها الجينومي الطبيعي. يقول توهي: “تخبرك فحوصات المراسل بما يمكن أن يفعله التسلسل، وليس بالضرورة ما يفعله فعليًا في الجينوم”. وعلى هذا النحو، تتطلب تقييمات MPRA قدرًا كبيرًا من التحقق، وهو ما يمكن إجراؤه، على سبيل المثال، باستخدام استراتيجيات تحرير الجينات القائمة على تقنية كريسبر، أو النماذج الحيوانية المعدلة وراثيًا.
تظهر تصميمات الاختبارات البديلة التي يمكن أن تسفر عن نتائج أكثر أهمية من الناحية البيولوجية. في العام الماضي، وصف مختبر أهيتوف طريقة تسمى Capture-C، حيث يحدد الباحثون أولاً العناصر التنظيمية التي تتفاعل فيزيائيًا ثم يستخدمونها كأحجار بناء لتجربة MPRA5. يقول أهيتوف إن هذه الطريقة أثبتت فعاليتها بشكل خاص في عزل العناصر الصامتة التي تقمع التعبير الجيني، بدلًا من تحفيزه. “لقد وجدنا أكثر من 1000 كاتم للصوت في اختبارنا، والتي كان من الصعب جدًا وصفها تاريخيًا.”
فهم الطفراتإن تنظيم الجينات هو مسألة موقع وتوقيت وظروف بيئية، كما أن تحليل MPRA الذي يتم إجراؤه على مزرعة خلية ثابتة سوف يتجاهل حتماً العناصر التي تنشط فقط في ظل ظروف معينة. وبناء على ذلك، يقوم العديد من الباحثين بتطوير متغيرات تجريبية لتوثيق كيفية تأثير المحفزات المختلفة على النشاط التنظيمي.

ما وراء AlphaFold: كيف يقوم الذكاء الاصطناعي بفك تشفير قواعد الجينوم
تستخدم أنات كريمر – عالمة الأحياء الحسابية بجامعة روتجرز في بيسكاتواي بولاية نيوجيرسي – أجهزة MPRA لفهم المسارات التنظيمية الكامنة وراء نمو الدماغ الطبيعي والشاذ. في سلسلة واحدة من الدراسات، قامت هي وزملاؤها بجمع بيانات MPRA على مدى نقاط زمنية متعددة لتوثيق التغييرات في نشاط المعزز مع تطور الخلايا الجذعية الجنينية إلى أسلاف الخلايا العصبية الناضجة. يقول كريمر: “لقد توصلنا إلى إطار حسابي لفهم عوامل النسخ ذات الصلة بالتمايز العصبي”. استخدمت هي وأهيتوف وزملاؤهما هذه البيانات لإعادة بناء مخطط تنظيمي لنمو الدماغ وإظهار كيف يعدل التوقيت والبيئة الخلوية تنشيط الجينات أو قمعها من خلال مجالات تنظيمية مختلفة.6.