Tag Archives: X-ray crystallography

Molecular mechanism of specificity in promoter DNA recognition

Recognition of c-myc gene promoter by human RBMS1 protein. The figure shows RBMS1 protein scanning the DNA in search of its target sequence and binding to the sequence’s nucleotides in a specific manner. The surface view of the crystal structure of RBMS1 protein is shown bound with the bases of nucleotides of c-myc promoter. .

Decoding the codes of life stored in DNA is a challenge which is performed in a tightly regulated manner by the cell. Decoding involves reading the correct code at a right time by DNA binding proteins. The decoded information is then channeled through mRNA. This requires an efficient and highly specific interaction between protein and DNA that control some of the most important processes pertaining to cell survival and growth. Any dysregulation in the process can lead to malfunctioning of the cell and disease. Proteins search and bind specific sequence in the background of billions of bases in the genome. This happens through a combination of 1D sliding, 2D hopping, and 3D diffusion.

Understanding specificity of protein-DNA interactions is a long-standing question that has been attempted to understand many times by scientists all over the world. Thermodynamics and kinetics have always been discussed to be behind the matters concerning DNA binding specificity and affinity. The evidence, however, remains scarce when answering the crucial biological questions.

In this background we have worked on human RBMS1 protein that has been shown to directly regulate the c-myc gene expression levels in cancerous cells. In our study we have elucidate the molecular basis of RBMS1-promoter DNA interaction and understand the mechanism for specificity. The work provides the first structural and dynamics characterization of human RBMS1 protein, that controls the expression of c-myc proto-oncogene inside the human cell by its interaction with 7 base pair consensus sequence within the 21 bp promoter/ autonomous origin of replication region 2 kb upstream of c-myc proto-oncogene.

During the work we overcame different challenges. Bioinformatic studies have failed to correctly identify the domain boundary and this was leading to protein instability. It required a careful human analysis using some of fundamentals of molecular biophysics to redesign the construct. We extended the boundary by 5 residues which lead to expression of highly stable RBMS1 protein. This is a lesson for students who blindly trust bioinformatics results and artificial intelligence.

We performed extensive binding assay with different DNA sequences varying the bases and length of the sequences to answer the question of specificity. We determined the 2.57 Å crystal structure of RBMS1 in its promoter DNA bound state that provided atomic-resolution insight into specific binding of individual nucleotides of DNA with the protein. The NMR structure of free RBMS1 was solved, as the protein did not crystallize, most likely due to its inherent flexibility, which we confirmed through NMR relaxation dynamics. The protein undergoes a hinge-like motion in order to bind with the specific DNA which facilitated by flexibility in the linker region. The X-ray structure of RBMS1-c-myc promoter DNA complex and solution NMR structure of RBMS1 protein helped us to delineate the non-canonical binding mode of RBMS1 with the promoter DNA.

In a nutshell the mechanism of specificity of RBMS1 binding with promoter is driven by the thermodynamics and the dynamic domain re-organization, which is responsible for conferring specificity and affinity. The work has implications for understanding general mechanism of protein-DNA interactions that involves sliding, hopping and diffusion during stochastic target search process in a dense nucleus. In addition, the work is likely to aid in designing future anti-gene therapies.

—————

डी.एन.ए. में संग्रहीत जीवन की संहिता को पढ़ना एक चुनौती है, जिसे कोशिका द्वारा एक कड़े नियंत्रित तरीके से किया जाता है। यह प्रक्रिया एक बहुत ही समयबद्ध तरीक़े से डी.एन.ए. से जुड़ने वाले प्रोटीनो द्वारा क़ी जाती है। डी.एन.ए. में छिपी गूढ़लिपि जानकारी एम-आर.एन.ए. के माध्यम से प्रसारित होती है। इसके लिए प्रोटीन और डी.एन.ए. के बीच एक कुशल और अत्यधिक विशिष्ट संवाद की आवश्यकता होती है, जिससे कोशिका के अस्तित्व बनाए रखने और उसके विकास से संबंधित महत्वपूर्ण प्रक्रियाएँ नियंत्रित होती है। इन प्रक्रियाओं में किसी भी प्रकार की त्रुटि से कोशिका में विकृति हो जाती है और रोग उत्पन्न होते है। प्रोटीन जीनोम में अरबों आधारों की पृष्ठभूमि में विशिष्ट अनुक्रम खोजते हैं और उनके साथ सम्बंध बनाते हैं। यह एक-आयामी फिसलन, द्वि-आयामी कूदन एवं त्रि-आयामी विसरण के एक संयोजन से होता है।

प्रोटीन-डी.एन.ए. के इस पारस्परिक सम्बंध की विशिष्टता को समझने का प्रयास विश्व भर के वैज्ञानिकों द्वारा एक लंबे समय से किया जा रहा है। डी.एन.ए. से सम्बंध बनाने की विशिष्टता और आत्मीयता के पीछे ऊष्मप्रवैगिकी और गतिकी का योगदान प्रमुख माना गया है। हालांकि, इन विषयों में साक्ष्यों के दुर्लभ होने के कारण महत्वपूर्ण जैविक प्रश्नों का उत्तर देना कठिन हो जाता है।

इस पृष्ठभूमि को ध्यान में रखकर हमने मानव आर.बी.एम.एस.१ प्रोटीन पर कार्य किया है। आर.बी.एम.एस.१ प्रोटीन जो कैंसर ग्रसित कोशिकाओं में सी-मिक जीन अभिव्यक्ति के स्तर को नियंत्रित करता है । अपने अध्ययन में हमने आर.बी.एम.एस.१-प्रमोटर डी.एन.ए. से सम्बंध बनाने की प्रक्रिया के आणविक आधार को स्पष्ट किया है और विशिष्टता के लिए तंत्र को समझा है। हमारा ये शोध मानव आर.बी.एम.एस.१ प्रोटीन का पहला संरचनात्मक और गतिशीलता लक्षण वर्णन प्रदान करता है। इससे हमें आर.बी.एम.एस.१ प्रोटीन द्वारा मानव कोशिका के भीतर सी-मिक प्रोटो-ओन्कोजीन से २ किलो बेस से आगे स्थित २१ बेस जोड़ी प्रमोटर/स्वायत्त प्रतिरूप क्षेत्र के अंतर्त्स्थित ७ बेस जोड़ी सर्वसम्मत डी.एन.ए. अनुक्रम से जुड़ने की प्रकिया को समझने में सहायता मिलती है।

शोध के दौरान हमने विभिन्न चुनौतियों का सामना किया। जैव सूचनात्मक अध्ययन आर.बी.एम.एस.१ प्रोटीन के इकाइयों की सीमा की सही परिमापन करने में विफल रहे जिसके कारणवश हमें इस प्रोटीन को एक दृढ़ अवस्था में पाने में कठिनायों का सामना कारण पड़ा। फिर हमने आणविक जैव-भौतिकी के मूलभूत सिद्धांतों का उपयोग करते हुए सावधानीपूर्वक विश्लेषण का सहारा लिया। हमने दूसरी इकाई की सीमा को ५ अमिनो ऐसिड अवशेषों से बढ़ाया है जिससे अत्याधिक स्थिर आर.बी.एम.एस.१ प्रोटीन को प्राप्त करने में सफलता मिली। यह उन छात्रों के लिए एक सबक है जो अपने चक्षुओं को बंद करके जैव सूचना विज्ञान के परिणामों और कृत्रिम बुद्धिमत्ता को अक्षरशः सही मानते हैं ।

हमने विशिष्टता के प्रश्न का उत्तर देने के लिए भिन्न-भिन्न डी.एन.ए. अनुक्रमों की प्रकार और लंबाई में परिवर्तन करते हुए प्रोटीन के साथ सम्बंध बनाने की प्रक्रिया का विस्तार से अध्ययन किया। हमने आर.बी.एम.एस.१ की २.५७ Å स्तर पर आर.बी.एम.एस.१ की प्रमोटर डी.एन.ए. से जुड़ी अवस्था का स्फटिक संरचना को निर्धारित किया है। इससे प्रोटीन द्वारा डी.एन.ए. के अलग-अलग न्यूक्लियोटाइड के साथ बनाए जाने वाले विशिष्ट बंधन की परमाणु-स्तर पर अंतर्दृष्टि मिलती है। चूँकि डी.एन.ए.-मुक्त आर.बी.एम.एस.१ प्रोटीन के स्फटिक हमें प्राप्त नहीं हुए, इसलिए हमने इसकी संरचना एन.एम.आर. द्वारा निर्धारित किया। प्रोटीन के स्फटिक नहीं मिलने का कारण शायद इसका अंतर्निहित लचीलापन है, जिसकी पुष्टि हमने एन.एम.आर. आधारित विश्रांति गतिकी के विश्लेषण से की । अपने विशिष्ट डी.एन.ए. से जुड़ने की प्रक्रिया में प्रोटीन के दोनो इकाइयों के बीच एक क़ब्ज़े के समान घुमाव होता है, जिसमें दोनो इकाइयों के बीच के श्रृंखलक का लचीलापन सहायक होता है। आर.बी.एम.एस.१-सी-मिक प्रमोटर डी.एन.ए. कॉम्प्लेक्स की एक्स-रे संरचना और आर.बी.एम.एस.१ प्रोटीन की एन.एम.आर. संरचना ने हमें प्रमोटर डी.एन.ए. के साथ आर.बी.एम.एस.१ द्वारा के गैर-वैधानिक रूप से बनाए जाने वाले सम्बंध को समझने में सहायता प्रदान की।

संक्षेप में प्रमोटर के साथ आर.बी.एम.एस.१ द्वारा स्थापित सम्बंध की विशिष्टता ऊष्मप्रवैगिकी और इकाइयों के गतिशील पुनः-संगठन द्वारा संचालित होती है, जो विशिष्टता और आत्मीयता प्रदान करने के लिए उत्तरदायी है। हमारा यह शोध प्रोटीन-डी.एन.ए. सम्बंध के सामान्य तंत्र को समझने में निहितार्थ हैं, जिसमें घने नाभिक में लक्ष्य खोज प्रक्रिया के दौरान प्रोटीन द्वारा किए जाना वाला फिसलन, कूदन और विसरण शामिल है। इसके अलावा, इस काम से भविष्य में एंटी-जीन उपचारों को बनाने में मदद मिलने की संभावना है।

References

  1. Aggarwal P* and Bhavesh NS* (2021) Hinge like domain motion facilitates human RBMS1 protein binding to proto-oncogene c-myc promoter. Nucleic Acids Res. 49, 5943-5955
  2. Structure co-ordinates: Protein Data Bank (PDB) accession numbers 6M75 and 7C36.

Observation of a novel domain swapped dimer in RRM domain

2.3 Å resolution structure of human DND1-RRM2(PDB id 6LE1). The work was done by Ms. Pooja Kumari

Cell, the functional unit of life, stores codes of its functioning in long strings called DNA, which is made of different combination of four chemicals namely A, G, C and T. Specific stretches of DNA is called gene or coding region and thus a cell contains many genes. These genes code specifically to make proteins through a messenger entity called mRNA which decode the code. The proteins take birth at ribosomes inside cell as a string where each bead in one amino acid selected out of 20 naturally occurring ones. The proteins immediately folds, either assisted or in a non-assisted manner, to form a distinct three-dimensional shape. The three-dimensional organization dictates the functions of proteins, which are the workhorses of cell performing all functions in a very well-orchestrated manner. Depending on time, type and location of cell, one gene can code for different variant of proteins, called isoforms, that can have different shape and functions. As Francis Crick has said; “The ultimate aim of biology is in fact to explain all biology in terms of physics and chemistry. Eventually one may hope to have the whole of biology “explained” in terms of the level below it, and so on right down to the atomic level”. In order to understand the function of proteins at atomic level it is absolutely essential to see their three-dimensional structures at atomic-resolution. X-ray crystallography, NMR spectroscopy, X-ray free electron laser (XFEL) and single-particle Cryo Electron Microscopy are used to determine the atomic-resolution three-dimensional structures of proteins.

Our group has been working on a class of RNA binding protein domain known as RNA Recognition Motif (RRM), or Ribonucleoprotein domain (RNP), is found to be the most abundant nucleic acid binding domain in higher vertebrates. In humans about 2% of the genome codes for RRM and more than 500 RRM containing proteins have been annotated. They are found in single copy, multiple copies or in conjunction with other domains in the same protein. Studies show that RRM domains not only recognize nucleic acid but are also engaged in protein-protein interactions, protein lipid interactions owing to their structural plasticity. RRMs typically have about 90 amino acids with a representative topology of β1-α1-β2-β3-α2-β4 , wherein the 4 stranded β-sheets are packed against the 2 α-helices. There has been several examples where length of loops, α-helix and β-sheet vary and additional secondary structured element at RRM extremities are well conserved. These are crucial for interaction allowing longer RNA recognition. In of our previous study we have discovered a novel mode of RNA interaction where an extended α1β2 loop of human TAF-15 protein recognised a stem-loop RNA.

Due to its unique amino acid composition we started working on human DND1 (Dead end protein homolog1) also known as DND MicroRNA-Mediated Repression Inhibitor 1. DND1 is an RNA binding protein containing two RRMs, RRM1, RRM2 domains, in tandem and a double stranded RNA binding domain at the C-terminal separated by 40 residues flexible linker. In humans, reports of dysregulation at DND1 or mutation in the gene have been associated with testicular cancer, tongue squamous cell carcinoma. We have determined atomic-resolution crystal structure of DND1-RRM2 and observed a novel domain swapped dimer formation like one seen in HIV-1 protease. We validated the domain swapped dimer formation in solution using nOe and relaxation data from NMR spectroscopy. Ours is the first report of domain swapped dimer formation in any RRM and it also points to the limitation faced by structure prediction tools. In conclusion there is no substitute to experimentally determined structure if we have to appreciate the diversity in proteins.

जीवन की कार्यात्मक इकाई कोशिका अपने भीतर जीवन की संहिता को चार रसायनों, ए, जी, सी और टी, के विभिन्न संयोजनों से बने डी.एन.ए. नामक लंबी शृंखला में संग्रहित रखती है। डी.एन.ए. के विशिष्ट हिस्सों को जीन या संहिता क्षेत्र कहा जाता है और एक कोशिका में कई जीन होते हैं। ये जीन एम-आर.एन.ए. नामक एक संदेशवाहक इकाई का उपयोग करके प्रोटीन बनाने का कार्य करते हैं। एम-आर.एन.ए. जीन के संहिता कूट को पढ़कर प्रोटीन को बनाते हैं। प्रोटीन कोशिका के अंदर राइबोसोम में एक शृंखला के रूप में जन्म लेते हैं, जिसके प्रत्येक मनका अमीनो एसिड होते हैं, जो प्राकृतिक रूप से पाए जाने २० अमीनो एसिड में से चुने जाते हैं। ततपस्चात प्रोटीन तुरंत ही अपने को मोड़कर एक त्रि-आयामी आकार को बना लेते हैं, जो वे स्वतः करते हैं अथवा अन्य घटकों की सहायता से। उनकी त्रि-आयामी संरचना ही प्रोटीन के कार्यों को निर्धारित करती है। प्रोटीन कोसिका के मुख्य कार्यवाहक हैं जो सभी कार्यों को सुनियोजित तरीके से करते हैं। समय, प्रकार और कोशिका में स्थान के आधार पर, एक ही जीन विभिन्न प्रकार के प्रोटीनों के लिए कूट कर सकती है, जिन्हें आइसोफॉर्म कहा जाता है, जिनके अलग-अलग आकार और कार्य हो सकते हैं। जैसा कि फ्रांसिस क्रिक ने कहा है; “जीव विज्ञान का मूल  उद्देश्य वास्तव में भौतिकी और रसायन विज्ञान के संदर्भ में जीव विज्ञान की सम्पूर्ण व्याख्या करना है। अंतत: ऐसी उम्मीद की जा सकती है कि संपूर्ण जीव विज्ञान की “व्याख्या” आणविक स्तर या उससे अच्छी स्तर पर की जा सकी।” परमाणु स्तर पर प्रोटीन के कार्य को समझने के लिए उनकी त्रि-आयामी संरचनाओं को परमाणु-स्तर की प्रामाणिकता पर देखना नितांत आवश्यक है। एक्स-रे स्फटिकी, एन.एम.आर. वर्णक्रममापी, एक्स-रे मुक्त इलेक्ट्रॉन लेजर (एक्स.एफ.ई.एल) और एकल-कण अति-शीत इलेक्ट्रॉन सूक्ष्मदर्शी का उपयोग प्रोटीन के त्रि-आयामी संरचनाओं को परमाणु-स्तर की प्रामाणिकता पर निर्धारित करने के लिए किया जाता है।

हमारा समूह आर.एन.ए. के साथ सम्बंध बनाने वाले प्रोटीन इकाई के एक वर्ग पर काम कर रहा है जिसे आर.एन.ए. रिकॉग्निशन मोटिफ (आर.आर.एम.), या राइबोन्यूक्लियोप्रोटीन इकाई (आर.एन.पी.) के रूप में जाना जाता है, जो उच्च कशेरुकियों में सबसे प्रचुर मात्रा में पाया जाने वाला न्यूक्लिक एसिड से सम्बंध बनाने वाला प्रोटीन इकाई है। मनुष्यों में आर.आर.एम. के लिए लगभग २% जीनोम कोड करते हैं और अब तक ५०० से अधिक आर.आर.एम. युक्त प्रोटीन पाए गए हैं। वे एक ही प्रोटीन में एकल प्रति, एकाधिक प्रतियों या अन्य इकाई के संयोजन में पाए जाते हैं। अध्ययनों से पता चलता है कि आर.आर.एम. इकाई न केवल न्यूक्लिक एसिड को पहचानते हैं बल्कि अपनी संरचनात्मक ढलनशीलता के कारण वे प्रोटीन-प्रोटीन एवं प्रोटीन-वसा पारस्परिक सम्बन्धों में भी कारगर होते हैं। आर.आर.एम. में आमतौर पर लगभग ९० अमीनो एसिड होते हैं और उनकी प्रतिनिधिक सांस्थिति β१-α१-β२-β३-α२-β४ होती हैं, जिसमें ४ स्ट्रैंड से बने β-शीट २ और α-हेलिक्स पैक होते हैं। ऐसे कई उदाहरण हैं जहां छोरों की लंबाई, α-हेलिक्स और β-शीट भिन्न होती है और आर.आर.एम. छोरों पर अतिरिक्त माध्यमिक संरचित तत्व अच्छी तरह से संरक्षित होते हैं और लंबे आर.एन.ए. से सम्बंध स्थापित करने के लिए महत्वपूर्ण होते हैं । हमारे पिछले अध्ययन में हमने आर.एन.ए. से जुड़ने के एक नए तरीक़े की खोज की थी जिसमें मानव टी.ए.एफ-१५ प्रोटीन में स्थित एक विस्तारित α1-β2 लूप स्टेम-लूप आर.एन.ए. से सम्बंध स्थापित करने में सहायक होता है।

अपनी अमीनो एसिड संरचना के कारण हमने मानव डी.एन.डी.-१ (डेड एंड प्रोटीन सधर्मी १) पर काम करना शुरू किया, जिसे डी.एन.डी. माइक्रो आर.एन.ए.-मध्यस्थता दमन अवरोधक १ के रूप में भी जाना जाता है। डी.एन.डी.-१ आर.एन.ए. से सम्बंध स्थापित करने वाला एक प्रोटीन है जिसमें दो आर.आर.एम. इकाइयाँ, आर.आर.एम.-१, आर.आर.एम.-२, होते हैं। सी-किनारे पर एक द्वि-भंजी आर.एन.ए. से जुड़ने वाली इकाई होती है जिसके और दोनो आर.आर.एम. इकाइयों के मध्य ४० अमीनो एसिड अवशेषों वाला संयोजक होता है। मनुष्यों में, डी.एन.डी.-१ में विकृति या जीन में उत्परिवर्तन के कारण वृषण कैंसर, जीभ स्क्वैमस कोसिका कार्सिनोमा जैसी बीमारियाँ होती हैं। हमने डी.एन.डी.-१-आर.आर.एम.-२ की परमाणु-स्तर की संरचना का निर्धारण एक्स-रे स्फटिकी से किया है। हमने पाया कि इसकी संरचना भिन्न प्रकार की है जो पहले किसी भी आर.आर.एम. इकाई में नहीं देखी गयी थी। इसकी संरचना ने डी.एन.डी.-१-आर.आर.एम.-२ की दो इकाइयाँ एक दूसरे से जुड़के हुयी हैं जिसमें दोनो का कुछ हिस्सा एक दूसरे के भीतर चला गया है। इसकी समानता एच.आई.वी.-१ प्रोटीज़ की संरचना से की जा सकती हैं। हमने एन.एम.आर. वर्णक्रममापी से एन.ओ.ई. और विश्रांति आँकड़े का उपयोग करके इसकी पुष्टि की। किसी भी आर.आर.एम. में ‘डोमेन स्वैप्ड डिमर फॉर्मेशन’ की हमारी पहली रिपोर्ट है और यह संरचना की भविष्यवाणी करने वाली साधनों के समक्ष आने वाली सीमाओं की ओर इशारा करती है। अंत में, यदि हमें प्रोटीन में विविधता की सराहना करनी है तो प्रयोगात्मक रूप से निर्धारित संरचना का कोई विकल्प नहीं है।

References

  1. Kumari P* and Bhavesh NS* (2021) Human DND1-RRM2 forms a non-canonical domain swapped dimer. Protein Sci. 30, 1184-1195
  2. Structure co-ordinates: Protein Data Bank (PDB) accession numbers 6LE1.

Structural identification of a cryptic target for drug discovery against urinary tract infections

Atomic-resolution structure of YadV, a usher chaperone from Uropathogenic E. coli (PDB id 5GHU). Crystal structure was determined by Nishant Kumar Pandey (Left). Ms. Garima Verma and Dr. Gajraj Singh Kushwaha performed MD simulations (Right)
1.63 Å crystal structure of a usher chaperone from Uropathogenic E. coli (PDB id 5GHU)

Urinary tract infections (UTIs) are the most common and recurrent bacterial infections worldwide and are a major cause of morbidity. More than 150 million people worldwide are affected by UTIs. Gram-negative bacteria called Uropathogenic Escherichia coli (UPEC) is the primary pathogen that cause UTI. Adhesion of bacterial cell to human cell is primary requisite for bacterial pathogenesis, which is mediated by number of fibrilar and non-fibrilar adhesin molecule produced by bacteria. Fibrilar adhesin are named as fimbriae or pili and plays important role in inter-bacterial adhesion which leads to bacterial aggregation subsequently further colonisation and biofilm formation. Biofilm formation helps bacteria to evade host immune response, better survival in stress conditions and provides resistance to anti-microbial molecules and antibiotics. This is considered main reason for recurrent infection and is attributed to fimbriae assisted adhesion. Therefore, it is necessary to block adhesion by identifying new targets and developing new drugs against those targets.  

There are helper protein molecules called chaperone proteins, which are necessary for synthesis of these fimbriae or pili. However, the exact mechanism fimbriae or pili biogenesis is still not fully understood. In this study we have determined 1.63 Å crystal structure of one such helper protein called YadV chaperone protein, which helps in synthesis Yad pili. The monomeric structure looks like a boomerang shape with N-terminal arm having immunoglobulin (Ig) like fold and C-terminal arm has β-barrel fold. Interestingly for the first time proline lock in the closed conformation has been observed in the structure of Yadv determined by us. Although the closed lock state, which is a resting state of the molecule has been proposed for all types of UPEC pili chaperone still it was not observed previously.  Using molecular dynamics simulations we explained the opening and closing of the flexible proline lock. The proline-proline lock plays an important role in the chaperone-mediated subunit assembly, which is found in an open conformation in chaperone-subunit complex while we observed the closed conformation in subunit free structure. The observation of the closed conformation, a cryptic state, likely to be important target for design and discovery of pilicide that could bind to proline lock and maintain the lock in a closed conformation. This will lead to abolishment of pilus biogenesis that will block adhesion of UPEC to human cell. We have already shortlisted few inhibitors targeting this site on YadV. 

The work was supported by a grant from the Basic Research in Modern Biology task force of Department of Biotechnology, Government of India.

Trivia: The name of protein changed from EcpD to YadV during the course of studies. Further, the structure prediction tools have predicted it to be a eight-stranded β-barrel protein and most even predicting to be an Outer Membrane Protein (OMP) (see below figure for one of the wrong prediction).

Therefore, we cloned it without signal sequence and expressed tag-free expecting to over-express as inclusion bodies. But the protein over-expressed as soluble, in large amount and as monomer in solution. All these and final structure proved the structure prediction completely wrong.

मूत्र पथ के संक्रमण के खिलाफ दवा की खोज के लिए एक गुप्त लक्ष्य की संरचनात्मक पहचान

मूत्र पथ के संक्रमण (यू.टी.आई.) दुनिया भर में सबसे आम और आवर्तक जीवाणु संक्रमण हैं और रुग्णता का एक प्रमुख कारण है। दुनिया भर में १५ करोड़ से अधिक लोग यू.टी.आई. से प्रभावित होते हैं। यूरोपैथोजेनिक एस्चेरिचिया कोलाई (यू.पी.ई.सी.) नामक ग्राम-नकारात्मक जीवाणु प्राथमिक रोगज़नक़ है जो यू.टी.आई. का कारण बनता है। जीवाणु कोशिका का मानव कोशिका में आसंजन जीवाणु द्वारा रोगजनन के लिए प्राथमिक रूप से आवश्यक है, जो जीवाणु अपने द्वारा उत्पादित बहुत से तंतुमय और गैर-तंतुमय चिपकने वाले अणुओं की सहायता से करता है। तंतुमय आसंजन को फ़िम्ब्रिया या पिली के रूप में जाना जाता है और यह अंतर-जीवाणु आसंजन में महत्वपूर्ण भूमिका निभाता है । तत्पश्चात यह जीवाणु का एकत्रीकरण करता है जिससे बायोफ़िल्म का गठन होता है और औपनिवेशीकरण अग्रसित होता है । बायोफ़िल्म गठन जीवाणु को मानव प्रतिरक्षा प्रतिक्रिया से बचने में मदद करता है, तनाव की स्थिति में अपना अस्तित्व बनाये रखने में सहायक होता है और जीवाणु-विरोधी अणुओं और प्रतिजैविक दवाओं से प्रतिरोध प्रदान करता है। यह आवर्तक संक्रमण का मुख्य कारण माना जाता है और यह फ़िम्ब्रिया सहायित आसंजन के लिए जिम्मेदार है। इससे निपटने के लिए नए लक्ष्यों की पहचान कर उन लक्ष्यों के विरुद्ध नई दवाओं को विकसित करके आसंजन को अवरुद्ध करना आवश्यक है।

यद्यपि, फ़िम्ब्रिया या पिली जीवजनन प्रक्रिया को अभी तक सटीक तरीके से समझा नहीं गया है परन्तु एक विशेष प्रकार के सहायक प्रोटीन अणु जिन्हें चपेरोन प्रोटीन कहा जाता है वे इन फ़िम्ब्रिया या पिली के संश्लेषण के लिए अत्यावश्यक होते हैं। इस अध्ययन में हमने एक ऐसे चपेरोन प्रोटीन जिसे याड-५ चपेरोन प्रोटीन कहा जाता है, जो याड पिली को संश्लेषण करने में मदद करता है, की परमाणु-स्तर की स्फटिक संरचना का निर्धारण किया है।एकल संरचना बूमरैंग शेप की तरह दिखती है, जिसका एन-टर्मिनल इम्युनोग्लोबुलिन (आई.जी.) जैसी संरचना है तथा सी-टर्मिनल β-बैरल बनाता है। दिलचस्प बात यह है कि हमारे द्वारा निर्धारित याड-५ की संरचना में पहली बार प्रोलिन ताले को बंद स्थिति में देखा गया। यद्यपि प्रोलिन ताले की बंद स्थिति, जो प्रोटीन की एक विश्राम अवस्था है, को यू.पी.ई.सी. के सभी प्रकार के पिली चैपरोन के लिए प्रस्तावित किया गया है, फिर भी हमारे शोध से पहले कभी नहीं देखा गया था। इस अध्ययन में आणविक गतिशीलता अनुकरण का उपयोग करते हुए हमने लचीले प्रोलिन ताले के खुलने और बंद होने की प्रक्रिया को स्पष्ट रूप समझाया है। चपेरोन प्रोटीन की सहायता से विभिन्न पृथक इकाईयों की क्रमबद्ध संजोने की प्रक्रिया में प्रोलिन-प्रोलिन ताला एक महत्वपूर्ण भूमिका निभाता है, जहाँ ये चपेरोन प्रोटीन और पृथक इकाई की मिश्रित जुड़े हुए अवस्था में एक खुली स्थिति में पाया जाता है, जबकि हमने पृथक इकाई से मुक्त संरचना में इसे बंद स्थिति में पाया है। बंद संरचना का अवलोकन, जो इस प्रकार के प्रोटीन की एक गुप्त स्थिति है, हमें नए प्रकार दवाओं के खोज और संश्लेषण के लिए एक महत्वपूर्ण लक्ष्य बनने की संभावना प्रदान करता है। ऐसी नयी दवाईयाँ इस ताले को बंद करने और बंद स्थिति में रखने के लिए बाध्य कर सकती हैं। इससे पिली जीवजनन प्रक्रिया का उन्मूलन होगा जो मानव कोशिका में यू.पी.ई.सी के आसंजन को अवरुद्ध करेगा। हमने याड-५ पर स्थित इस जगह को लक्षित करने वाले कुछ अवरोधकों को चयनित कर लिया है।

यह शोध आधुनिक जीव विज्ञान में मूलभूत अनुसंधान कार्य बल, जैव प्रौद्योगिकी विभाग, भारत सरकार के एक अनुदान से समर्थित है।

रोचक जानकारी: अध्ययन के दौरान प्रोटीन का नाम ई.सी.पी.डी. से याड-५ में बदल गया। इसके अलावा, संरचना की भविष्यवाणी के तरीकों ने इसे आठ-फंसे वाले β-बैरल प्रोटीन होने का अनुमान लगाया था और बहुतों ने तो इसे बाह्य झिल्ली प्रोटीन होने की भविष्यवाणी की थी (गलत भविष्यवाणी वाला चित्र नीचे देखें)।

इसलिए, हमने इसे संकेतित दिशानिर्धारण अनुक्रम के बिना और टैग-मुक्त क्लोन किया जिससे प्रोटीन का अधिक उत्पादन थक्के के रूप उम्मीद थी। परन्तु प्रोटीन का उत्पादन घुलनशील अवस्था में हुआ और वह घोल में एकलरुपी था। इन सभी परिणामों और इस प्रोटीन संरचना ने भविष्यवाणी को पूरी तरह से गलत साबित कर दिया।

References

  1. Pandey NK, Verma G, Kushwaha GS, Suar M and Bhavesh NS (2020) Crystal structure of the usher chaperone YadV reveals a monomer with the proline lock in closed conformation suggestive of an intermediate state. FEBS Lett.. 594, 3057-3066.
  2. Structure co-ordinates: Protein Data Bank (PDB) accession numbers 5GHU.