Tag Archives: Structure

Molecular mechanism of specificity in promoter DNA recognition

Recognition of c-myc gene promoter by human RBMS1 protein. The figure shows RBMS1 protein scanning the DNA in search of its target sequence and binding to the sequence’s nucleotides in a specific manner. The surface view of the crystal structure of RBMS1 protein is shown bound with the bases of nucleotides of c-myc promoter. .

Decoding the codes of life stored in DNA is a challenge which is performed in a tightly regulated manner by the cell. Decoding involves reading the correct code at a right time by DNA binding proteins. The decoded information is then channeled through mRNA. This requires an efficient and highly specific interaction between protein and DNA that control some of the most important processes pertaining to cell survival and growth. Any dysregulation in the process can lead to malfunctioning of the cell and disease. Proteins search and bind specific sequence in the background of billions of bases in the genome. This happens through a combination of 1D sliding, 2D hopping, and 3D diffusion.

Understanding specificity of protein-DNA interactions is a long-standing question that has been attempted to understand many times by scientists all over the world. Thermodynamics and kinetics have always been discussed to be behind the matters concerning DNA binding specificity and affinity. The evidence, however, remains scarce when answering the crucial biological questions.

In this background we have worked on human RBMS1 protein that has been shown to directly regulate the c-myc gene expression levels in cancerous cells. In our study we have elucidate the molecular basis of RBMS1-promoter DNA interaction and understand the mechanism for specificity. The work provides the first structural and dynamics characterization of human RBMS1 protein, that controls the expression of c-myc proto-oncogene inside the human cell by its interaction with 7 base pair consensus sequence within the 21 bp promoter/ autonomous origin of replication region 2 kb upstream of c-myc proto-oncogene.

During the work we overcame different challenges. Bioinformatic studies have failed to correctly identify the domain boundary and this was leading to protein instability. It required a careful human analysis using some of fundamentals of molecular biophysics to redesign the construct. We extended the boundary by 5 residues which lead to expression of highly stable RBMS1 protein. This is a lesson for students who blindly trust bioinformatics results and artificial intelligence.

We performed extensive binding assay with different DNA sequences varying the bases and length of the sequences to answer the question of specificity. We determined the 2.57 Å crystal structure of RBMS1 in its promoter DNA bound state that provided atomic-resolution insight into specific binding of individual nucleotides of DNA with the protein. The NMR structure of free RBMS1 was solved, as the protein did not crystallize, most likely due to its inherent flexibility, which we confirmed through NMR relaxation dynamics. The protein undergoes a hinge-like motion in order to bind with the specific DNA which facilitated by flexibility in the linker region. The X-ray structure of RBMS1-c-myc promoter DNA complex and solution NMR structure of RBMS1 protein helped us to delineate the non-canonical binding mode of RBMS1 with the promoter DNA.

In a nutshell the mechanism of specificity of RBMS1 binding with promoter is driven by the thermodynamics and the dynamic domain re-organization, which is responsible for conferring specificity and affinity. The work has implications for understanding general mechanism of protein-DNA interactions that involves sliding, hopping and diffusion during stochastic target search process in a dense nucleus. In addition, the work is likely to aid in designing future anti-gene therapies.

—————

डी.एन.ए. में संग्रहीत जीवन की संहिता को पढ़ना एक चुनौती है, जिसे कोशिका द्वारा एक कड़े नियंत्रित तरीके से किया जाता है। यह प्रक्रिया एक बहुत ही समयबद्ध तरीक़े से डी.एन.ए. से जुड़ने वाले प्रोटीनो द्वारा क़ी जाती है। डी.एन.ए. में छिपी गूढ़लिपि जानकारी एम-आर.एन.ए. के माध्यम से प्रसारित होती है। इसके लिए प्रोटीन और डी.एन.ए. के बीच एक कुशल और अत्यधिक विशिष्ट संवाद की आवश्यकता होती है, जिससे कोशिका के अस्तित्व बनाए रखने और उसके विकास से संबंधित महत्वपूर्ण प्रक्रियाएँ नियंत्रित होती है। इन प्रक्रियाओं में किसी भी प्रकार की त्रुटि से कोशिका में विकृति हो जाती है और रोग उत्पन्न होते है। प्रोटीन जीनोम में अरबों आधारों की पृष्ठभूमि में विशिष्ट अनुक्रम खोजते हैं और उनके साथ सम्बंध बनाते हैं। यह एक-आयामी फिसलन, द्वि-आयामी कूदन एवं त्रि-आयामी विसरण के एक संयोजन से होता है।

प्रोटीन-डी.एन.ए. के इस पारस्परिक सम्बंध की विशिष्टता को समझने का प्रयास विश्व भर के वैज्ञानिकों द्वारा एक लंबे समय से किया जा रहा है। डी.एन.ए. से सम्बंध बनाने की विशिष्टता और आत्मीयता के पीछे ऊष्मप्रवैगिकी और गतिकी का योगदान प्रमुख माना गया है। हालांकि, इन विषयों में साक्ष्यों के दुर्लभ होने के कारण महत्वपूर्ण जैविक प्रश्नों का उत्तर देना कठिन हो जाता है।

इस पृष्ठभूमि को ध्यान में रखकर हमने मानव आर.बी.एम.एस.१ प्रोटीन पर कार्य किया है। आर.बी.एम.एस.१ प्रोटीन जो कैंसर ग्रसित कोशिकाओं में सी-मिक जीन अभिव्यक्ति के स्तर को नियंत्रित करता है । अपने अध्ययन में हमने आर.बी.एम.एस.१-प्रमोटर डी.एन.ए. से सम्बंध बनाने की प्रक्रिया के आणविक आधार को स्पष्ट किया है और विशिष्टता के लिए तंत्र को समझा है। हमारा ये शोध मानव आर.बी.एम.एस.१ प्रोटीन का पहला संरचनात्मक और गतिशीलता लक्षण वर्णन प्रदान करता है। इससे हमें आर.बी.एम.एस.१ प्रोटीन द्वारा मानव कोशिका के भीतर सी-मिक प्रोटो-ओन्कोजीन से २ किलो बेस से आगे स्थित २१ बेस जोड़ी प्रमोटर/स्वायत्त प्रतिरूप क्षेत्र के अंतर्त्स्थित ७ बेस जोड़ी सर्वसम्मत डी.एन.ए. अनुक्रम से जुड़ने की प्रकिया को समझने में सहायता मिलती है।

शोध के दौरान हमने विभिन्न चुनौतियों का सामना किया। जैव सूचनात्मक अध्ययन आर.बी.एम.एस.१ प्रोटीन के इकाइयों की सीमा की सही परिमापन करने में विफल रहे जिसके कारणवश हमें इस प्रोटीन को एक दृढ़ अवस्था में पाने में कठिनायों का सामना कारण पड़ा। फिर हमने आणविक जैव-भौतिकी के मूलभूत सिद्धांतों का उपयोग करते हुए सावधानीपूर्वक विश्लेषण का सहारा लिया। हमने दूसरी इकाई की सीमा को ५ अमिनो ऐसिड अवशेषों से बढ़ाया है जिससे अत्याधिक स्थिर आर.बी.एम.एस.१ प्रोटीन को प्राप्त करने में सफलता मिली। यह उन छात्रों के लिए एक सबक है जो अपने चक्षुओं को बंद करके जैव सूचना विज्ञान के परिणामों और कृत्रिम बुद्धिमत्ता को अक्षरशः सही मानते हैं ।

हमने विशिष्टता के प्रश्न का उत्तर देने के लिए भिन्न-भिन्न डी.एन.ए. अनुक्रमों की प्रकार और लंबाई में परिवर्तन करते हुए प्रोटीन के साथ सम्बंध बनाने की प्रक्रिया का विस्तार से अध्ययन किया। हमने आर.बी.एम.एस.१ की २.५७ Å स्तर पर आर.बी.एम.एस.१ की प्रमोटर डी.एन.ए. से जुड़ी अवस्था का स्फटिक संरचना को निर्धारित किया है। इससे प्रोटीन द्वारा डी.एन.ए. के अलग-अलग न्यूक्लियोटाइड के साथ बनाए जाने वाले विशिष्ट बंधन की परमाणु-स्तर पर अंतर्दृष्टि मिलती है। चूँकि डी.एन.ए.-मुक्त आर.बी.एम.एस.१ प्रोटीन के स्फटिक हमें प्राप्त नहीं हुए, इसलिए हमने इसकी संरचना एन.एम.आर. द्वारा निर्धारित किया। प्रोटीन के स्फटिक नहीं मिलने का कारण शायद इसका अंतर्निहित लचीलापन है, जिसकी पुष्टि हमने एन.एम.आर. आधारित विश्रांति गतिकी के विश्लेषण से की । अपने विशिष्ट डी.एन.ए. से जुड़ने की प्रक्रिया में प्रोटीन के दोनो इकाइयों के बीच एक क़ब्ज़े के समान घुमाव होता है, जिसमें दोनो इकाइयों के बीच के श्रृंखलक का लचीलापन सहायक होता है। आर.बी.एम.एस.१-सी-मिक प्रमोटर डी.एन.ए. कॉम्प्लेक्स की एक्स-रे संरचना और आर.बी.एम.एस.१ प्रोटीन की एन.एम.आर. संरचना ने हमें प्रमोटर डी.एन.ए. के साथ आर.बी.एम.एस.१ द्वारा के गैर-वैधानिक रूप से बनाए जाने वाले सम्बंध को समझने में सहायता प्रदान की।

संक्षेप में प्रमोटर के साथ आर.बी.एम.एस.१ द्वारा स्थापित सम्बंध की विशिष्टता ऊष्मप्रवैगिकी और इकाइयों के गतिशील पुनः-संगठन द्वारा संचालित होती है, जो विशिष्टता और आत्मीयता प्रदान करने के लिए उत्तरदायी है। हमारा यह शोध प्रोटीन-डी.एन.ए. सम्बंध के सामान्य तंत्र को समझने में निहितार्थ हैं, जिसमें घने नाभिक में लक्ष्य खोज प्रक्रिया के दौरान प्रोटीन द्वारा किए जाना वाला फिसलन, कूदन और विसरण शामिल है। इसके अलावा, इस काम से भविष्य में एंटी-जीन उपचारों को बनाने में मदद मिलने की संभावना है।

References

  1. Aggarwal P* and Bhavesh NS* (2021) Hinge like domain motion facilitates human RBMS1 protein binding to proto-oncogene c-myc promoter. Nucleic Acids Res. 49, 5943-5955
  2. Structure co-ordinates: Protein Data Bank (PDB) accession numbers 6M75 and 7C36.

Structural identification of a cryptic target for drug discovery against urinary tract infections

Atomic-resolution structure of YadV, a usher chaperone from Uropathogenic E. coli (PDB id 5GHU). Crystal structure was determined by Nishant Kumar Pandey (Left). Ms. Garima Verma and Dr. Gajraj Singh Kushwaha performed MD simulations (Right)
1.63 Å crystal structure of a usher chaperone from Uropathogenic E. coli (PDB id 5GHU)

Urinary tract infections (UTIs) are the most common and recurrent bacterial infections worldwide and are a major cause of morbidity. More than 150 million people worldwide are affected by UTIs. Gram-negative bacteria called Uropathogenic Escherichia coli (UPEC) is the primary pathogen that cause UTI. Adhesion of bacterial cell to human cell is primary requisite for bacterial pathogenesis, which is mediated by number of fibrilar and non-fibrilar adhesin molecule produced by bacteria. Fibrilar adhesin are named as fimbriae or pili and plays important role in inter-bacterial adhesion which leads to bacterial aggregation subsequently further colonisation and biofilm formation. Biofilm formation helps bacteria to evade host immune response, better survival in stress conditions and provides resistance to anti-microbial molecules and antibiotics. This is considered main reason for recurrent infection and is attributed to fimbriae assisted adhesion. Therefore, it is necessary to block adhesion by identifying new targets and developing new drugs against those targets.  

There are helper protein molecules called chaperone proteins, which are necessary for synthesis of these fimbriae or pili. However, the exact mechanism fimbriae or pili biogenesis is still not fully understood. In this study we have determined 1.63 Å crystal structure of one such helper protein called YadV chaperone protein, which helps in synthesis Yad pili. The monomeric structure looks like a boomerang shape with N-terminal arm having immunoglobulin (Ig) like fold and C-terminal arm has β-barrel fold. Interestingly for the first time proline lock in the closed conformation has been observed in the structure of Yadv determined by us. Although the closed lock state, which is a resting state of the molecule has been proposed for all types of UPEC pili chaperone still it was not observed previously.  Using molecular dynamics simulations we explained the opening and closing of the flexible proline lock. The proline-proline lock plays an important role in the chaperone-mediated subunit assembly, which is found in an open conformation in chaperone-subunit complex while we observed the closed conformation in subunit free structure. The observation of the closed conformation, a cryptic state, likely to be important target for design and discovery of pilicide that could bind to proline lock and maintain the lock in a closed conformation. This will lead to abolishment of pilus biogenesis that will block adhesion of UPEC to human cell. We have already shortlisted few inhibitors targeting this site on YadV. 

The work was supported by a grant from the Basic Research in Modern Biology task force of Department of Biotechnology, Government of India.

Trivia: The name of protein changed from EcpD to YadV during the course of studies. Further, the structure prediction tools have predicted it to be a eight-stranded β-barrel protein and most even predicting to be an Outer Membrane Protein (OMP) (see below figure for one of the wrong prediction).

Therefore, we cloned it without signal sequence and expressed tag-free expecting to over-express as inclusion bodies. But the protein over-expressed as soluble, in large amount and as monomer in solution. All these and final structure proved the structure prediction completely wrong.

मूत्र पथ के संक्रमण के खिलाफ दवा की खोज के लिए एक गुप्त लक्ष्य की संरचनात्मक पहचान

मूत्र पथ के संक्रमण (यू.टी.आई.) दुनिया भर में सबसे आम और आवर्तक जीवाणु संक्रमण हैं और रुग्णता का एक प्रमुख कारण है। दुनिया भर में १५ करोड़ से अधिक लोग यू.टी.आई. से प्रभावित होते हैं। यूरोपैथोजेनिक एस्चेरिचिया कोलाई (यू.पी.ई.सी.) नामक ग्राम-नकारात्मक जीवाणु प्राथमिक रोगज़नक़ है जो यू.टी.आई. का कारण बनता है। जीवाणु कोशिका का मानव कोशिका में आसंजन जीवाणु द्वारा रोगजनन के लिए प्राथमिक रूप से आवश्यक है, जो जीवाणु अपने द्वारा उत्पादित बहुत से तंतुमय और गैर-तंतुमय चिपकने वाले अणुओं की सहायता से करता है। तंतुमय आसंजन को फ़िम्ब्रिया या पिली के रूप में जाना जाता है और यह अंतर-जीवाणु आसंजन में महत्वपूर्ण भूमिका निभाता है । तत्पश्चात यह जीवाणु का एकत्रीकरण करता है जिससे बायोफ़िल्म का गठन होता है और औपनिवेशीकरण अग्रसित होता है । बायोफ़िल्म गठन जीवाणु को मानव प्रतिरक्षा प्रतिक्रिया से बचने में मदद करता है, तनाव की स्थिति में अपना अस्तित्व बनाये रखने में सहायक होता है और जीवाणु-विरोधी अणुओं और प्रतिजैविक दवाओं से प्रतिरोध प्रदान करता है। यह आवर्तक संक्रमण का मुख्य कारण माना जाता है और यह फ़िम्ब्रिया सहायित आसंजन के लिए जिम्मेदार है। इससे निपटने के लिए नए लक्ष्यों की पहचान कर उन लक्ष्यों के विरुद्ध नई दवाओं को विकसित करके आसंजन को अवरुद्ध करना आवश्यक है।

यद्यपि, फ़िम्ब्रिया या पिली जीवजनन प्रक्रिया को अभी तक सटीक तरीके से समझा नहीं गया है परन्तु एक विशेष प्रकार के सहायक प्रोटीन अणु जिन्हें चपेरोन प्रोटीन कहा जाता है वे इन फ़िम्ब्रिया या पिली के संश्लेषण के लिए अत्यावश्यक होते हैं। इस अध्ययन में हमने एक ऐसे चपेरोन प्रोटीन जिसे याड-५ चपेरोन प्रोटीन कहा जाता है, जो याड पिली को संश्लेषण करने में मदद करता है, की परमाणु-स्तर की स्फटिक संरचना का निर्धारण किया है।एकल संरचना बूमरैंग शेप की तरह दिखती है, जिसका एन-टर्मिनल इम्युनोग्लोबुलिन (आई.जी.) जैसी संरचना है तथा सी-टर्मिनल β-बैरल बनाता है। दिलचस्प बात यह है कि हमारे द्वारा निर्धारित याड-५ की संरचना में पहली बार प्रोलिन ताले को बंद स्थिति में देखा गया। यद्यपि प्रोलिन ताले की बंद स्थिति, जो प्रोटीन की एक विश्राम अवस्था है, को यू.पी.ई.सी. के सभी प्रकार के पिली चैपरोन के लिए प्रस्तावित किया गया है, फिर भी हमारे शोध से पहले कभी नहीं देखा गया था। इस अध्ययन में आणविक गतिशीलता अनुकरण का उपयोग करते हुए हमने लचीले प्रोलिन ताले के खुलने और बंद होने की प्रक्रिया को स्पष्ट रूप समझाया है। चपेरोन प्रोटीन की सहायता से विभिन्न पृथक इकाईयों की क्रमबद्ध संजोने की प्रक्रिया में प्रोलिन-प्रोलिन ताला एक महत्वपूर्ण भूमिका निभाता है, जहाँ ये चपेरोन प्रोटीन और पृथक इकाई की मिश्रित जुड़े हुए अवस्था में एक खुली स्थिति में पाया जाता है, जबकि हमने पृथक इकाई से मुक्त संरचना में इसे बंद स्थिति में पाया है। बंद संरचना का अवलोकन, जो इस प्रकार के प्रोटीन की एक गुप्त स्थिति है, हमें नए प्रकार दवाओं के खोज और संश्लेषण के लिए एक महत्वपूर्ण लक्ष्य बनने की संभावना प्रदान करता है। ऐसी नयी दवाईयाँ इस ताले को बंद करने और बंद स्थिति में रखने के लिए बाध्य कर सकती हैं। इससे पिली जीवजनन प्रक्रिया का उन्मूलन होगा जो मानव कोशिका में यू.पी.ई.सी के आसंजन को अवरुद्ध करेगा। हमने याड-५ पर स्थित इस जगह को लक्षित करने वाले कुछ अवरोधकों को चयनित कर लिया है।

यह शोध आधुनिक जीव विज्ञान में मूलभूत अनुसंधान कार्य बल, जैव प्रौद्योगिकी विभाग, भारत सरकार के एक अनुदान से समर्थित है।

रोचक जानकारी: अध्ययन के दौरान प्रोटीन का नाम ई.सी.पी.डी. से याड-५ में बदल गया। इसके अलावा, संरचना की भविष्यवाणी के तरीकों ने इसे आठ-फंसे वाले β-बैरल प्रोटीन होने का अनुमान लगाया था और बहुतों ने तो इसे बाह्य झिल्ली प्रोटीन होने की भविष्यवाणी की थी (गलत भविष्यवाणी वाला चित्र नीचे देखें)।

इसलिए, हमने इसे संकेतित दिशानिर्धारण अनुक्रम के बिना और टैग-मुक्त क्लोन किया जिससे प्रोटीन का अधिक उत्पादन थक्के के रूप उम्मीद थी। परन्तु प्रोटीन का उत्पादन घुलनशील अवस्था में हुआ और वह घोल में एकलरुपी था। इन सभी परिणामों और इस प्रोटीन संरचना ने भविष्यवाणी को पूरी तरह से गलत साबित कर दिया।

References

  1. Pandey NK, Verma G, Kushwaha GS, Suar M and Bhavesh NS (2020) Crystal structure of the usher chaperone YadV reveals a monomer with the proline lock in closed conformation suggestive of an intermediate state. FEBS Lett.. 594, 3057-3066.
  2. Structure co-ordinates: Protein Data Bank (PDB) accession numbers 5GHU.

Structure of an intermediate state during protein unfolding

Cover art (Designed by Anupam Patra) featured on 21st Jan 2020 issue of Biophysical Journal (Left). Dr. Harshesh Bhatt and Dr. Akshay Kumar Ganguly (Right)

Proteins are the unique molecules; they read the code of life in genes and their own codes are also hidden in genes.  Therefore, they are called architect, pillars and workhorses of life.  A vast majority of proteins requires a well-defined three-dimensional shape and flexibility for their specific and regulated function inside the cell. Hierarchy of protein structure starts with primary structure consisting of individual amino acid residues, which then organizes itself into helices or sheets to form secondary structures. The great Prof. G. N. Ramachandran was the first to codify geometry of the secondary structural elements in the form of backbone torsion angles. The iconic plot is called Ramachandran Plot. Proteins further fold these secondary structural elements into tertiary and quaternary structures.

Process of formation of these structures, called Protein Folding, starts immediately at their birth place called Ribosomes and most proteins emerge as perfectly folded native structure at the end of their complete synthesis. However, there are few which require helper protein molecules called chaperone to correctly shape them. Different kinds of protein have different lifespan and at the end of it they are degraded to individual units with the help of another set of protein molecules, the process called Protein Unfolding. Both folding and unfolding processes are very specific, rapid and follows a well-defined path. Levinthal Paradox described by Prof. Cyrus Levinthal concluded that had it been a random search process among all possible conformation it would take astronomical age to fold a protein. Any aberration in folding-unfolding processes leads to dysregulation and sometimes formation of aggregated state, resulting in disease conditions such as Alzheimer and Parkinson disease.

Prof. Christian B. Anfinsen had used ribonuclease A as a model showed that primary sequence of the protein under a particular environmental conditions (temperature, solvent concentration and composition, etc.) at which folding occurs, dictates formation of native structure, which is a unique, stable and kinetically accessible minimum of the free energy. Several studies have demonstrated that proteins unfold under different physical and chemical conditions in a test tube and refold back to their native confirmation upon removal of such conditions. This helped the experimentalists to follow folding-unfolding pathways at a high spatial and time resolution and understand mechanisms. Landscape funnel model of protein folding is currently widely accepted model that describes a protein’s journey through the crests and troughs of internal free energy and degrees of freedom to reach the folded state from rapidly exchanging ensemble. Proteins also take a trek through the funnel during their unfolding.

The key to understanding protein (un)folding mechanism, which is still a challenge, is high-resolution structural characterisation of all states along the funnel. In this regards solution-state NMR spectroscopy is unparalleled in providing atomic-resolution structural and dynamics information of all the states, folded, unfolded and intermediates including invisibles, along the funnel. In this work we have used a canonical RNA recognition motif (RRM) from ETR3 protein (involved in muscular dystrophy disease) to understand the unfolding mechanism of RRM containing protein. This is important as a similar motif in TDP-43 protein aggregated and eventually leads to neuromuscular disease conditions due to formation of non-native structural elements. We determined the atomic-resolution structure and dynamics of folded native state (at bottom of the funnel) and an unfolding intermediate at the middle of the funnel and performed structural and dynamics characterisation of the unfolded ensemble rapidly dancing the top of the funnel. Our data indicates that intermediate state has folded like structure but swollen and dynamics. It allows solvent to access its core more easily than the folded structure. The edges of secondary structural elements are the initiation sites of unfolding. Although the unfolded state is very dynamic and lacks any structural elements still it show bias for certain structural propensities which appears like keeping a memory of their folded state.

We believe that the atomic-resolution characterisation of unfolding pathway of a canonical RNA recognition motif is likely to help in understanding the unfolding events in other RRMs involved in disease causing conditions upon misfolding.

The study might also help in understanding those systems where protein is refolded from the purified inclusion bodies. In those cases there could be presence of minor population of folded-like but not fully folded native structure.

The work was primarily done by Dr. Harshesh Bhatt and Dr. Akshay Kumar Ganguly and FCS work was performed in collaboration with Dr. Sobhan Sen, School of Physical Sciences, Jawaharlal Nehru University (JNU), New Delhi. The cover art was designed by Mr. Anupam Patra, Ph.D. student.

प्रोटीन अद्वितीय अणु हैं; वे जीन में जीवन का कोड पढ़ते हैं और उनके स्वयं के कोड भी जीन में छिपे होते हैं। इसलिए, उन्हें जीवन के वास्तुकार, स्तंभ और कार्यक्षेत्र कहा जाता है। अधिकतर प्रोटीन को कोशिका के अंदर उनके विशिष्ट और विनियमित कार्य के लिए एक त्रिआयामी संरचना और लचीलेपन की आवश्यकता होती है। प्रोटीन संरचना का पदानुक्रम प्राथमिक संरचना से शुरू होता है जिसमें अमीनो एसिड के अवशेष होते हैं, जो तब द्वितीयक संरचनाओं के निर्माण के लिए हेलिकॉप्टर या शीट में व्यवस्थित होते हैं। महान वैज्ञानिक  प्रो. जी. एन. रामचंद्रन ने प्रोटीन की पृष्ठ के द्वितल कोणों के माध्यम से संरचनात्मक तत्वों की ज्यामिति को संहिताबद्ध करने का कार्य किया था। इन कोणों के ऊपर उनके द्वारा बनाया गया द्वि-आयामी ज्यामिति क्षेत्र को ‘रामचंद्रन प्लॉट कहा जाता है। प्रोटीन इन द्वितीयक संरचनाों को तृतीयक और चतुर्धातुक संरचनाओं में बदल कर मूल संरचना का निर्माण करते हैं।

इन संरचनाओं के निर्माण की प्रक्रिया, जिसे प्रोटीन फोल्डिंग  कहा जाता है, उनके जन्म स्थान पर शुरू होती है जिसे राइबोजोम कहा जाता है और अधिकांश प्रोटीन अपने पूर्ण संश्लेषण के अंत में पूरी तरह से आकृत हो मूल संरचना के रूप में उभरते हैं। हालांकि, कुछ ऐसे हैं जिन्हें जिन्हें सही ढंग से आकार पाने के लिए सहायक प्रोटीन अणुओं की आवश्यकता होती है, जिन्हे चैपरोन कहा जाता है। विभिन्न प्रकार के प्रोटीन का अलग-अलग जीवन काल होता है और इसके अंत में इन्हे एक अलग प्रकार के प्रोटीन अणुओं की आवश्यकता होती है जो उन्हें व्यक्तिगत इकाइयों अलग-अलग कर देता है, इस प्रक्रिया को प्रोटीन अनफोल्डिंग कहते है। फोल्डिंग और अनफोल्डिंग दोनों प्रक्रियाएं बहुत विशिष्ट, तीव्र और एक परिभाषित पथ का अनुसरण करती हैं। प्रो. साइरस लेविंथल द्वारा वर्णित लेविथल पैराडॉक्स के अनुसार अगर प्रोटीन अपने हर एक संभावित आकृति को समन्वेषित कर अपनी सही आकृति को प्राप्त करने की चेष्टा करे तो इस प्रक्रिया को खगोलीय उम्र लग जाएगी। फोल्डिंग-अनफोल्डिंग प्रक्रियाओं में किसी भी तरह की गड़बड़ी से विकृति उत्पन्न हो जाती है और कभी-कभी इस स्थिति में प्रोटीन का ढेर बनकर द्रव से आ जाते हैं और कोशिकाओं में जम जाते हैं, जिसके परिणामस्वरूप अल्जाइमर और पार्किंसंस रोग जैसे रोग होते हैं।

प्रो. क्रिश्चियन बी. अनफिंसन ने राइबोन्यूक्लिज़ ए प्रोटीन पर प्रयोग करके ये दिखाया था कि एक विशेष पर्यावरणीय परिस्थितियों (तापमान, विलायक एकाग्रता और संरचना, आदि) के तहत प्रोटीन का प्राथमिक अनुक्रम जिस पर तह होती है, मूल संरचना के गठन को निर्धारित करता है, जो एक अद्वितीय, स्थिर और बलगति रूप से सुलभ न्यूनतम ऊर्जा वाली स्थिति  है। कई अध्ययनों से पता चला है कि एक टेस्ट ट्यूब में विभिन्न भौतिक और रासायनिक स्थितियों में प्रोटीन की अपनी संरचना खुल जाती है और ऐसी स्थितियों को हटाने पर वह अपनी मूल पुष्टि को वापस प्राप्त कर लेता है। इससे प्रायोगिकों को एक उच्च स्थानिक और समय प्रमाणिकता पर फोल्ड-अनफोल्डिंग मार्ग और उसके तंत्र को समझने में मदद मिलती है। प्रोटीन फोल्डिंग का परिदृश्य कीप (लैंडस्केप फ़नल) तंत्र वर्तमान में व्यापक रूप से स्वीकृत तंत्र है, जो तीव्र मुक्त ऊर्जा से मुग्ध अवस्था में पहुँचने के लिए आंतरिक मुक्त ऊर्जा और स्वतंत्रता-श्रेणी के शिखाओं और गर्तों के माध्यम से प्रोटीन की यात्रा का वर्णन करता है। प्रोटीन अपने संरचना खुलने के दौरान कीप के माध्यम से ही यात्रा करते हैं।

प्रोटीन की संरचना के बनने और खुलने के तंत्र को समझने की कुंजी, जो अभी भी एक चुनौती है, कीप के भीतर के सभी संरचनाओं के उच्च-स्तर पे संरचनात्मक वर्णन अत्यावश्यक है। इस संबंध में एन.एम.आर. स्पेक्ट्रोस्कोपी सभी आकृतियों के परमाणु-स्तर की संरचनात्मक और गतिशीलता की जानकारी प्रदान करने में अद्वितीय है, और साथ ही अदृश्य, अनफोल्डेड और मध्यवर्ती सहित सभी आकृतियों की जानकारी प्रदान करता है। इस काम में हमने आर. आर. एम. युक्त प्रोटीन के अनफोलोइंग तंत्र को समझने के लिए ई. टी. आर.-३ (ETR-3) प्रोटीन (मस्कुलर डिस्ट्रॉफी रोग से जुड़ा) से एक विहित आर.एन.ए. रिकग्निशन मोटिफ (RRM) का उपयोग किया है। यह टी.डी.पी.-४३ प्रोटीन में पाए जाने वाले एक समान रूपांकनों के रूप के कारण महत्वपूर्ण है और जिसमे गैर-मूल संरचनात्मक तत्वों के गठन के कारण स्नायु-पेशी (न्यूरोमस्कुलर) रोग उत्पन्न होता है। हमने ई. टी. आर.-३ प्रोटीन के आर. आर. एम.-३ की मूल स्थिति (कीप के नीचे) और कीप के मध्य में की एक थोड़ी खुली हुई स्थिति की परमाणु-स्तर पर संरचना और गतिशीलता निर्धारित की और कीप के शीर्ष पर उन्मुक्त नृत्य करते हुए पूर्णतः खुले हुए आकृति समूह की संरचनात्मक और गतिकी की जानकारी प्राप्त की। हमारे द्वारा प्राप्त तथ्य ये बताता है कि मध्यवर्ती आकृति अपने मूल संरचना की तरह है लेकिन उसमे सूजन और अधिक गतिशीलता है। इस संरचना के अन्दर द्रव (पानी) को मूल संरचना की तुलना में अधिक आसानी से जा पाते हैं। माध्यमिक आकृति के संरचनात्मक तत्वों के किनारे प्रोटीन के खुलने के आरम्भिक स्थल हैं। हालांकि पूर्णतः खुले हुआ आकृति समूह बहुत ही गतिशील है और उसमे किसी भी संरचनात्मक तत्वों की कमी है, फिर भी यह कुछ विशेष संरचनात्मक स्थितिओं के लिए पूर्वाग्रह दिखाती है, जो उनके मूल संरचना की स्मृति रखने जैसा प्रतीत होता है।

हम मानते हैं कि हमारे द्वारा वर्णित परमाणु-स्तर की जानकारी से विभिन्न रोगों में शामिल अन्य आर. आर. एम. के संरचना खुलने की घटनाओं को समझने में मदद मिलेगी |

यह अध्ययन उन प्रणालियों को समझने में भी मदद कर सकता है जहां प्रोटीन थक्केदार अवस्था से वापस मूल संरचना में लाया जाता है। इन मामलों में मूल संरचना जैसी मामूली आबादी की भी मौजूदगी हो सकती है, जो पूरी तरह से मूल संरचना में ना हों।

यह शोध मुख्यतः डा. हर्षेश भट्ट और डा. अक्षय कुमार गांगुली द्वारा किया गया और FCS कार्य जवाहरलाल नेहरू विश्वविद्यालय (जे. एन. यू. )के भौतिक विज्ञान के डा. सोभन सेन के सहभागिता से की गई | मुख्य पृष्ठ आवरण को श्री अनुपम पात्रा, वर्तमान पी.एच.डी. छात्र, ने बनाया है।

References

  1. Dill K.A. and Chan H.S. (1997) From Levinthal to pathways to funnels. Nat. Struct. Biol. 4: 10-19
  2. Bhatt H, Ganguly AK, Sharma S, Kushwaha GS, Khan MF, Sen S and Bhavesh NS (2020) Structure of an unfolding intermediate of an RRM domain of ETR-3 reveals its native-like fold. Biophys. J. 118, 352-365.
  3. Structure co-ordinates: Protein Data Bank (PDB) accession numbers 2MY7 and 2MY8. Sequence-specific resonance assignments: BioMagResBank (BMRB) IDs: 19316 and 19685.

First report of molecular mechanism of RNA recognition in Malaria parasite

 

Structure of the PfSR1-RNA complex. Dr. Akshay Kumar Ganguly and Ms. Garima Verma who did the work.

Among the vector borne diseases malaria affects the maximum population. In 2017 alone there were about 22 crore cases more than 4 lakh death worldwide with India accounting for 6% of them1. Malaria is caused in humans when a female Anopheles mosquito transfer protozoan parasites of the genus Plasmodium and Plasmodium falciparum is the most lethal of the malarial parasites. The economic consequence of this widespread disease is also apparent from the fact that malaria endemic countries have much lower GDP growth than countries free from malaria2. In recent years drug resistance in malaria has emerged as a major threat to the public health. It is thus, imperative to elucidate the ways in which this parasite thrives in its hosts as well as the various mechanisms it employs to sustain an infection, in order to be able to effectively combat this menace. Malaria parasite uses an intelligent mechanism called alternate splicing to generate protein diversity. Alternate Splicing is one of the evolved mechanisms in higher organisms to produce different protein from a single gene by differentially processing the transcribed mRNA. This gives the parasite an added advantage to evade the drugs. To understand this important cellular event in malaria parasite we delineated the molecular mechanism of RNA binding of one such protein called serine/arginine rich (SR) protein of P. falciparum (PfSR1)5, which is the first such study in apicomplexans. Using Nuclear Magnetic Resonance (NMR) spectroscopy we determined atomic-resolution solution structures of PfSR1 protein6 in free and RNA bound states.

Supported by thermodynamic quantification we found that RNA binding domains of PfSR1 protein have contrasting preference for RNA while first domain has preference for pyrimidine especially 5’cytosine, other prefers purines (A or G), possibly due to different charges of the surface of both domains.

Our work opens a new window to understand how malaria parasite is able to produce 20% more proteins from its 5700 genes3-4 which makes it more complex than many of the organisms having more genes than it and easy to evolve into drug resistant one.

The work was primarily done by Dr. Akshay Kumar Ganguly and was actively supported by Ms. Garima Verma.

वेक्टर जनित बिमारियों में मलेरिया अधिकतम आबादी को प्रभावित करता है। अकेले २०१७ में दुनिया भर में लगभग २२ करोड़ लोग मलेरिया से ग्रसित हुए और ४ लाख से अधिक मौत के शिकार हुए जिनमे लगभग ६% भारतीय थे । मनुष्यों में मलेरिया मादा एनोफेल्स मच्छर के काटने से होता है जिसमे प्रोटोज़ोन परजीवी प्लाज्मोडियम मच्छर से निकल कर रक्त धमनियों में आ जाती है|  प्लाज्मोडियम फाल्सीपेरम मलेरिया परजीवियों में सबसे घातक है | इस व्यापक बीमारी का आर्थिक दुष्प्रभाव इस तथ्य से भी स्पष्ट है कि मलेरिया प्रभावित देशों की सकल घरेलू उत्पाद वृद्धि की दर मलेरिया मुक्त देशों की तुलना में बहुत कम है। विगत वर्षों में मलेरिया में दवा प्रतिरोध सार्वजनिक स्वास्थ्य के लिए एक बड़ा खतरा बन गया है। इस खतरे से निपटने में सक्षम होने के लिए हमे यह समझना बहुत ही जरुरी है यह परजीवी को अपने मेजबानों के भीतर संक्रमण को बनाए रखने के लिए किन विभिन्न युक्तियों का प्रयोग करता है और किस प्रकार करता है | मलेरिया परजीवी अपने भीतर प्रोटीन विविधता उत्पन्न करने के लिए ‘वैकल्पिक विभाजन’ नामक एक बुद्धिमान प्रक्रिया का उपयोग करता है | वैकल्पिक विभाजन विकसित जीवों में पाया जाने वाला यह वह विधि है जिसमे जीन से उत्पन्न वाहक आर.एन.ए. को अलग-अलग तरीके से प्रसंस्करित करके एक ही जीन से अलग-अलग प्रोटीन का उत्पादन करने के लिए जाता है । यह परजीवी को दवाओं से बचने के लिए एक अतिरिक्त लाभ देता है।मलेरिया परजीवी में इस महत्वपूर्ण कोशिकीय घटना को समझने के लिए हमने पी. फाल्सीपेरम के एक सेरीन/आर्जिनिन समृद्ध (एस.आर.) प्रोटीन (पी.एफ.एस.आर.१) द्वारा आर.एन.ए. के साथ सम्बन्ध स्थापित करने के तरीके का आणविक स्तर पर अध्ययन किया, जो कि एपीकंपप्लेक्सन समुदाय के किसी भी जीव में पहला अध्ययन है| इसके लिए हमने परमाणु चुंबकीय अनुनाद (एन.एम.आर.) स्पेक्ट्रोस्कोपी का उपयोग करके पी.एफ.एस.आर.१ प्रोटीन की अकेले और आर.एन.ए के साथ जुड़े स्थितियों में आणविक संरचना का पता लगाया |

आणविक संरचना और ऊष्मागतिकी परिमाणन से हमने ये पाया कि पी.एफ.एस.आर.१ प्रोटीन के दोनों घटक अलग अलग प्रकार के आर.एन.ए. के साथ सम्बंध  स्थापित करते हैं, जहाँ पहल घातक पिरिमिडीन, विशेष रूप से ५’ साइटोसाइन, वाले आर.एन.ए. के लिए वरीयता रखता है वहीँ दूसरा घटक प्यूरीन्स (ए या जी) वाले आर.एन.ए. को पसंद करता है | शायद ऐसा उनके भिन्न आवेश युक्त सतह के काऱण है | हमारे इस काम से भविष्य में ऐसे शोध में तेज़ी आएगी जिससे ये पता चल सकेगा कि कैसे मलेरिया परजीवी अपने ५७०० जीन से २० % से अधिक प्रोटीन उत्पन्न करने में कैसे सक्षम है जो मलेरिया परजीवी को अपने से अधिक जीन वाले जीवों से अधिक जटिल बनाता है और इसे दवा प्रतिरोधी में विकसित होने में सहायता प्रदान करता है|

यह शोध मुख्यतः डा. अक्षय कुमार गांगुली द्वारा किया गया और गरिमा वर्मा ने भी इसमें महत्वपूर्ण योगदान दिया |

References

  1. World Malaria Report 2018 (https://www.who.int/malaria/publications/world-malaria-report-2018/en/)
  2. Gallup JL and Sachs JD. (2001).The economic burden of malaria. Am J Trop Med Hyg 64, 85-96
  3. Gardner MJ, Hall N, Fung E, White O, Berriman M, Hyman RW, et al. (2002). Genome sequence of the human malaria parasite Plasmodium falciparum, Nature. 419 498-511.
  4. Sorber K, Dimon MT and DeRisi JL. (2011) RNA-Seq analysis of splicing in Plasmodium falciparum uncovers new splice junctions, alternative splicing and splicing of antisense transcripts. Nucleic Acids Res 39, 3820-3835.
  5. Eshar S, Allemand E, Sebag A, Glaser F, Muchardt C, Mandel-Gutfreund Y, et al. (2012). A novel Plasmodium falciparum SR protein is an alternative splicing factor required for the parasites’ proliferation in human erythrocytes, Nucleic Acids Res 40, 9903-9916.
  6. Ganguly AK, Verma G and Bhavesh NS(2019) The N-terminal RNA recognition motif of PfSR1 confers semi-specificity for pyrimidines during RNA recognition.  J. Mol. Biol. 431, 498-510
  7. Structure co-ordinates: Protein Data Bank (PDB) accession numbers 2N3L and 2N7C. Sequence-specific resonance assignments BioMagResBank (BMRB) IDs: 25650, 25800, 25779.