Tag Archives: Structure

G. N. Ramachandran: A genius who laid the foundation of protein structures and 3D medical imaging

If you think you know it, then you do not know it, and if you know that you cannot know it, then you know it.

In one of his Mathematical Philosophy (MATPHIL) reports, G. N. Ramachandran elaborated on this interesting paradox from Kena Upanishad, describing the Divine force of the Universe, which conveys perpetual doubt and indefiniteness.

Prof. Gopalasamudram Narayana Ramachandran, affectionately known as GNR, was the finest molecular biologist whose seminal work in structural biology had put India on the world map of modern biology. The structural Biology era started with Linus Pauling and his colleague’s discovery of the  -helical structures of polypeptides, which set the stage for our present-day understanding of protein function. The term molecular biology was coined in 1938 by Warren Weaver, a mathematician, and Director of the Natural Sciences Division at the Rockefeller Foundation, defining an amalgam of  Physics, Chemistry, and Biology. Still, the molecular biology revolution started with the discovery of the double-helical structure of DNA by Rosalind Franklin, Francis Crick, James Watson, and Maurice Wilkins in the early 1950s. During that period, most of the work in molecular biology was done in UK and USA. Following this, a new structural fold comprising a coiled-coil triple helix was described by GNR in a series of papers published between 1954 and 1956 in Nature with his student Gopinath Kartha. Later in the 1950s and 1960s, he applied stereochemistry principles to generate a two-dimensional plot that accurately described allowed conformations of proteins. The map, now famously known as the Ramachandran plot, has become an inalienable part of molecular biology and biochemistry textbooks.

Passionate X-ray crystallographer

After graduating from St. Joseph’s College, Trichy, in 1939, Ramachandran joined the Electrical Engineering department at the Indian Institute of Science (IISc), Bangalore, and later moved to the Physics department. GNR studied crystallography all by himself while working for D.Sc. degree under the supervision of Sir. C. V. Raman. While transferring GNR to the Physics department from the Electrical Engineering department at the IISc, Raman, who was the Director of IISc at that time, said, “I am admitting Ramachandran into my department as he is a bit too bright to be in yours…”.  After completing his doctorate, GNR moved to Cavendish Laboratory, Cambridge, where he worked on mathematical theory to determine elastic constants of cubic crystals from diffuse X-ray diffraction and obtained his second doctorate. After returning from Cambridge in 1949, he joined as an assistant professor at IISc, where he nurtured the X-ray diffraction laboratory. At the initiative of Dr. A. Lakshmanaswamy Mudaliar, the  Vice Chancellor of Madras University at that time, GNR joined Madras University in 1952 as a founding member of the Physics department. Ramachandran started cutting-edge research in crystallography that included phase determination when anomalous dispersion is present, the probability distribution of X-ray intensities, crystallographic statistics, and so forth. He derived the correct formula to calculate the X-ray phase angles using Bijvoet differences, which occur during anomalous X-ray scattering. In 1971 he returned to IISc and established the Molecular Biophysics Unit (MBU), now a leading center of research in structural biology.

The Triple helix

It has been known for a long time that form and shape of all mammals are dependent on collagen protein which makes up a third of all proteins in their bodies. Collagen is vital for structural integrity; imperfection or instability in its structure causes many disease conditions. Ramachandran and Kartha used X-ray diffraction data on the collagen derived from the Kangaroo tail tendon to delineate its structure. The structural model had three parallel left-handed helical polypeptide chains, side-by-side coiled coils packed together in a hexagonal array. The triple helical structure of collagen has been described as “braided in the manner of the pigtail of a long-haired maiden from Madras.” The collagen structure was alluding to the structural biologist of that time, and the work of GNR put India on the world map of structural biology. Ramachandran mentioned that he got the idea of a triple-helix coiled coil model from the rotation and revolution motion of the moon. 

Despite his ground-breaking research, recognition did not come easily to GNR. Other leading structural biologists of that time, like Alexander Rich and Francis Crick, who were also working on collagen structure, did not accept the model citing steric issues and discrepancies in number of inter-chain hydrogen bonds. As collagen contains hydroxyproline residues GNR in his model had more than one hydrogen bond, which were mediated by water molecule. Now the controversy is well settled in favor of the ‘Madras model’ of Ramachandran after the high-resolution crystal structure of collagen (PDB id 4OY5 [0.89 Ã…]) showed that there are, on average, 1.5 hydrogen bonds in the structure. Credit for collagen structure eluded him during his lifetime, but now the record has been set straight in favor of GNR. The basic three-dimensional structure of collagen unraveled by GNR helped us understand the molecular basis of its function and diseases caused by changes in its native structure.  

The controversy on the collagen structure based on steric issues made GNR more determined, and he started working on formulating a general stereochemistry rule for protein structure that resulted in Ramachandran Plot, which has immensely benefitted protein science and drug discovery research.

Ramachandran plot

Proteins are made of twenty naturally occurring amino acids joined together like pearls in a necklace. It is called its primary structure, where amino acid residues are joined by rigid planer peptide bonds. This linear protein chain further folds into secondary (a-helix and b-strand), tertiary and quaternary structures acquiring a unique three-dimensional shape that dictates its function. Understanding a protein’s function or any dysfunction leading to disease conditions necessarily requires knowledge of its three-dimensional structure.

Ramachandran working with Ramakrishnan and Sasisekharan analyzed all the crystal structures of amino acids and observed that nonbonded atoms were closer to each other than the sum of their respective van der Waals radii. Using this and Pauling’s a-helix information, GNR used mathematical calculation (without computers…!!!) to arrive at allowed rotations of rigid planer peptide planes that will lead to sterically acceptable contacts between them. The 2D plot of these pair of allowed angles, Phi-Psi (f y), gave birth to the Ramachandran plot. The Ramachandran plot was proved correct later when the first crystal structure of a protein was determined. The plot remains valid today when around two lakh protein structures have been experimentally determined and their coordinates deposited in the Protein Data Bank (PDB). For accuracy and acceptability, all experimentally determined structures of proteins as well as predicted structures, must confer to this map. Like the Raman effect, Bose-Einstein statistics, and Chandrasekhar limit, the Ramachandran plot has immortalized the scientist behind it. 

Describing Ramachandran plot Prof. Dame Janet Maureen Thornton, a senior scientist and director emeritus at the European Bioinformatics Institute(EBI), EMBL, had written, “It never fails to excite me, when I see the Ramachandran plot and realize how much of the beauty and order of protein structures is encapsulated by this plot. I also think that this major discovery highlights the importance of clear thought and vision that do not always need expensive equipment and huge teams of people”.

Medical Imaging

G N Ramachandran (GNR) also made seminal contributions that made a deep impact to the field of three-dimensional medical imaging. In 1971 he published two exciting research papers on Projection Reconstruction; one titled ‘Reconstruction of substance from shadow: 1. Mathematical theory with application to three-dimensional radiography and electron micrography’. In another publication co-authored with A. V. Lakshminarayanan published in the same year in Proceedings of National Academy of Sciences, USA, he suggested using convolutions in the spatial dimension. Both opened the window for creating three-dimensional (3D) images of human anatomy using two-dimensional (2D) images, which could provide depth information. This led to the development of the Computed Tomography scan (CT-scan), where several 2D X-ray images obtained at different angles and depths, called projections, are used to construct 3D images on a computer.

Magnetic Resonance Imaging (MRI) is another imaging technique that uses a projection reconstruction algorithm developed by Ramachandran. In the first publication describing MRI in Nature in 1973, Paul Lauterbur cited Ramachandran’s algorithm as a method for projection reconstruction. Lauterbur, who received Nobel Prize in Physiology in 2003, had initially called the new imaging technique zeugmatography derived from the Greek word zeugma meaning “that which is used for joining.” MRI uses linear gradient in a homogeneous magnetic field of a Nuclear Magnetic Resonance (NMR) spectrometer so that different points in the object experience a slightly different magnetic field. This leads to the NMR spectrum as a projection of the 2D object into a 1D spectrum. In MRI, several projections are acquired, and images are reconstructed using the projection reconstruction algorithm of Ramachandran.

Both CT-scan and MRI have benefited enormously from G N Ramachandran’s 1971 papers, and he is rightly credited for having a deep impact on the ‘Medical Imaging’ field. In a nutshell, Ramachandran’s contribution has revolutionized human radiology helping with a high-throughput, efficient, and accurate diagnosis, which has become a boon for the modern medical sciences.  

Personal life and Vedanta

G N Ramachandran was born on October 8,1922 in Ernakulam in Kerala. He was the eldest son of G.R. Narayana lyer and Lakshmi Ammal. His father was a Professor of mathematics who taught him mathematics.  After retiring from MBU, he continued as a Professor of Mathematical Philosophy at IISc until 1989. In 1999 GNR was awarded the 5th Ewald Prize by the International Union of Crystallography for his outstanding contributions in crystallography. He spent his final years in Chennai, where he passed away on April 7, 2001.

Syadvada and Saptabhangi of Jain philosophy had a profound impact on Ramachandran. In one of his papers published in the journal Current Science in 1982, he described their usage in Boolean Algebra. In addition to applying mathematics to biological problems, Ramachandran used mathematics to look into divinity.  In ‘Vedanta and Epistemology’ he wrote, “There is a close analogy of these ideas of modern logical analysis with the concepts in Indian philosophy of the ‘Infinite’ (Ananta), which is one of the attributes of Brahman (Absolute Reality). The Upanishads contain many statements to the effect that this Reality has contradictory properties … The logical similarity to the example of infinity in mathematics is very close. In the case of mathematical infinity, we have to say that although it is a number, it does not belong to the class of finite numbers, and therefore it can have contradictory properties such as being both greater than and smaller than itself.”

Though his contributions like the Collagen triple-helix structure; Ramachandran plot; and Tomography should have got not one or two but three Nobel prizes, he remains a shining jewel missing in the Nobel crown.

Molecular mechanism of specificity in promoter DNA recognition

Recognition of c-myc gene promoter by human RBMS1 protein. The figure shows RBMS1 protein scanning the DNA in search of its target sequence and binding to the sequence’s nucleotides in a specific manner. The surface view of the crystal structure of RBMS1 protein is shown bound with the bases of nucleotides of c-myc promoter. .

Decoding the codes of life stored in DNA is a challenge which is performed in a tightly regulated manner by the cell. Decoding involves reading the correct code at a right time by DNA binding proteins. The decoded information is then channeled through mRNA. This requires an efficient and highly specific interaction between protein and DNA that control some of the most important processes pertaining to cell survival and growth. Any dysregulation in the process can lead to malfunctioning of the cell and disease. Proteins search and bind specific sequence in the background of billions of bases in the genome. This happens through a combination of 1D sliding, 2D hopping, and 3D diffusion.

Understanding specificity of protein-DNA interactions is a long-standing question that has been attempted to understand many times by scientists all over the world. Thermodynamics and kinetics have always been discussed to be behind the matters concerning DNA binding specificity and affinity. The evidence, however, remains scarce when answering the crucial biological questions.

In this background we have worked on human RBMS1 protein that has been shown to directly regulate the c-myc gene expression levels in cancerous cells. In our study we have elucidate the molecular basis of RBMS1-promoter DNA interaction and understand the mechanism for specificity. The work provides the first structural and dynamics characterization of human RBMS1 protein, that controls the expression of c-myc proto-oncogene inside the human cell by its interaction with 7 base pair consensus sequence within the 21 bp promoter/ autonomous origin of replication region 2 kb upstream of c-myc proto-oncogene.

During the work we overcame different challenges. Bioinformatic studies have failed to correctly identify the domain boundary and this was leading to protein instability. It required a careful human analysis using some of fundamentals of molecular biophysics to redesign the construct. We extended the boundary by 5 residues which lead to expression of highly stable RBMS1 protein. This is a lesson for students who blindly trust bioinformatics results and artificial intelligence.

We performed extensive binding assay with different DNA sequences varying the bases and length of the sequences to answer the question of specificity. We determined the 2.57 Ã… crystal structure of RBMS1 in its promoter DNA bound state that provided atomic-resolution insight into specific binding of individual nucleotides of DNA with the protein. The NMR structure of free RBMS1 was solved, as the protein did not crystallize, most likely due to its inherent flexibility, which we confirmed through NMR relaxation dynamics. The protein undergoes a hinge-like motion in order to bind with the specific DNA which facilitated by flexibility in the linker region. The X-ray structure of RBMS1-c-myc promoter DNA complex and solution NMR structure of RBMS1 protein helped us to delineate the non-canonical binding mode of RBMS1 with the promoter DNA.

In a nutshell the mechanism of specificity of RBMS1 binding with promoter is driven by the thermodynamics and the dynamic domain re-organization, which is responsible for conferring specificity and affinity. The work has implications for understanding general mechanism of protein-DNA interactions that involves sliding, hopping and diffusion during stochastic target search process in a dense nucleus. In addition, the work is likely to aid in designing future anti-gene therapies.

—————

डी.एन.ए. में संग्रहीत जीवन की संहिता को पढ़ना एक चुनौती है, जिसे कोशिका द्वारा एक कड़े नियंत्रित तरीके से किया जाता है। यह प्रक्रिया एक बहुत ही समयबद्ध तरीक़े से डी.एन.ए. से जुड़ने वाले प्रोटीनो द्वारा क़ी जाती है। डी.एन.ए. में छिपी गूढ़लिपि जानकारी एम-आर.एन.ए. के माध्यम से प्रसारित होती है। इसके लिए प्रोटीन और डी.एन.ए. के बीच एक कुशल और अत्यधिक विशिष्ट संवाद की आवश्यकता होती है, जिससे कोशिका के अस्तित्व बनाए रखने और उसके विकास से संबंधित महत्वपूर्ण प्रक्रियाएँ नियंत्रित होती है। इन प्रक्रियाओं में किसी भी प्रकार की त्रुटि से कोशिका में विकृति हो जाती है और रोग उत्पन्न होते है। प्रोटीन जीनोम में अरबों आधारों की पृष्ठभूमि में विशिष्ट अनुक्रम खोजते हैं और उनके साथ सम्बंध बनाते हैं। यह एक-आयामी फिसलन, द्वि-आयामी कूदन एवं त्रि-आयामी विसरण के एक संयोजन से होता है।

प्रोटीन-डी.एन.ए. के इस पारस्परिक सम्बंध की विशिष्टता को समझने का प्रयास विश्व भर के वैज्ञानिकों द्वारा एक लंबे समय से किया जा रहा है। डी.एन.ए. से सम्बंध बनाने की विशिष्टता और आत्मीयता के पीछे ऊष्मप्रवैगिकी और गतिकी का योगदान प्रमुख माना गया है। हालांकि, इन विषयों में साक्ष्यों के दुर्लभ होने के कारण महत्वपूर्ण जैविक प्रश्नों का उत्तर देना कठिन हो जाता है।

इस पृष्ठभूमि को ध्यान में रखकर हमने मानव आर.बी.एम.एस.१ प्रोटीन पर कार्य किया है। आर.बी.एम.एस.१ प्रोटीन जो कैंसर ग्रसित कोशिकाओं में सी-मिक जीन अभिव्यक्ति के स्तर को नियंत्रित करता है । अपने अध्ययन में हमने आर.बी.एम.एस.१-प्रमोटर डी.एन.ए. से सम्बंध बनाने की प्रक्रिया के आणविक आधार को स्पष्ट किया है और विशिष्टता के लिए तंत्र को समझा है। हमारा ये शोध मानव आर.बी.एम.एस.१ प्रोटीन का पहला संरचनात्मक और गतिशीलता लक्षण वर्णन प्रदान करता है। इससे हमें आर.बी.एम.एस.१ प्रोटीन द्वारा मानव कोशिका के भीतर सी-मिक प्रोटो-ओन्कोजीन से २ किलो बेस से आगे स्थित २१ बेस जोड़ी प्रमोटर/स्वायत्त प्रतिरूप क्षेत्र के अंतर्त्स्थित ७ बेस जोड़ी सर्वसम्मत डी.एन.ए. अनुक्रम से जुड़ने की प्रकिया को समझने में सहायता मिलती है।

शोध के दौरान हमने विभिन्न चुनौतियों का सामना किया। जैव सूचनात्मक अध्ययन आर.बी.एम.एस.१ प्रोटीन के इकाइयों की सीमा की सही परिमापन करने में विफल रहे जिसके कारणवश हमें इस प्रोटीन को एक दृढ़ अवस्था में पाने में कठिनायों का सामना कारण पड़ा। फिर हमने आणविक जैव-भौतिकी के मूलभूत सिद्धांतों का उपयोग करते हुए सावधानीपूर्वक विश्लेषण का सहारा लिया। हमने दूसरी इकाई की सीमा को ५ अमिनो ऐसिड अवशेषों से बढ़ाया है जिससे अत्याधिक स्थिर आर.बी.एम.एस.१ प्रोटीन को प्राप्त करने में सफलता मिली। यह उन छात्रों के लिए एक सबक है जो अपने चक्षुओं को बंद करके जैव सूचना विज्ञान के परिणामों और कृत्रिम बुद्धिमत्ता को अक्षरशः सही मानते हैं ।

हमने विशिष्टता के प्रश्न का उत्तर देने के लिए भिन्न-भिन्न डी.एन.ए. अनुक्रमों की प्रकार और लंबाई में परिवर्तन करते हुए प्रोटीन के साथ सम्बंध बनाने की प्रक्रिया का विस्तार से अध्ययन किया। हमने आर.बी.एम.एस.१ की २.५७ Å स्तर पर आर.बी.एम.एस.१ की प्रमोटर डी.एन.ए. से जुड़ी अवस्था का स्फटिक संरचना को निर्धारित किया है। इससे प्रोटीन द्वारा डी.एन.ए. के अलग-अलग न्यूक्लियोटाइड के साथ बनाए जाने वाले विशिष्ट बंधन की परमाणु-स्तर पर अंतर्दृष्टि मिलती है। चूँकि डी.एन.ए.-मुक्त आर.बी.एम.एस.१ प्रोटीन के स्फटिक हमें प्राप्त नहीं हुए, इसलिए हमने इसकी संरचना एन.एम.आर. द्वारा निर्धारित किया। प्रोटीन के स्फटिक नहीं मिलने का कारण शायद इसका अंतर्निहित लचीलापन है, जिसकी पुष्टि हमने एन.एम.आर. आधारित विश्रांति गतिकी के विश्लेषण से की । अपने विशिष्ट डी.एन.ए. से जुड़ने की प्रक्रिया में प्रोटीन के दोनो इकाइयों के बीच एक क़ब्ज़े के समान घुमाव होता है, जिसमें दोनो इकाइयों के बीच के श्रृंखलक का लचीलापन सहायक होता है। आर.बी.एम.एस.१-सी-मिक प्रमोटर डी.एन.ए. कॉम्प्लेक्स की एक्स-रे संरचना और आर.बी.एम.एस.१ प्रोटीन की एन.एम.आर. संरचना ने हमें प्रमोटर डी.एन.ए. के साथ आर.बी.एम.एस.१ द्वारा के गैर-वैधानिक रूप से बनाए जाने वाले सम्बंध को समझने में सहायता प्रदान की।

संक्षेप में प्रमोटर के साथ आर.बी.एम.एस.१ द्वारा स्थापित सम्बंध की विशिष्टता ऊष्मप्रवैगिकी और इकाइयों के गतिशील पुनः-संगठन द्वारा संचालित होती है, जो विशिष्टता और आत्मीयता प्रदान करने के लिए उत्तरदायी है। हमारा यह शोध प्रोटीन-डी.एन.ए. सम्बंध के सामान्य तंत्र को समझने में निहितार्थ हैं, जिसमें घने नाभिक में लक्ष्य खोज प्रक्रिया के दौरान प्रोटीन द्वारा किए जाना वाला फिसलन, कूदन और विसरण शामिल है। इसके अलावा, इस काम से भविष्य में एंटी-जीन उपचारों को बनाने में मदद मिलने की संभावना है।

References

  1. Aggarwal P* and Bhavesh NS* (2021) Hinge like domain motion facilitates human RBMS1 protein binding to proto-oncogene c-myc promoter. Nucleic Acids Res. 49, 5943-5955
  2. Structure co-ordinates: Protein Data Bank (PDB) accession numbers 6M75 and 7C36.

Structural identification of a cryptic target for drug discovery against urinary tract infections

Atomic-resolution structure of YadV, a usher chaperone from Uropathogenic E. coli (PDB id 5GHU). Crystal structure was determined by Nishant Kumar Pandey (Left). Ms. Garima Verma and Dr. Gajraj Singh Kushwaha performed MD simulations (Right)
1.63 Ã… crystal structure of a usher chaperone from Uropathogenic E. coli (PDB id 5GHU)

Urinary tract infections (UTIs) are the most common and recurrent bacterial infections worldwide and are a major cause of morbidity. More than 150 million people worldwide are affected by UTIs. Gram-negative bacteria called Uropathogenic Escherichia coli (UPEC) is the primary pathogen that cause UTI. Adhesion of bacterial cell to human cell is primary requisite for bacterial pathogenesis, which is mediated by number of fibrilar and non-fibrilar adhesin molecule produced by bacteria. Fibrilar adhesin are named as fimbriae or pili and plays important role in inter-bacterial adhesion which leads to bacterial aggregation subsequently further colonisation and biofilm formation. Biofilm formation helps bacteria to evade host immune response, better survival in stress conditions and provides resistance to anti-microbial molecules and antibiotics. This is considered main reason for recurrent infection and is attributed to fimbriae assisted adhesion. Therefore, it is necessary to block adhesion by identifying new targets and developing new drugs against those targets.  

There are helper protein molecules called chaperone proteins, which are necessary for synthesis of these fimbriae or pili. However, the exact mechanism fimbriae or pili biogenesis is still not fully understood. In this study we have determined 1.63 Ã… crystal structure of one such helper protein called YadV chaperone protein, which helps in synthesis Yad pili. The monomeric structure looks like a boomerang shape with N-terminal arm having immunoglobulin (Ig) like fold and C-terminal arm has β-barrel fold. Interestingly for the first time proline lock in the closed conformation has been observed in the structure of Yadv determined by us. Although the closed lock state, which is a resting state of the molecule has been proposed for all types of UPEC pili chaperone still it was not observed previously.  Using molecular dynamics simulations we explained the opening and closing of the flexible proline lock. The proline-proline lock plays an important role in the chaperone-mediated subunit assembly, which is found in an open conformation in chaperone-subunit complex while we observed the closed conformation in subunit free structure. The observation of the closed conformation, a cryptic state, likely to be important target for design and discovery of pilicide that could bind to proline lock and maintain the lock in a closed conformation. This will lead to abolishment of pilus biogenesis that will block adhesion of UPEC to human cell. We have already shortlisted few inhibitors targeting this site on YadV. 

The work was supported by a grant from the Basic Research in Modern Biology task force of Department of Biotechnology, Government of India.

Trivia: The name of protein changed from EcpD to YadV during the course of studies. Further, the structure prediction tools have predicted it to be a eight-stranded β-barrel protein and most even predicting to be an Outer Membrane Protein (OMP) (see below figure for one of the wrong prediction).

Therefore, we cloned it without signal sequence and expressed tag-free expecting to over-express as inclusion bodies. But the protein over-expressed as soluble, in large amount and as monomer in solution. All these and final structure proved the structure prediction completely wrong.

मूत्र पथ के संक्रमण के खिलाफ दवा की खोज के लिए एक गुप्त लक्ष्य की संरचनात्मक पहचान

मूत्र पथ के संक्रमण (यू.टी.आई.) दुनिया भर में सबसे आम और आवर्तक जीवाणु संक्रमण हैं और रुग्णता का एक प्रमुख कारण है। दुनिया भर में १५ करोड़ से अधिक लोग यू.टी.आई. से प्रभावित होते हैं। यूरोपैथोजेनिक एस्चेरिचिया कोलाई (यू.पी.ई.सी.) नामक ग्राम-नकारात्मक जीवाणु प्राथमिक रोगज़नक़ है जो यू.टी.आई. का कारण बनता है। जीवाणु कोशिका का मानव कोशिका में आसंजन जीवाणु द्वारा रोगजनन के लिए प्राथमिक रूप से आवश्यक है, जो जीवाणु अपने द्वारा उत्पादित बहुत से तंतुमय और गैर-तंतुमय चिपकने वाले अणुओं की सहायता से करता है। तंतुमय आसंजन को फ़िम्ब्रिया या पिली के रूप में जाना जाता है और यह अंतर-जीवाणु आसंजन में महत्वपूर्ण भूमिका निभाता है । तत्पश्चात यह जीवाणु का एकत्रीकरण करता है जिससे बायोफ़िल्म का गठन होता है और औपनिवेशीकरण अग्रसित होता है । बायोफ़िल्म गठन जीवाणु को मानव प्रतिरक्षा प्रतिक्रिया से बचने में मदद करता है, तनाव की स्थिति में अपना अस्तित्व बनाये रखने में सहायक होता है और जीवाणु-विरोधी अणुओं और प्रतिजैविक दवाओं से प्रतिरोध प्रदान करता है। यह आवर्तक संक्रमण का मुख्य कारण माना जाता है और यह फ़िम्ब्रिया सहायित आसंजन के लिए जिम्मेदार है। इससे निपटने के लिए नए लक्ष्यों की पहचान कर उन लक्ष्यों के विरुद्ध नई दवाओं को विकसित करके आसंजन को अवरुद्ध करना आवश्यक है।

यद्यपि, फ़िम्ब्रिया या पिली जीवजनन प्रक्रिया को अभी तक सटीक तरीके से समझा नहीं गया है परन्तु एक विशेष प्रकार के सहायक प्रोटीन अणु जिन्हें चपेरोन प्रोटीन कहा जाता है वे इन फ़िम्ब्रिया या पिली के संश्लेषण के लिए अत्यावश्यक होते हैं। इस अध्ययन में हमने एक ऐसे चपेरोन प्रोटीन जिसे याड-५ चपेरोन प्रोटीन कहा जाता है, जो याड पिली को संश्लेषण करने में मदद करता है, की परमाणु-स्तर की स्फटिक संरचना का निर्धारण किया है।एकल संरचना बूमरैंग शेप की तरह दिखती है, जिसका एन-टर्मिनल इम्युनोग्लोबुलिन (आई.जी.) जैसी संरचना है तथा सी-टर्मिनल β-बैरल बनाता है। दिलचस्प बात यह है कि हमारे द्वारा निर्धारित याड-५ की संरचना में पहली बार प्रोलिन ताले को बंद स्थिति में देखा गया। यद्यपि प्रोलिन ताले की बंद स्थिति, जो प्रोटीन की एक विश्राम अवस्था है, को यू.पी.ई.सी. के सभी प्रकार के पिली चैपरोन के लिए प्रस्तावित किया गया है, फिर भी हमारे शोध से पहले कभी नहीं देखा गया था। इस अध्ययन में आणविक गतिशीलता अनुकरण का उपयोग करते हुए हमने लचीले प्रोलिन ताले के खुलने और बंद होने की प्रक्रिया को स्पष्ट रूप समझाया है। चपेरोन प्रोटीन की सहायता से विभिन्न पृथक इकाईयों की क्रमबद्ध संजोने की प्रक्रिया में प्रोलिन-प्रोलिन ताला एक महत्वपूर्ण भूमिका निभाता है, जहाँ ये चपेरोन प्रोटीन और पृथक इकाई की मिश्रित जुड़े हुए अवस्था में एक खुली स्थिति में पाया जाता है, जबकि हमने पृथक इकाई से मुक्त संरचना में इसे बंद स्थिति में पाया है। बंद संरचना का अवलोकन, जो इस प्रकार के प्रोटीन की एक गुप्त स्थिति है, हमें नए प्रकार दवाओं के खोज और संश्लेषण के लिए एक महत्वपूर्ण लक्ष्य बनने की संभावना प्रदान करता है। ऐसी नयी दवाईयाँ इस ताले को बंद करने और बंद स्थिति में रखने के लिए बाध्य कर सकती हैं। इससे पिली जीवजनन प्रक्रिया का उन्मूलन होगा जो मानव कोशिका में यू.पी.ई.सी के आसंजन को अवरुद्ध करेगा। हमने याड-५ पर स्थित इस जगह को लक्षित करने वाले कुछ अवरोधकों को चयनित कर लिया है।

यह शोध आधुनिक जीव विज्ञान में मूलभूत अनुसंधान कार्य बल, जैव प्रौद्योगिकी विभाग, भारत सरकार के एक अनुदान से समर्थित है।

रोचक जानकारी: अध्ययन के दौरान प्रोटीन का नाम ई.सी.पी.डी. से याड-५ में बदल गया। इसके अलावा, संरचना की भविष्यवाणी के तरीकों ने इसे आठ-फंसे वाले β-बैरल प्रोटीन होने का अनुमान लगाया था और बहुतों ने तो इसे बाह्य झिल्ली प्रोटीन होने की भविष्यवाणी की थी (गलत भविष्यवाणी वाला चित्र नीचे देखें)।

इसलिए, हमने इसे संकेतित दिशानिर्धारण अनुक्रम के बिना और टैग-मुक्त क्लोन किया जिससे प्रोटीन का अधिक उत्पादन थक्के के रूप उम्मीद थी। परन्तु प्रोटीन का उत्पादन घुलनशील अवस्था में हुआ और वह घोल में एकलरुपी था। इन सभी परिणामों और इस प्रोटीन संरचना ने भविष्यवाणी को पूरी तरह से गलत साबित कर दिया।

References

  1. Pandey NK, Verma G, Kushwaha GS, Suar M and Bhavesh NS (2020) Crystal structure of the usher chaperone YadV reveals a monomer with the proline lock in closed conformation suggestive of an intermediate state. FEBS Lett.. 594, 3057-3066.
  2. Structure co-ordinates: Protein Data Bank (PDB) accession numbers 5GHU.

Structure of an intermediate state during protein unfolding

Cover art (Designed by Anupam Patra) featured on 21st Jan 2020 issue of Biophysical Journal (Left). Dr. Harshesh Bhatt and Dr. Akshay Kumar Ganguly (Right)

Proteins are the unique molecules; they read the code of life in genes and their own codes are also hidden in genes.  Therefore, they are called architect, pillars and workhorses of life.  A vast majority of proteins requires a well-defined three-dimensional shape and flexibility for their specific and regulated function inside the cell. Hierarchy of protein structure starts with primary structure consisting of individual amino acid residues, which then organizes itself into helices or sheets to form secondary structures. The great Prof. G. N. Ramachandran was the first to codify geometry of the secondary structural elements in the form of backbone torsion angles. The iconic plot is called Ramachandran Plot. Proteins further fold these secondary structural elements into tertiary and quaternary structures.

Process of formation of these structures, called Protein Folding, starts immediately at their birth place called Ribosomes and most proteins emerge as perfectly folded native structure at the end of their complete synthesis. However, there are few which require helper protein molecules called chaperone to correctly shape them. Different kinds of protein have different lifespan and at the end of it they are degraded to individual units with the help of another set of protein molecules, the process called Protein Unfolding. Both folding and unfolding processes are very specific, rapid and follows a well-defined path. Levinthal Paradox described by Prof. Cyrus Levinthal concluded that had it been a random search process among all possible conformation it would take astronomical age to fold a protein. Any aberration in folding-unfolding processes leads to dysregulation and sometimes formation of aggregated state, resulting in disease conditions such as Alzheimer and Parkinson disease.

Prof. Christian B. Anfinsen had used ribonuclease A as a model showed that primary sequence of the protein under a particular environmental conditions (temperature, solvent concentration and composition, etc.) at which folding occurs, dictates formation of native structure, which is a unique, stable and kinetically accessible minimum of the free energy. Several studies have demonstrated that proteins unfold under different physical and chemical conditions in a test tube and refold back to their native confirmation upon removal of such conditions. This helped the experimentalists to follow folding-unfolding pathways at a high spatial and time resolution and understand mechanisms. Landscape funnel model of protein folding is currently widely accepted model that describes a protein’s journey through the crests and troughs of internal free energy and degrees of freedom to reach the folded state from rapidly exchanging ensemble. Proteins also take a trek through the funnel during their unfolding.

The key to understanding protein (un)folding mechanism, which is still a challenge, is high-resolution structural characterisation of all states along the funnel. In this regards solution-state NMR spectroscopy is unparalleled in providing atomic-resolution structural and dynamics information of all the states, folded, unfolded and intermediates including invisibles, along the funnel. In this work we have used a canonical RNA recognition motif (RRM) from ETR3 protein (involved in muscular dystrophy disease) to understand the unfolding mechanism of RRM containing protein. This is important as a similar motif in TDP-43 protein aggregated and eventually leads to neuromuscular disease conditions due to formation of non-native structural elements. We determined the atomic-resolution structure and dynamics of folded native state (at bottom of the funnel) and an unfolding intermediate at the middle of the funnel and performed structural and dynamics characterisation of the unfolded ensemble rapidly dancing the top of the funnel. Our data indicates that intermediate state has folded like structure but swollen and dynamics. It allows solvent to access its core more easily than the folded structure. The edges of secondary structural elements are the initiation sites of unfolding. Although the unfolded state is very dynamic and lacks any structural elements still it show bias for certain structural propensities which appears like keeping a memory of their folded state.

We believe that the atomic-resolution characterisation of unfolding pathway of a canonical RNA recognition motif is likely to help in understanding the unfolding events in other RRMs involved in disease causing conditions upon misfolding.

The study might also help in understanding those systems where protein is refolded from the purified inclusion bodies. In those cases there could be presence of minor population of folded-like but not fully folded native structure.

The work was primarily done by Dr. Harshesh Bhatt and Dr. Akshay Kumar Ganguly and FCS work was performed in collaboration with Dr. Sobhan Sen, School of Physical Sciences, Jawaharlal Nehru University (JNU), New Delhi. The cover art was designed by Mr. Anupam Patra, Ph.D. student.

प्रोटीन अद्वितीय अणु हैं; वे जीन में जीवन का कोड पढ़ते हैं और उनके स्वयं के कोड भी जीन में छिपे होते हैं। इसलिए, उन्हें जीवन के वास्तुकार, स्तंभ और कार्यक्षेत्र कहा जाता है। अधिकतर प्रोटीन को कोशिका के अंदर उनके विशिष्ट और विनियमित कार्य के लिए एक त्रिआयामी संरचना और लचीलेपन की आवश्यकता होती है। प्रोटीन संरचना का पदानुक्रम प्राथमिक संरचना से शुरू होता है जिसमें अमीनो एसिड के अवशेष होते हैं, जो तब द्वितीयक संरचनाओं के निर्माण के लिए हेलिकॉप्टर या शीट में व्यवस्थित होते हैं। महान वैज्ञानिक  प्रो. जी. एन. रामचंद्रन ने प्रोटीन की पृष्ठ के द्वितल कोणों के माध्यम से संरचनात्मक तत्वों की ज्यामिति को संहिताबद्ध करने का कार्य किया था। इन कोणों के ऊपर उनके द्वारा बनाया गया द्वि-आयामी ज्यामिति क्षेत्र को ‘रामचंद्रन प्लॉट’ कहा जाता है। प्रोटीन इन द्वितीयक संरचनाों को तृतीयक और चतुर्धातुक संरचनाओं में बदल कर मूल संरचना का निर्माण करते हैं।

इन संरचनाओं के निर्माण की प्रक्रिया, जिसे प्रोटीन फोल्डिंग  कहा जाता है, उनके जन्म स्थान पर शुरू होती है जिसे राइबोजोम कहा जाता है और अधिकांश प्रोटीन अपने पूर्ण संश्लेषण के अंत में पूरी तरह से आकृत हो मूल संरचना के रूप में उभरते हैं। हालांकि, कुछ ऐसे हैं जिन्हें जिन्हें सही ढंग से आकार पाने के लिए सहायक प्रोटीन अणुओं की आवश्यकता होती है, जिन्हे चैपरोन कहा जाता है। विभिन्न प्रकार के प्रोटीन का अलग-अलग जीवन काल होता है और इसके अंत में इन्हे एक अलग प्रकार के प्रोटीन अणुओं की आवश्यकता होती है जो उन्हें व्यक्तिगत इकाइयों अलग-अलग कर देता है, इस प्रक्रिया को प्रोटीन अनफोल्डिंग कहते है। फोल्डिंग और अनफोल्डिंग दोनों प्रक्रियाएं बहुत विशिष्ट, तीव्र और एक परिभाषित पथ का अनुसरण करती हैं। प्रो. साइरस लेविंथल द्वारा वर्णित लेविथल पैराडॉक्स के अनुसार अगर प्रोटीन अपने हर एक संभावित आकृति को समन्वेषित कर अपनी सही आकृति को प्राप्त करने की चेष्टा करे तो इस प्रक्रिया को खगोलीय उम्र लग जाएगी। फोल्डिंग-अनफोल्डिंग प्रक्रियाओं में किसी भी तरह की गड़बड़ी से विकृति उत्पन्न हो जाती है और कभी-कभी इस स्थिति में प्रोटीन का ढेर बनकर द्रव से आ जाते हैं और कोशिकाओं में जम जाते हैं, जिसके परिणामस्वरूप अल्जाइमर और पार्किंसंस रोग जैसे रोग होते हैं।

प्रो. क्रिश्चियन बी. अनफिंसन ने राइबोन्यूक्लिज़ ए प्रोटीन पर प्रयोग करके ये दिखाया था कि एक विशेष पर्यावरणीय परिस्थितियों (तापमान, विलायक एकाग्रता और संरचना, आदि) के तहत प्रोटीन का प्राथमिक अनुक्रम जिस पर तह होती है, मूल संरचना के गठन को निर्धारित करता है, जो एक अद्वितीय, स्थिर और बलगति रूप से सुलभ न्यूनतम ऊर्जा वाली स्थिति  है। कई अध्ययनों से पता चला है कि एक टेस्ट ट्यूब में विभिन्न भौतिक और रासायनिक स्थितियों में प्रोटीन की अपनी संरचना खुल जाती है और ऐसी स्थितियों को हटाने पर वह अपनी मूल पुष्टि को वापस प्राप्त कर लेता है। इससे प्रायोगिकों को एक उच्च स्थानिक और समय प्रमाणिकता पर फोल्ड-अनफोल्डिंग मार्ग और उसके तंत्र को समझने में मदद मिलती है। प्रोटीन फोल्डिंग का परिदृश्य कीप (लैंडस्केप फ़नल) तंत्र वर्तमान में व्यापक रूप से स्वीकृत तंत्र है, जो तीव्र मुक्त ऊर्जा से मुग्ध अवस्था में पहुँचने के लिए आंतरिक मुक्त ऊर्जा और स्वतंत्रता-श्रेणी के शिखाओं और गर्तों के माध्यम से प्रोटीन की यात्रा का वर्णन करता है। प्रोटीन अपने संरचना खुलने के दौरान कीप के माध्यम से ही यात्रा करते हैं।

प्रोटीन की संरचना के बनने और खुलने के तंत्र को समझने की कुंजी, जो अभी भी एक चुनौती है, कीप के भीतर के सभी संरचनाओं के उच्च-स्तर पे संरचनात्मक वर्णन अत्यावश्यक है। इस संबंध में एन.एम.आर. स्पेक्ट्रोस्कोपी सभी आकृतियों के परमाणु-स्तर की संरचनात्मक और गतिशीलता की जानकारी प्रदान करने में अद्वितीय है, और साथ ही अदृश्य, अनफोल्डेड और मध्यवर्ती सहित सभी आकृतियों की जानकारी प्रदान करता है। इस काम में हमने आर. आर. एम. युक्त प्रोटीन के अनफोलोइंग तंत्र को समझने के लिए ई. टी. आर.-३ (ETR-3) प्रोटीन (मस्कुलर डिस्ट्रॉफी रोग से जुड़ा) से एक विहित आर.एन.ए. रिकग्निशन मोटिफ (RRM) का उपयोग किया है। यह टी.डी.पी.-४३ प्रोटीन में पाए जाने वाले एक समान रूपांकनों के रूप के कारण महत्वपूर्ण है और जिसमे गैर-मूल संरचनात्मक तत्वों के गठन के कारण स्नायु-पेशी (न्यूरोमस्कुलर) रोग उत्पन्न होता है। हमने ई. टी. आर.-३ प्रोटीन के आर. आर. एम.-३ की मूल स्थिति (कीप के नीचे) और कीप के मध्य में की एक थोड़ी खुली हुई स्थिति की परमाणु-स्तर पर संरचना और गतिशीलता निर्धारित की और कीप के शीर्ष पर उन्मुक्त नृत्य करते हुए पूर्णतः खुले हुए आकृति समूह की संरचनात्मक और गतिकी की जानकारी प्राप्त की। हमारे द्वारा प्राप्त तथ्य ये बताता है कि मध्यवर्ती आकृति अपने मूल संरचना की तरह है लेकिन उसमे सूजन और अधिक गतिशीलता है। इस संरचना के अन्दर द्रव (पानी) को मूल संरचना की तुलना में अधिक आसानी से जा पाते हैं। माध्यमिक आकृति के संरचनात्मक तत्वों के किनारे प्रोटीन के खुलने के आरम्भिक स्थल हैं। हालांकि पूर्णतः खुले हुआ आकृति समूह बहुत ही गतिशील है और उसमे किसी भी संरचनात्मक तत्वों की कमी है, फिर भी यह कुछ विशेष संरचनात्मक स्थितिओं के लिए पूर्वाग्रह दिखाती है, जो उनके मूल संरचना की स्मृति रखने जैसा प्रतीत होता है।

हम मानते हैं कि हमारे द्वारा वर्णित परमाणु-स्तर की जानकारी से विभिन्न रोगों में शामिल अन्य आर. आर. एम. के संरचना खुलने की घटनाओं को समझने में मदद मिलेगी |

यह अध्ययन उन प्रणालियों को समझने में भी मदद कर सकता है जहां प्रोटीन थक्केदार अवस्था से वापस मूल संरचना में लाया जाता है। इन मामलों में मूल संरचना जैसी मामूली आबादी की भी मौजूदगी हो सकती है, जो पूरी तरह से मूल संरचना में ना हों।

यह शोध मुख्यतः डा. हर्षेश भट्ट और डा. अक्षय कुमार गांगुली द्वारा किया गया और FCS कार्य जवाहरलाल नेहरू विश्वविद्यालय (जे. एन. यू. )के भौतिक विज्ञान के डा. सोभन सेन के सहभागिता से की गई | मुख्य पृष्ठ आवरण को श्री अनुपम पात्रा, वर्तमान पी.एच.डी. छात्र, ने बनाया है।

References

  1. Dill K.A. and Chan H.S. (1997) From Levinthal to pathways to funnels. Nat. Struct. Biol. 4: 10-19
  2. Bhatt H, Ganguly AK, Sharma S, Kushwaha GS, Khan MF, Sen S and Bhavesh NS (2020) Structure of an unfolding intermediate of an RRM domain of ETR-3 reveals its native-like fold. Biophys. J. 118, 352-365.
  3. Structure co-ordinates: Protein Data Bank (PDB) accession numbers 2MY7 and 2MY8. Sequence-specific resonance assignments: BioMagResBank (BMRB) IDs: 19316 and 19685.

First report of molecular mechanism of RNA recognition in Malaria parasite

 

Structure of the PfSR1-RNA complex. Dr. Akshay Kumar Ganguly and Ms. Garima Verma who did the work.

Among the vector borne diseases malaria affects the maximum population. In 2017 alone there were about 22 crore cases more than 4 lakh death worldwide with India accounting for 6% of them1. Malaria is caused in humans when a female Anopheles mosquito transfer protozoan parasites of the genus Plasmodium and Plasmodium falciparum is the most lethal of the malarial parasites. The economic consequence of this widespread disease is also apparent from the fact that malaria endemic countries have much lower GDP growth than countries free from malaria2. In recent years drug resistance in malaria has emerged as a major threat to the public health. It is thus, imperative to elucidate the ways in which this parasite thrives in its hosts as well as the various mechanisms it employs to sustain an infection, in order to be able to effectively combat this menace. Malaria parasite uses an intelligent mechanism called alternate splicing to generate protein diversity. Alternate Splicing is one of the evolved mechanisms in higher organisms to produce different protein from a single gene by differentially processing the transcribed mRNA. This gives the parasite an added advantage to evade the drugs. To understand this important cellular event in malaria parasite we delineated the molecular mechanism of RNA binding of one such protein called serine/arginine rich (SR) protein of P. falciparum (PfSR1)5, which is the first such study in apicomplexans. Using Nuclear Magnetic Resonance (NMR) spectroscopy we determined atomic-resolution solution structures of PfSR1 protein6 in free and RNA bound states.

Supported by thermodynamic quantification we found that RNA binding domains of PfSR1 protein have contrasting preference for RNA while first domain has preference for pyrimidine especially 5’cytosine, other prefers purines (A or G), possibly due to different charges of the surface of both domains.

Our work opens a new window to understand how malaria parasite is able to produce 20% more proteins from its 5700 genes3-4 which makes it more complex than many of the organisms having more genes than it and easy to evolve into drug resistant one.

The work was primarily done by Dr. Akshay Kumar Ganguly and was actively supported by Ms. Garima Verma.

वेक्टर जनित बिमारियों में मलेरिया अधिकतम आबादी को प्रभावित करता है। अकेले २०१७ में दुनिया भर में लगभग २२ करोड़ लोग मलेरिया से ग्रसित हुए और ४ लाख से अधिक मौत के शिकार हुए जिनमे लगभग ६% भारतीय थे । मनुष्यों में मलेरिया मादा एनोफेल्स मच्छर के काटने से होता है जिसमे प्रोटोज़ोन परजीवी प्लाज्मोडियम मच्छर से निकल कर रक्त धमनियों में आ जाती है|  प्लाज्मोडियम फाल्सीपेरम मलेरिया परजीवियों में सबसे घातक है | इस व्यापक बीमारी का आर्थिक दुष्प्रभाव इस तथ्य से भी स्पष्ट है कि मलेरिया प्रभावित देशों की सकल घरेलू उत्पाद वृद्धि की दर मलेरिया मुक्त देशों की तुलना में बहुत कम है। विगत वर्षों में मलेरिया में दवा प्रतिरोध सार्वजनिक स्वास्थ्य के लिए एक बड़ा खतरा बन गया है। इस खतरे से निपटने में सक्षम होने के लिए हमे यह समझना बहुत ही जरुरी है यह परजीवी को अपने मेजबानों के भीतर संक्रमण को बनाए रखने के लिए किन विभिन्न युक्तियों का प्रयोग करता है और किस प्रकार करता है | मलेरिया परजीवी अपने भीतर प्रोटीन विविधता उत्पन्न करने के लिए ‘वैकल्पिक विभाजन’ नामक एक बुद्धिमान प्रक्रिया का उपयोग करता है | वैकल्पिक विभाजन विकसित जीवों में पाया जाने वाला यह वह विधि है जिसमे जीन से उत्पन्न वाहक आर.एन.ए. को अलग-अलग तरीके से प्रसंस्करित करके एक ही जीन से अलग-अलग प्रोटीन का उत्पादन करने के लिए जाता है । यह परजीवी को दवाओं से बचने के लिए एक अतिरिक्त लाभ देता है।मलेरिया परजीवी में इस महत्वपूर्ण कोशिकीय घटना को समझने के लिए हमने पी. फाल्सीपेरम के एक सेरीन/आर्जिनिन समृद्ध (एस.आर.) प्रोटीन (पी.एफ.एस.आर.१) द्वारा आर.एन.ए. के साथ सम्बन्ध स्थापित करने के तरीके का आणविक स्तर पर अध्ययन किया, जो कि एपीकंपप्लेक्सन समुदाय के किसी भी जीव में पहला अध्ययन है| इसके लिए हमने परमाणु चुंबकीय अनुनाद (एन.एम.आर.) स्पेक्ट्रोस्कोपी का उपयोग करके पी.एफ.एस.आर.१ प्रोटीन की अकेले और आर.एन.ए के साथ जुड़े स्थितियों में आणविक संरचना का पता लगाया |

आणविक संरचना और ऊष्मागतिकी परिमाणन से हमने ये पाया कि पी.एफ.एस.आर.१ प्रोटीन के दोनों घटक अलग अलग प्रकार के आर.एन.ए. के साथ सम्बंध  स्थापित करते हैं, जहाँ पहल घातक पिरिमिडीन, विशेष रूप से ५’ साइटोसाइन, वाले आर.एन.ए. के लिए वरीयता रखता है वहीँ दूसरा घटक प्यूरीन्स (ए या जी) वाले आर.एन.ए. को पसंद करता है | शायद ऐसा उनके भिन्न आवेश युक्त सतह के काऱण है | हमारे इस काम से भविष्य में ऐसे शोध में तेज़ी आएगी जिससे ये पता चल सकेगा कि कैसे मलेरिया परजीवी अपने ५७०० जीन से २० % से अधिक प्रोटीन उत्पन्न करने में कैसे सक्षम है जो मलेरिया परजीवी को अपने से अधिक जीन वाले जीवों से अधिक जटिल बनाता है और इसे दवा प्रतिरोधी में विकसित होने में सहायता प्रदान करता है|

यह शोध मुख्यतः डा. अक्षय कुमार गांगुली द्वारा किया गया और गरिमा वर्मा ने भी इसमें महत्वपूर्ण योगदान दिया |

References

  1. World Malaria Report 2018 (https://www.who.int/malaria/publications/world-malaria-report-2018/en/)
  2. Gallup JL and Sachs JD. (2001).The economic burden of malaria. Am J Trop Med Hyg 64, 85-96
  3. Gardner MJ, Hall N, Fung E, White O, Berriman M, Hyman RW, et al. (2002). Genome sequence of the human malaria parasite Plasmodium falciparum, Nature. 419 498-511.
  4. Sorber K, Dimon MT and DeRisi JL. (2011) RNA-Seq analysis of splicing in Plasmodium falciparum uncovers new splice junctions, alternative splicing and splicing of antisense transcripts. Nucleic Acids Res 39, 3820-3835.
  5. Eshar S, Allemand E, Sebag A, Glaser F, Muchardt C, Mandel-Gutfreund Y, et al. (2012). A novel Plasmodium falciparum SR protein is an alternative splicing factor required for the parasites’ proliferation in human erythrocytes, Nucleic Acids Res 40, 9903-9916.
  6. Ganguly AK, Verma G and Bhavesh NS(2019) The N-terminal RNA recognition motif of PfSR1 confers semi-specificity for pyrimidines during RNA recognition.  J. Mol. Biol. 431, 498-510
  7. Structure co-ordinates: Protein Data Bank (PDB) accession numbers 2N3L and 2N7C. Sequence-specific resonance assignments BioMagResBank (BMRB) IDs: 25650, 25800, 25779.