MonarchBase - Protein-coding gene

DPOGS203300
Transcript	DPOGS203300-TA	3060 bp
Protein	DPOGS203300-PA	1019 aa
Genomic position	DPSCF300003 - 1152054-1171535
RNAseq coverage	316x (Rank: top 36%)

Annotation
*Heliconius*	HMEL016654	84.76%
*Bombyx*	BGIBMGA012252-TA	85.67%
*Drosophila*	trio-PC	55.76%
EBI UniRef50	UniRef50_G6DIR3	100.00%	Putative uncharacterized protein n=3 Tax=Pancrustacea RepID=G6DIR3_DANPL
NCBI RefSeq	XP_002424753.1	55.91%	Huntingtin-associated protein-interacting protein, putative [Pediculus humanus corporis]
NCBI nr blastp	gi\|270003787	60.91%	hypothetical protein TcasGA2_TC003063 [Tribolium castaneum]
NCBI nr blastx	gi\|270003787	60.85%	hypothetical protein TcasGA2_TC003063 [Tribolium castaneum]

Group
Gene Ontology	GO:0005622	6.1e-60	intracellular
	GO:0035023	6.1e-60	regulation of Rho protein signal transduction
	GO:0005089	6.1e-60	Rho guanyl-nucleotide exchange factor activity
	GO:0005515	2.4e-35	protein binding
KEGG pathway
InterPro domain	[540-723] IPR000219	6.1e-60	Dbl homology (DH) domain
	[738-869] IPR011993	2.4e-35	Pleckstrin homology-type
	[187-288] IPR018159	4e-13	Spectrin/alpha-actinin
	[186-286] IPR002017	5.1e-13	Spectrin repeat
	[911-983] IPR001452	2.3e-09	Src homology-3 domain
Orthology group	MCL10779		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS203300-TA
ATGCTCAAGTATCATCGGCGGTCGCATAGACACAAATCACCGGTCCAGTGCCTGAGATGGAGGTCGTCTGGAGAAACGGAGGCAGCGAGCACAGCGGCGGTGGAGTCGACGCTGGAGAGACTTAGAGGAACCCGAAGTGCCCTTGAAGAACTCTGGTCCGACCGTGAGAGAAGACTGGAACTCACACTGCAACTGCGACATTTCGAGAGAGATGCCCTGGAGGTGTCGTCACGTTTGGAACTATGGGGTGAAGAGTTGCAGCGCACGGAACCGCCTCGGGACCCTCAACAGGCGGAACAAGCTCTTGCAGCACATAACGAGAGCGTGGCCAGGATGCAACACGCCACCTTCCAGGTGGTGCAACAAGGACAGGAACTGGCGGCCGCAATAGCTGAGGCATCAGATGTGATGGCTTCTAGTTCCGACAGCTCGGAGGGCGCTCCTATGGATGCTCAAGCTCGCGTTCAGCTTCTTCTAGAGTTCTTACATGACAGACAATTGGATTTGGAAGAACTGGCTGAAGAGCGCCGTGCACGTTTCGAGCAATGCGTTCAACTTGGTCAGTTCCAAAAAGACGCAGCCCAAGTCGTGAGTTGGATAAGAAATGGTGAGGCGATGTTGTCAGCGTCATTCTCAATACCCGGAACACTGTCTGAAGCGGAGCAGCTGAAACGAGAACATGATCAATTCCAAGTGGCCGTCGAGAAGACCCACGCTAGTGCTGTGCAAGTTAAATACCGGGCGGACGCTCTTCGCGCTGCTAACCACTACGACCCACACACCATAAGAGAGATATCTGAGGAGGTGACAGAGAGATGGCAGCGTCTGGTGACTTGTGCGGAGGAACGTCACAAATTGGTGACGGCGTCGTTGAACTTCTACAAGACAGCAGAGCAGGTGTGCTCTGTGCTGGACTCGTTGGAGCGCGAGTATCGTCGTGATGAGGATTGGTGTGGTTCAACGAGCGCACCGGCCGCAGCCGCCTCCAACCTGGACAAGGCTTCACAGGTTGCGGCGTTGATAGTGAAGCACGGCGAACAGAAGGAGGCGTTCCTGAAAGCGTGTACTCTAGCTCGTCGCACGGCTGAGACGTTCCTAAAGTACGCGGCTCGTTCAGCTCAGGTTCACGGACAGACTGCGGCCGCTAGTAAGGCTCACCACGAACAGACACGTGCTATACTCGACACTCTACTGGCGCAAGAGAACAAGGTCCTCGAGCATTGGACGGTCCGTAAGAAGCGCCTGGAGCAGTGCCAGCAGTTCGCGTTGTTCGAGCGCTCAGCCCGCGCGGCCGTCGAGTGGATCCGCGAGACTCAGGAGCGGTGCGGTGCTGCTGCCGCTGCTGCTGCCGGCGGCGTCGCTCGCGAGTCACGGGAACGAGTCAGACTGTTGGCGCAGCTCGCCGACGGGCTCGTAGAGAAGGGTCACCCGCACGCCGTGCAGATCAAAGAGTGGGTCGCCGCCGTTGATGCCAGATATGCGGAGTTCAGTGGGTCCATGGAAGGCGGGGAGAGCGAGGCTGAGAGTGATTCTGGTGTAGCGGCGTCGTTGAGCTCCGGACAGACCAGTGAGACTGAGACTCGCGTGGAACAACCGCCGGCCGCCTCCGCTGACGATAAACGTCGGAGTGCACGTCGCAAAGAGTTTATAATGGCGGAGCTCCTGCAGACAGAGCGCGCATACGTCAAGGATCTGGAGACTTGCATAACATGTTATCTGCGGGAGATGAGAACAGACCCAGCCTCCGTACCGACCGCACTTCAGGGCAAGGAGGAGCTGATATTCGGTAACATAGAGGAGATACATCGGTTCCACGAGCGTGTGTTCTTACGCGAGTTGGATAAGTACGAGACTATGCCAGAGGATGTTGGTCATTGTTTCGTGACCTGGGCGCGAGAGTTCGATATGTACGTCTCGTACTGTAGGAACAAACCCGACAGCAATGCTGCGGTCGTCCAACACGCCGGCGACTACTTCGATAGAGTGCAGCGCAGGAAGAAACTAGAGCATCCGTTGGCCGCTTACCTCATAAAGCCGGTGCAAAGAATCACTAAATACCAGCTGCTGCTGAAAGACCTCCAGGCGTGCTGTGCCGAGGGTCAAGGAGAAATTAAGGACGGGCTGGAGGTGATGTTGTCTGTACCGAAGAAGGCCAACGACGCCATGCACCTGTCGAACCTCGAGGGCTGCGACGTGCCAACGGACAGCCTGGGCGAGGTGGTGCTCCAGGACTCGTTCCAGGTGTGGGACCTGCGTCAGATCATCAAGAAGTGCCGCGAGAGACGCGTCTTCCTCTTCGACCTGCACCTCCTGCTAGCCAAGGAAGTGAAAGACACACACGGAAAGGCTAAATACATATACAAGACTAAATTCATGACATCCGAGCTGGGTGTGACGGAGCACATCGAGGGCGATGATTGTAAATTCTCAGTGTGGACCGGTCGTGAGCCTATGGCCAGCGACTGCCGCATAGTTCTCAAGGCGCCCTCCCTCGACGTCAAGCAGACGTGGGTCAGGCGCTTACGAGAAGTCATACAGGAAACCTACTTCAGTGCGGCTCTGCAGCAGCCACCGCGCAGCCCGGCCCGGGCTCCGCCACCCAGCTCGCAGAGATCGAGCCGTGACTTCGAAGACACGGACACAGAGAATCTGGACCGCAACTCACTGGCTTCATTCGGCAGCGGCAACACTACAGACTCCGATAAGGTCATGTGTAACACTCAGTACAGTGGTAACAGTCCCGCTGGAGCTGAGATGAGCTGGGTGGTCGCCGACCACTCGTCGGGAGGAGCTGGGGAGGTGTCGGTATGTAAAGGACAGCAGGTGGAGGTGCTGGAGGCGTGGGCGGCGCGCCCCGATTGGTGGCTGGTGCGCCGGGCGGGCGAGCCTCCAGTTGAAGGAGCTGTACCCGCCGCGGTGCTGAAGCCTCAGCCGCACCAGAAGACGTCACCGTCAAGGCGACCACTCAGCCAGCCTGATGATAACATAGGTCATGAAAATGCTCGTACTGGTCGAGGCGTGGCCAAGTCACAGATTGGTCACATATTTGGACTAGGTTAG

Protein sequence:

>DPOGS203300-PA
MLKYHRRSHRHKSPVQCLRWRSSGETEAASTAAVESTLERLRGTRSALEELWSDRERRLELTLQLRHFERDALEVSSRLELWGEELQRTEPPRDPQQAEQALAAHNESVARMQHATFQVVQQGQELAAAIAEASDVMASSSDSSEGAPMDAQARVQLLLEFLHDRQLDLEELAEERRARFEQCVQLGQFQKDAAQVVSWIRNGEAMLSASFSIPGTLSEAEQLKREHDQFQVAVEKTHASAVQVKYRADALRAANHYDPHTIREISEEVTERWQRLVTCAEERHKLVTASLNFYKTAEQVCSVLDSLEREYRRDEDWCGSTSAPAAAASNLDKASQVAALIVKHGEQKEAFLKACTLARRTAETFLKYAARSAQVHGQTAAASKAHHEQTRAILDTLLAQENKVLEHWTVRKKRLEQCQQFALFERSARAAVEWIRETQERCGAAAAAAAGGVARESRERVRLLAQLADGLVEKGHPHAVQIKEWVAAVDARYAEFSGSMEGGESEAESDSGVAASLSSGQTSETETRVEQPPAASADDKRRSARRKEFIMAELLQTERAYVKDLETCITCYLREMRTDPASVPTALQGKEELIFGNIEEIHRFHERVFLRELDKYETMPEDVGHCFVTWAREFDMYVSYCRNKPDSNAAVVQHAGDYFDRVQRRKKLEHPLAAYLIKPVQRITKYQLLLKDLQACCAEGQGEIKDGLEVMLSVPKKANDAMHLSNLEGCDVPTDSLGEVVLQDSFQVWDLRQIIKKCRERRVFLFDLHLLLAKEVKDTHGKAKYIYKTKFMTSELGVTEHIEGDDCKFSVWTGREPMASDCRIVLKAPSLDVKQTWVRRLREVIQETYFSAALQQPPRSPARAPPPSSQRSSRDFEDTDTENLDRNSLASFGSGNTTDSDKVMCNTQYSGNSPAGAEMSWVVADHSSGGAGEVSVCKGQQVEVLEAWAARPDWWLVRRAGEPPVEGAVPAAVLKPQPHQKTSPSRRPLSQPDDNIGHENARTGRGVAKSQIGHIFGLG-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: