MonarchBase - Protein-coding gene

DPOGS210690
Transcript	DPOGS210690-TA	4896 bp
Protein	DPOGS210690-PA	1631 aa
Genomic position	DPSCF300013 - 709063-735944
RNAseq coverage	38x (Rank: top 73%)

Annotation
*Heliconius*	HMEL020875	0.0	85.88%
*Bombyx*	BGIBMGA006306-TA	0.0	71.48%
*Drosophila*			%
EBI UniRef50	UniRef50_D6W8H2	0.0	49.09%	Putative uncharacterized protein n=3 Tax=Endopterygota RepID=D6W8H2_TRICA
NCBI RefSeq	XP_001814363.1	0.0	49.09%	PREDICTED: similar to C3 and PZP-like alpha-2-macroglobulin domain-containing protein 8 [Tribolium castaneum]
NCBI nr blastp	gi\|270002789	0.0	49.09%	hypothetical protein TcasGA2_TC000808 [Tribolium castaneum]
NCBI nr blastx	gi\|270002789	0.0	47.05%	hypothetical protein TcasGA2_TC000808 [Tribolium castaneum]

Group
Gene Ontology	GO:0004866	2.5e-10	endopeptidase inhibitor activity
	GO:0005576	3.4e-09	extracellular region
	GO:0005615	9.8e-08	extracellular space
KEGG pathway
InterPro domain	[660-941] IPR008930	1.8e-18	Terpenoid cylases/protein prenyltransferase alpha-alpha toroid
	[260-346] IPR001599	2.5e-10	Alpha-2-macroglobulin
	[65-189] IPR011625	2.7e-10	Alpha-2-macroglobulin, N-terminal 2
	[1042-1175] IPR009048	3.4e-09	Alpha-macroglobulin, receptor-binding
	[788-907] IPR011626	9.8e-08	A-macroglobulin complement component
Orthology group	MCL18584		Patchy

Nucleotide sequence:

>DPOGS210690-TA
ATGTATGAAGACAATGAGTTAGTCCGAAATAAAAATTTACGAACAGACTCTTATGCTCAGATATTTGGCTCTGCTGAGTTAGTAGCTGTGGAAGGCAAAGAGATAGAAACACACTATGTGTTGGCCCGGGAGAAAATACGTCGGTGGAATTCTACAACAAAATGTTACTTGCTCGTGGAAAACTTGCCTACGCCATTACAGGCTGGTGGAATTGCAAGCGCTAGTGTTTGGTCATCATGTGGGTGCCGTCAGCGTCTGTTAGCGGCGGTCACCAACGGTGGCCGTGCACTGCACTGGGCAGCTGTACCAGCACCGAAATCTGCCGATGAAAACGATTTGTGCCGTTTTAATTACACATTTCCAGTGACGGCTGACATGGCACCGATCAGTTCTCTGCTAGTTTATTACGTCACCGAGCTAGGCGAGCCAGTGAGTGACGTAGCCAGCTTCCACGTCAAACTACTACATAAGGAAGTGGCCGTAGCTATAGAAGACCGTCGATGGTGGTACCCACGAACCGCACTACAGCTTCGAGTGCTGGCACCGCCGGATTCGTTGATGTGTTTGATCGGAGCGCGTGCACTCACTGACTCAAGATTTGATACACATCAAGGTGAACCAGAACACGAAGAACAACCCGGGCCTGAGTTCGTGTCAGCGGGAGTATCACTGTTCGTTGGTGGTGGCACTTGCGGTGGTGGGGTGCTCTACCGACAGAAGACAGTCACACCTCGTGCACCAGCCCATTTAGTACCGCCCGCGTCCCACGACAGGCTTTGGATGTGGAAATGCTTTAATTATACAACTCAATTGTCAACTGATGGAGTAACAATAGCGGCGCCTTCAGAAGCTGGGCGCTGGTCTCTTTGGGCACTTTCTTTGTCTAATCGTGGTCTTCGATTCTCGGCTCCAAAAACCATTAACGTCTTTCGTCCGATACAACTGGACTTCTCCCTGCCACCTGCCCTGAAAGTCGGCGAAACAGTAGAAGTTGACGTCAAAATCACCAATAACATCAACAATTGTATGGACGTGACAGCCCTATTAGCGCTAAGTGCTGGGGCAGCTTTCGCGAGTACTGGTGCTTTATATGTCACTGAACGATTGAGACTCGGCCCGCGTGGTGGGACTCAGTTAGTTGTGAGAGTCGCTGTTAATACTCCCGGAAGGAAGAATATTACTGTGGAAGTAACTGGATATAGCGCTGATAACTGTACGGTGTCTTACACATCTTTCAACAACGAGACCCTTGTCGGTTCTGTAATTCGATCAGCGAGTGTATTGGTCCTACCGGAGGGACTACACCGGAGCGATACTCAGAGCGCATACTTCTGTGCTAACGAACATCTCGCGGTTTCTTCCCGTGGTTCATGGGAGTGGCAATGGGTGGCAGCGCCTCGTAACAGGGCAGGTCTTGTATTAGAATTGAAGGCACAGGGCGCAGCACATGTTGCATTATCGGCCGTGAGGGAACCATCCGATGATATGTATAGAGTTGTGATCGAGAGGAGTCGAGTATGGATTGCGAAAGGAAAACATGGTTATGACGTACACCTTGCCAGTGCGGAACAAACTGAAAGCGACGCGGACTGCTCTGGTGAGGACTCTTGGTGCGCTTGGTGGGTGTGGTGGGAGGGCGGTCGTCTTTCCGTCGGTAGAGGAGCATCTCCTTCAGAAAGAAGGTTGTTAGTATGGCCCCTTACAGCAGATATGAGGATAAAGTATGTCGGTTTCAGTGCGCTTTGGGGAGATCAAGCTGATTTTAGAATATGGAACTTCAATGAAGAAGCTGGATTTTCCCAAGTATTAGAATTAGGTCTACCCCATGGAGTGGTACCTGGTTCAGCGAGTGGGACGTTATTAATTTCCGGAGGTCTTCATCTTCCTTTATATAGTTTCCAAACGGATGCTTCAGATATATGGTCAGATGTTTGGAAAGATTCTCAATTATCAGCAGCTTCAGCTAGTTTGGCACCGTTATTAGCATTGGAACATATACCTCATTTAGTGGACGAAATGGAGAAGGAAAGAATATTGAATAAGCTACCTGAACAGGTACAAATACTACTTTCATTTCGTAAAAGCGATAACTCGTTCAGCGATCATCCAGCAGTAAGCAGTCATTTATCTACAATCAAAATCTTAGAAATTTTAAACAAAATTCAATCATATTACCCAGTGGATCCGGAACTTCTACAATCCATAAAATCTTGGATACAATCTAGGCAAAATCCAGATGGTTCCTTTACCCCACTTGCTGCAGACAAGGAAGTCGATTATTATCCTGTTGAAATAAAAAATGTAAACGGCACAGACGCTGAGTTTGATGTAAATGAATACTACTATTATGACAAAGATGGTAATATGACGCAAGAAGTAATTGAATATGAGAGAACCGTAGAAGTTACAGCAGAAACTTTGGTATCATTACTAGAAGTTGGAGTAGAAAATCAAGTAGATGCAGATGTTGCAAAACTAGCGCAAACGTACTTAGAGAATAATGTCCGGAATCTGACCTCGCCAGCCACTTTAGCAGCCACTGTTTTAGCGCTTGTTTTGGCAAGAAGTCCTATCGTACCTGAAGCGTTACTTATACTACGTAATGCATCAACTACTGAAGAAGGAGAGTTCGGTTGGCCAGCTCCCAGAAAGGATGCAGCAGATTGGCTCCTTGAAGAAACCTCTAGAAACATCAAAACCACTTCCTACGAAGCGGTTACAATGGAGCAGTATGTGGCTGGCGTGCGTGTGTTACTAGCTGCGTGTGCGCGGGGAGCCTTGGCGGAAGGAGAAGCGGCGGCTCGGTTCTTATACTATCGGGCATCAACTTTACAAAGGCATCCCAGTCTAGCATACCAAGCTACAAAAGCAGCTGCGCAGTACGCTGCACTGGCTCATGATAGACATAGAGCACTGACAGTATCTCTGGCTACAGCTGGAATGGAATTAACAGACACGTTAGAACTACGCGCGTTGACACCACCTCGGCCACTACAACTTCCAGGTCTACCTACTAAGGTGTTCGTATACGCCACCGGCGCTGGATGTGCCACTGTACAGGGCACAATATCATATTCGACGTATAATCCTAAAGCAGAAAATGCGCTGCTGAACATCCAAGCAGCTATTATTGAAGAGATAAGACCTGAACGAAGCAGCATCGAAGATTTGCAAGGAAACTTGCCGACATTGATCATTAAATCTTGCTTCAAATGGAAAGGAAAAGAGCGCTCCGGAATTCTTCGTTTAGAATCTTCTCTTTTCTCTGGCTATGAATTACATTCAGTAAATCCTGTTGTTCTTGATGGGGCCACGTTTGCTGACTTACATTACGGTTCGCGTGGAGAATCAGTGTGGTTTGTGTTTACTAATATTAGCTCCACTTGTCCGGTTTGCGTAACTTACGAAGCGAGATCAAAGTTCGTCATAACAAGCCTCCGTCCAGCATTTGCTAAAATTTATCCTTCAAGCAGACCAGATTTAGCTGTTGAAACATTCTTCCACGCAAGACCCGGAAGTCCTCTGTTAAGGGGTATCACAGATGATGATTTTATAACTTGGTTCGATAAAACCCAACGTGCTAGTCTAAAAACAAACACAAATATTGACAATATTTGTGAATGTGGTCGTATATGTAGTAGAGATTATGAATTTAGAAAGGATTACAAGAAAATGATGGAATCAACAACAACAGAGGAGACGACAACAGTAAAAATTACAGAACCAACTTTAACAACAGACTATAAGATATCAACAACAGATGTAGTAACAGACATTCAAAGTGACTTACCTTCTACTTTATCCTCAACTTCAATTACCATAGAAACCCAAGATATATCAACAACAAGTATGCCAGCCCCTGGAAATGATACATCGAAAGTTTCTAATGCCACAATATCTATAAATACTGACGATCCAATAATCATTCCCACTATAACATACGCAACGCAAACTGAAAACCAAAATATCAGTAATAACATTCTGCCAGCTGTCCCTATAATAAACGGTGAACTCATCGTACAAAAGCTTCCTGTTAATAAAAATTATGCAAAAAAACCTGACTTCAGTAAGAAACCATTGCCGCGACGTAAAGGTACATTAAAAGCAACCTACGGGGATAAACATGAAAAGTTCTTTTCAAAATCTAAAATCCCTGATGATTTGAATCTTATAAAAACTATAAAACCGGTTTATCAAGTTACCGAAACTTCTACAATAAAAGGTTTGACTACGACTACGTCAACACTAAAAGGTATAACTAGTTCTGAAGCAAAAACTCCTGAACACGATATTTCATCCACTATGAAGACGGAATTGAGGACTGTCACAGTATTTAATACAAATTCTACTATTATAACTCCAAGTAGTGTAACTGAAGACAAAATTAAGTCTAATAAAACTCTTATTTTCACTCAACCCGAAATAACTACGGTCCCCCACTCAATAACAGCAATCACAAAAAGCAATATTAAAACAATACACTATAGGACTAAGAAACCTAAGCCTAAGACACAAATTAAGAAGCCCAACATAAATACGAATAACACTAACGAGAAGCCTCTGAAAAATAATAAAACCACGAAACCTGAGATTGTTCTTAACACGACAAAAATAAGATTGGATTCGACCGAAAAATATGTATCAAAATCCTTAAAATCTATCAATAAGGAAATTCATAAAATACCGTTCACACCTGTTTCAGAAACCACTAAATCAAACAATATCCCTACGAAATCAGATATCGCACCTGAAAATAGAGAAGGGTACGAAATTTTAGACAAAAATAATCTTTGGGAGCTTCTTAAAGAAGGTCCGGATGATACTAAAATAGAAGATAAAATTAATGTTCACAATCGATTGAATGAAGTGTCATCTGTCAATAATCGTTCTTTATAA

Protein sequence:

>DPOGS210690-PA
MYEDNELVRNKNLRTDSYAQIFGSAELVAVEGKEIETHYVLAREKIRRWNSTTKCYLLVENLPTPLQAGGIASASVWSSCGCRQRLLAAVTNGGRALHWAAVPAPKSADENDLCRFNYTFPVTADMAPISSLLVYYVTELGEPVSDVASFHVKLLHKEVAVAIEDRRWWYPRTALQLRVLAPPDSLMCLIGARALTDSRFDTHQGEPEHEEQPGPEFVSAGVSLFVGGGTCGGGVLYRQKTVTPRAPAHLVPPASHDRLWMWKCFNYTTQLSTDGVTIAAPSEAGRWSLWALSLSNRGLRFSAPKTINVFRPIQLDFSLPPALKVGETVEVDVKITNNINNCMDVTALLALSAGAAFASTGALYVTERLRLGPRGGTQLVVRVAVNTPGRKNITVEVTGYSADNCTVSYTSFNNETLVGSVIRSASVLVLPEGLHRSDTQSAYFCANEHLAVSSRGSWEWQWVAAPRNRAGLVLELKAQGAAHVALSAVREPSDDMYRVVIERSRVWIAKGKHGYDVHLASAEQTESDADCSGEDSWCAWWVWWEGGRLSVGRGASPSERRLLVWPLTADMRIKYVGFSALWGDQADFRIWNFNEEAGFSQVLELGLPHGVVPGSASGTLLISGGLHLPLYSFQTDASDIWSDVWKDSQLSAASASLAPLLALEHIPHLVDEMEKERILNKLPEQVQILLSFRKSDNSFSDHPAVSSHLSTIKILEILNKIQSYYPVDPELLQSIKSWIQSRQNPDGSFTPLAADKEVDYYPVEIKNVNGTDAEFDVNEYYYYDKDGNMTQEVIEYERTVEVTAETLVSLLEVGVENQVDADVAKLAQTYLENNVRNLTSPATLAATVLALVLARSPIVPEALLILRNASTTEEGEFGWPAPRKDAADWLLEETSRNIKTTSYEAVTMEQYVAGVRVLLAACARGALAEGEAAARFLYYRASTLQRHPSLAYQATKAAAQYAALAHDRHRALTVSLATAGMELTDTLELRALTPPRPLQLPGLPTKVFVYATGAGCATVQGTISYSTYNPKAENALLNIQAAIIEEIRPERSSIEDLQGNLPTLIIKSCFKWKGKERSGILRLESSLFSGYELHSVNPVVLDGATFADLHYGSRGESVWFVFTNISSTCPVCVTYEARSKFVITSLRPAFAKIYPSSRPDLAVETFFHARPGSPLLRGITDDDFITWFDKTQRASLKTNTNIDNICECGRICSRDYEFRKDYKKMMESTTTEETTTVKITEPTLTTDYKISTTDVVTDIQSDLPSTLSSTSITIETQDISTTSMPAPGNDTSKVSNATISINTDDPIIIPTITYATQTENQNISNNILPAVPIINGELIVQKLPVNKNYAKKPDFSKKPLPRRKGTLKATYGDKHEKFFSKSKIPDDLNLIKTIKPVYQVTETSTIKGLTTTTSTLKGITSSEAKTPEHDISSTMKTELRTVTVFNTNSTIITPSSVTEDKIKSNKTLIFTQPEITTVPHSITAITKSNIKTIHYRTKKPKPKTQIKKPNINTNNTNEKPLKNNKTTKPEIVLNTTKIRLDSTEKYVSKSLKSINKEIHKIPFTPVSETTKSNNIPTKSDIAPENREGYEILDKNNLWELLKEGPDDTKIEDKINVHNRLNEVSSVNNRSL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: