MonarchBase - Protein-coding gene

DPOGS215836
Transcript	DPOGS215836-TA	4200 bp
Protein	DPOGS215836-PA	1399 aa
Genomic position	DPSCF300073 + 435750-446705
RNAseq coverage	795x (Rank: top 16%)

Annotation
*Heliconius*	HMEL011647	0.0	68.72%
*Bombyx*	BGIBMGA013565-TA	0.0	58.65%
*Drosophila*	TepIII-PA	3e-138	27.42%
EBI UniRef50	UniRef50_D6WNG7	6e-166	28.86%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D6WNG7_TRICA
NCBI RefSeq	XP_972838.1	1e-166	28.86%	PREDICTED: similar to tep3 [Tribolium castaneum]
NCBI nr blastp	gi\|91083795	2e-165	28.86%	PREDICTED: similar to tep3 [Tribolium castaneum]
NCBI nr blastx	gi\|332031265	3e-160	29.25%	CD109 antigen [Acromyrmex echinatior]

Group
Gene Ontology	GO:0005615	3.8e-24	extracellular space
	GO:0005576	9e-16	extracellular region
	GO:0004866	1.7e-14	endopeptidase inhibitor activity
KEGG pathway
InterPro domain	[857-1148] IPR008930	9.4e-32	Terpenoid cylases/protein prenyltransferase alpha-alpha toroid
	[912-1124] IPR011626	3.8e-24	A-macroglobulin complement component
	[1208-1348] IPR009048	9e-16	Alpha-macroglobulin, receptor-binding
	[84-166] IPR002890	1.7e-14	Alpha-2-macroglobulin, N-terminal
	[647-736] IPR001599	2.3e-09	Alpha-2-macroglobulin
	[394-523] IPR011625	8.7e-09	Alpha-2-macroglobulin, N-terminal 2
Orthology group	MCL10119		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS215836-TA
ATGAGGTACAACGCAGCTGTTTTTACCGTCCTGGCAGTTTTAGTTGCTAAAAACAATATACAATGCGTATCAGTATTAGGACCGAAGGTCTTAAGGCCGTATGGGAATTACAAAGTATCTATCGCTGGAGGTGACAAAGCGCATAATCTATATGTGGCTATAGAGGGCAGGAAGACAACTGGGGAACAGTTCTCACAGGGGCGAGTAGTGCAAGTGGCACCTGCTTCTTCTAGACTTATAGAACTCGATACCGATAAAGGTGTATACCAACCAGGTGACACCATTAACTTCAGAGTAATCGCTTTGGACAAGTATCTGTTGCCTCTCTCTGGGACGGTGGATGTGAGTGTGTTGGATACCAAGGGCTCACCAGTGAGGCAATGGGCTTCCGTCAACCTCGATAAAGGATTGTTTTCTAACGAGCTTCTGTTAGCTGATGAACCCGCTTTAGGACAGTGGACTATACAAGCAGAGGTCAAGGGGCAGAAATATTCGAAACATCTGATGGTGGCAGATTATGTGCTACCTAAGTTCCAGATGCATATGAAAGTACCAAAAGAGGTTCTGTTTAGCGAAGGAAGATTTAATATTAATGTTACAGCCAGACATTTTAATGGCCTACCTGTAAAAGGTGAATTAACAATATCCGCATACGCTGTGTTCTTCTCGGGACTACTTCAACCGGTATTTTCATCTCCCGCCCGTAAAGTCATTGAGTTTAACGGCCAAGCGGAAGTTTTGTATGACCTTAAAACAGACTTAGATCTGGCTGAAGATGCAGCCAGACCGTTAGTAGTTGAAGCTGTGATAGAAGAAAAAAATACACTGATACGACAGAATATTACCACTAGAATACTTCTTTTGCGAAGACCCTATAGACTTCAAGTTACTGCTCCTGAGAGGTTTAAACCTAGATTACCTTATATTGTCCAGATACAATTAGTTAATTCTACTGGTGATACGTTACCTGTATCTGATGATGTAGTCGTTGAAAGACTTTGGGATGATGGTGCACCTGTTAACAAAACAACTATTAAACTTAACAAAGGTTTTGGAATTTACACCTACACTCCAGATGTTGCGCACACAAATTCTACTCTTAATTTAGTGATCAAATACAAGGAAGTATCAGAAAGAATAGTTAACGTCCAGAAGAGCTTGGAGACTGGTGATCAATACATGACTCTGGAACTGTTAACACGAAATATGTCTATCGGTGATGAGATGCGTGGGAGAGCCACCTCCACGGAACCTATGGATCTGGTGCATTATGCGGTCATCGGAAGAGGGGACATTCTTGTTGCTAAGACATTAGAATTAAGCCCCCCTCGTACCAGCGTGGATATCTCAGTACCGGTAACAAGTGGTATGTCTCCGGGCTGCTCGCTAATAGCTTGGAGCCCCCGATTAACAGGATCTATACTGGCTGCAGCTTTACTGGTTCCACAAAAAGACTTAATGCAACATAAGGTGTCAGTAACATCAGTATCGCCAGGAACATCACTACGTCCTAATGGCCTGGTGGAGTTTCGAGTGCTCGGTGAGGCGGGAGCTCAGGCTGGTCTACTTGGAGGAGATCAACACGCCATTACTAACGGACTCGCTGGAACCAATGGCCTGGGTAGCGGACTGGATTTACACACGATCGAACGAGAAGTTGAAAGCTTCATTGGCATAAAAAGATCATATTTCAAAAATGATGACGGAATTCCAATTTTGGGAATAGACTTAGGTGGACGTAACTCTACCGATGTGTTTAGTAATGCTGGAATGGTTCTTCTGACAGATGGTGTTGTAGTATCAAACAGTATGAAGGACGAAACAGAGAAACATGAGACAGGCACCCGCCCACCAACAGCAGGTCCTTACGCGTTCAGTAGAGTGCCAACGCCGCCATCGCCAAGACAATACTTGACTGAGACACTTTCACCACTTTCCACTTGGATGTTTACTAATATAACTATTGGTTCCGACGGCGTTGGTACACGACAGCGTTGGTCCCCAATAACTCCTGGTGAATGGTCGGTCGGAGCATTTGCGATTCATCCAACACTGGGTCTTGGTCTTGCGGCACCTCGCAAATTTAACACTGCCCTTCCTCTATCCCTCACAGCCGAACTTCCCGCAAGTCTTCAAAGAGGAGAAACAATAGCTGTGATTGTGACCTTAAAAAGTTCTCTTACAGTTGATACACCAGTAGAAGTCACATTCCACAACTCCGATCAGTACTACGAATTCGAACCTCTAGAAAATAATATTGACTCGACAAAAAAGATTGAATTGTTCCGTCGAGTAAGCGTAACCGTGCCAGCTCGCGGGTCCGTCAGTACGGCGTTCCTCGTGAGCGCTCGTCGCGTCGGTGACTCACCCATCATTGTGGAAGCCAACGGCAATGGAGTCTCCGCTTCACTCTTCCGCACCATTGACGTTCAGGACGGATACATTGAAGATGTCTGGTCTTGGGCAATATTAGACGGTCGTCGAGGCGTTGCTCGCGCTAATATCACTCTTGAACCAGCAGCCGGGACTAAGCTCGGAGCAGTTTCTTTGGAAGCTACTGGGGACTTATTGGCAAATGCATTTAGGGCCATTAAAGCGCCGCCTATATCAGCCGCTGACCCTAATTATGCGCTAAGACCATTGGCGAGAGCTTGCGTATTGTTGGACTATTTGCAAGCCACAGATCAAGACGATGAAATCACTATAGTAAAAGAGGCTCGATCACAAGCAGCTACCGGCTACCAACGACTTATGGCATTCAGACGACCAGACGGGTCGTTCGTTCAGGAAATTGGTGAAGAATCTGAACCAGATGTCTGGATGACAGCATTATCAGCTCGATGGCTAAGCCGTTCCTCGCGCTATGTTGAAGTGTCTCCTGAAGCTGCAACATCCGCGGCACGCTGGCTGGTGGCAGCTCAAAGAAGTGACGGTAGCTGGCAACCTTCGGCATCACCTGACGACCCGCTGGGTCGGGAAGCCTTGCCACTCACGGCCCAAGCTTTACTAGCACTATTAGAGACTAAGGCCAGCGACCCGTTGTACAAAAACGCTATGAATAAAGCTTTGGATTACCTAGCCGATAAAGTCTCTGAGTCACTCGAGGCACCGACACTGGCGTTAGTGGGAGCCGCTCTGGCCGCCGCAAGACATCCTCGTGCTGCGCTAGCTCTGAAAGCCCTGGAAACACATGCACACAGTGACAGAGGTACCAATCTCTACTGGCCTCGAAAATTATCAAAATCGGAGTTACGGAACCCCTGGCTGAAGGGTAATTCTCTTGAGGCTTCGACTGCAGCTTGGGGTCTACGCGCTATGTTGGCTTCCAGTCTGATAGATGAATCTGTACCTGTTGCGCGATACCTTATACAAGCACTAGGACCTAGAGACCACGACCCGGATGTGTTAGACGCTTTGGCCTTGTTTGCGCACATGATTAGAACGACGACCAAACTGAGGGTATCTGTAAATGTCACCGGTTTCGAGGAACCGCGCCAGTTCAACATCGACAGCGACAATTCACTGATCTTACAAACACAACTGGTACGCAATGCTCGTAATGCGAGTGCAGTGACCGAGGGTCGGGGTATGGCCGTGGTGGGTCTAGCGGCTCGTGGCAGTACTAACGTGACGGGTGCCTGGCCTCGTTACACGCTCGACCCACGCGTGGATCAGGTCTCTACCAGAGACCGACTTCAGCTGTCTGTATGCATCGGATTTGTTCCTGCTGGCAATGAAACAGAAAGCGGACTGGCTCTTCTAATTGTGCAATTACCGTCGGGATATTTGGCTGACATAAATACTATAACAGAGCTAACGTCGGCGCGTCATGTTGTGGGTGCTCGAGTGGTGCACGGTGGATCCCGCGTGGTATCATGGGTGCGACCCTCAGTACACGAGCGCTGCGCCACCCTCGGAGCTCCACGCGCTCTACCCGTCGCAAGACAGAGGCCTGGATATGTCACCATAGTGGATCTTTATGACTCTAGTCACCGAGCGCGTGTCTTTTACCAAGCTGTCCCAAGTACCGCGTGCGACATTTGTCGCTCGTGGCCCTCATGTGAGCGCGCTTGTGGTTCCGCAGCGGAACAGCGTGCTTCCCCCACCACCCCCGCCGCCACACGTAACCCCAACAGTGCATCTGTCCCGCTCGCACAAACTGTGCTCTGTCTCGCTTTGGCATTGTTAGTCAGTATATAA

Protein sequence:

>DPOGS215836-PA
MRYNAAVFTVLAVLVAKNNIQCVSVLGPKVLRPYGNYKVSIAGGDKAHNLYVAIEGRKTTGEQFSQGRVVQVAPASSRLIELDTDKGVYQPGDTINFRVIALDKYLLPLSGTVDVSVLDTKGSPVRQWASVNLDKGLFSNELLLADEPALGQWTIQAEVKGQKYSKHLMVADYVLPKFQMHMKVPKEVLFSEGRFNINVTARHFNGLPVKGELTISAYAVFFSGLLQPVFSSPARKVIEFNGQAEVLYDLKTDLDLAEDAARPLVVEAVIEEKNTLIRQNITTRILLLRRPYRLQVTAPERFKPRLPYIVQIQLVNSTGDTLPVSDDVVVERLWDDGAPVNKTTIKLNKGFGIYTYTPDVAHTNSTLNLVIKYKEVSERIVNVQKSLETGDQYMTLELLTRNMSIGDEMRGRATSTEPMDLVHYAVIGRGDILVAKTLELSPPRTSVDISVPVTSGMSPGCSLIAWSPRLTGSILAAALLVPQKDLMQHKVSVTSVSPGTSLRPNGLVEFRVLGEAGAQAGLLGGDQHAITNGLAGTNGLGSGLDLHTIEREVESFIGIKRSYFKNDDGIPILGIDLGGRNSTDVFSNAGMVLLTDGVVVSNSMKDETEKHETGTRPPTAGPYAFSRVPTPPSPRQYLTETLSPLSTWMFTNITIGSDGVGTRQRWSPITPGEWSVGAFAIHPTLGLGLAAPRKFNTALPLSLTAELPASLQRGETIAVIVTLKSSLTVDTPVEVTFHNSDQYYEFEPLENNIDSTKKIELFRRVSVTVPARGSVSTAFLVSARRVGDSPIIVEANGNGVSASLFRTIDVQDGYIEDVWSWAILDGRRGVARANITLEPAAGTKLGAVSLEATGDLLANAFRAIKAPPISAADPNYALRPLARACVLLDYLQATDQDDEITIVKEARSQAATGYQRLMAFRRPDGSFVQEIGEESEPDVWMTALSARWLSRSSRYVEVSPEAATSAARWLVAAQRSDGSWQPSASPDDPLGREALPLTAQALLALLETKASDPLYKNAMNKALDYLADKVSESLEAPTLALVGAALAAARHPRAALALKALETHAHSDRGTNLYWPRKLSKSELRNPWLKGNSLEASTAAWGLRAMLASSLIDESVPVARYLIQALGPRDHDPDVLDALALFAHMIRTTTKLRVSVNVTGFEEPRQFNIDSDNSLILQTQLVRNARNASAVTEGRGMAVVGLAARGSTNVTGAWPRYTLDPRVDQVSTRDRLQLSVCIGFVPAGNETESGLALLIVQLPSGYLADINTITELTSARHVVGARVVHGGSRVVSWVRPSVHERCATLGAPRALPVARQRPGYVTIVDLYDSSHRARVFYQAVPSTACDICRSWPSCERACGSAAEQRASPTTPAATRNPNSASVPLAQTVLCLALALLVSI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: