MonarchBase - Protein-coding gene

DPOGS212811
Transcript	DPOGS212811-TA	3006 bp
Protein	DPOGS212811-PA	1001 aa
Genomic position	DPSCF300086 - 544057-552707
RNAseq coverage	461x (Rank: top 27%)

Annotation
*Heliconius*	HMEL008175	72.59%
*Bombyx*	BGIBMGA000753-TA	64.37%
*Drosophila*	Clbn-PB	50.19%
EBI UniRef50	UniRef50_E2BDI6	56.48%	Serologically defined colon cancer antigen 1-like protein n=3 Tax=Arthropoda RepID=E2BDI6_HARSA
NCBI RefSeq	XP_001658543.1	54.90%	hypothetical protein AaeL_AAEL007639 [Aedes aegypti]
NCBI nr blastp	gi\|383852746	55.69%	PREDICTED: nuclear export mediator factor NEMF homolog [Megachile rotundata]
NCBI nr blastx	gi\|383852746	56.93%	PREDICTED: nuclear export mediator factor NEMF homolog [Megachile rotundata]

Group
KEGG pathway
InterPro domain	[9-496] IPR008616	2.8e-38	Fibronectin-binding A, N-terminal
	[896-994] IPR021846	4.9e-28	Protein of unknown function DUF3441
	[513-602] IPR008532	2.2e-24	Domain of unknown function DUF814
Orthology group	MCL15337		Single-copy universal gene

Nucleotide sequence:

>DPOGS212811-TA
ATGAAGACAAGATTTAATACTTACGATATTGTGTGTATGGTGTCGGAACTGCAAAGACTGGTGGGTATGCGAGTTAACCAGGTGTATGATATTGATAACAAGACATATGTGATCCGACTGCAGAGGTCTGAAGAGAAGGCTGTGCTGCTGCTGGAGTCAGGGAACAGGTTCCACACAACACAGTTTGAATGGCCCAAGAATGTAGCTCCATCTGGGTTTACTATGAAGCTTAGGAAACATCTTAAGAACAAGCGTCTCGAGAAGCTGAGCCAGCTGGGCATTGACAGGATAGTTGAGCTACAGTTCGGTAGCGGTGAGGCCGCGTATCATGTTATACTGGAATTATATGACCGCGGTAACATAGTTCTCACAGACTGCGAGTGGACGATACTGAATGTACTACGTCCGCACGTCGAAGGTGATAAAGTAAGGTTTGCAGTCAAAGAAAAGTATCCTCTTGACAGAGCCAAAACAGACTATGCAGCACCAAATGAAGGTGCTCTCAAGGAGATATTAGGAAAGAGCAAACCTGGTGATAACCTCAAGAAAATACTTAATCCTAATTTAGAATATGGTGCATCAATAATAGACCATGTCCTGCTGCAAAATGGTCTGTCTGGTAATTTAAAGATATCACAGGATCCTAACAAAGGATTTTATGTGGAAAGGGATTTGGGAACGCTAGCAAATGCTCTAAGACAAGCTGAGACAATGATTGAGAATGGAAAGAATCAAATGGCTAAGGGTTATATAATCCAAAAGAGAGAAGATCGACCAAATCAAGATGGCGGCCCGGACTTCTTCCTCACCAACCAAGAGTTCCATCCCCTGCTGTATCTCCAGAACAAAGACCAGGTGTATGTGGAGTATGAAACCTTTGACAGAGCCGTCGATGAGTTCTATTCAGCTCTGGAAGGACAGAAAATTGATCTTAAGACGATTCAAGTTGAACGTGAAGCTATGAAGAAGCTCCAGAACATCCGCACCGATCACGAGAAGAGGCTCAGCAACTTGGAGAAGGTTCAGCTTGAGGACAGGAGGGCGGCGGAGATGATAGCTAGGAATGAACCGCTCGTCGAACAAGCGCGGCTCGCCATACAGACGGCCATAGCTAACCAGATGAGTTGGGATGACATCAAGCTGTTAGTGAAAGCGGCTCAAGACAACAAGGATCCCGTGGCGTCAGCCATAAAACAGCTGAAGCTGAACACCAACCACATTACGTTGTTGCTCAAGGACCCGTATGATGATGATGATGATGATGATGATGATGATGATGACAATGACGGCGGCGGGGACAAGGAGAGGCTGGAACCAATGATGGTTGATATCGATCTGTCTCTGACTGCCTTCGCTAACGCTAGACGTTACTACGATCAGAAACGCAGTGCTGCCAAGAAGCAGCAAAAGACGCTGGAGTCAGCGGACAAAGCTTTGAAGAGCGCTGAGAAGAAAACTAAACAAACGCTGAAGGAGGCTCAGGCCATCAGCAGCATCAGCAAAGCGAGGAGGAACTACTGGTTCGAGAAATTCTACTGGTTCATATCATCCGATAACTACTTGGTGATAGCCGGTCGTGACCAGCAGCAGAACGAATTGCTAGTGAAGCGTTATATGCGGTCTACAGACGTGTACGTCCACGCGGACGTGTCCGGGGCTTCGTCGGTGGTGATTAAATGTCCCTCGGGGCCTCCGCCCCCACGGACGCTCAGTGAAGCGGGACAAGCGGCCGTCGCATACAGTGTCGCATGGGAAGCGAAAGTCCTGACTCGTGCGTGGTGGGTCCACGGACACCAGGTGTCCAAGTCAGCTCCGACAGGTGAATATCTGTCAACGGGCTCCTTCATGATCCGCGGCAAGAAGAACTACCTGCTGCCTGAACACCTGCAGTTCGGATTCAGCTTTATGTTCCGGCTTGAAGATAGTTCCATCGACCGTCACCGCGACGACCGGAAGGCTGTTCAAGCTGATGATGCCAGTGACGTCACATCCGTCATCAGCGCGGACGAACAGGAGATTGTTGTGTCGGATGACGACGAACCTTCAGATAACGAGGATAAGGAGAAAAAATTAAATACAATAGCCGAAGAAGTAACGAAAATAGATCTAGAAGATAATACAGAAGAAAAACCTAAGGAGACAAATGACAAAGATTTGGACCACAAAGATTCAGATGGTAACGAGAACGAGTTAAAAATTAAAGACGATTTGAAAAATGAAGACAGCGAGTCTGATGACGAAACAGGAGTGTTACACACACACGTGAAGGTGGACCACGCTACGGGCGAGGTGTTCGTGGCCTCCAAAACACGGACGATATCCGAAATGTCTGATAAAAGCGAAGAACCCATGACCTTCCCCAGTCTGCCCAAGAAGGGAGGCAAAAAACCCCAGAAGGAAGTTAAGAAGAGAGAAGAAGTTAAAGAGAAGCAAGGACCAAAACGTGGGCAGAAAGGGAAGCTGAAGAAGATAAAAGAGAAATACAAGGACCAGGACGAGGAAGATCGCGCGCTCATGATGGAGATACTCAAGCCGGATAAAAGCGCCAAGGAGACGAAGAAAGCCCAGAAGCAGGTCAGCAAGAGTAAACAGAAGCAGGCCATCAAGAAGATACCACAACCGGCTCCCGTACTGCTGGAGGCGGAGTCAGACGACGAACCGACCCCGGACAATGAGCCCGAGGCGGAGCCCGCAGCGGACGCAGACGCGGAACTCCTGTGTCAGCTGACGGGAGCTCCGCTCGATGAGGACGAACTGCTGTTCGCGGTGCCTGTGGTGGCGCCCTACTCCTCGTTACTCCAATACAAGTTCAAAGTGAAGCTAACCCCTGGCAGCAACAAGAGAGGTAAAGCCGCCAAGACAGCCGTCCAGGTGTTCCTCCGAGACAAAAACACCAGCTCCAGGGAGAAGGACCTGCTGAAGGCTGTCAAGGAGGAAAACATCGCCAGGAACTTCCCCGGGAAAGTGAAGCTGTCCGCACCACAGCTACATAAACATAAGAAATGA

Protein sequence:

>DPOGS212811-PA
MKTRFNTYDIVCMVSELQRLVGMRVNQVYDIDNKTYVIRLQRSEEKAVLLLESGNRFHTTQFEWPKNVAPSGFTMKLRKHLKNKRLEKLSQLGIDRIVELQFGSGEAAYHVILELYDRGNIVLTDCEWTILNVLRPHVEGDKVRFAVKEKYPLDRAKTDYAAPNEGALKEILGKSKPGDNLKKILNPNLEYGASIIDHVLLQNGLSGNLKISQDPNKGFYVERDLGTLANALRQAETMIENGKNQMAKGYIIQKREDRPNQDGGPDFFLTNQEFHPLLYLQNKDQVYVEYETFDRAVDEFYSALEGQKIDLKTIQVEREAMKKLQNIRTDHEKRLSNLEKVQLEDRRAAEMIARNEPLVEQARLAIQTAIANQMSWDDIKLLVKAAQDNKDPVASAIKQLKLNTNHITLLLKDPYDDDDDDDDDDDDNDGGGDKERLEPMMVDIDLSLTAFANARRYYDQKRSAAKKQQKTLESADKALKSAEKKTKQTLKEAQAISSISKARRNYWFEKFYWFISSDNYLVIAGRDQQQNELLVKRYMRSTDVYVHADVSGASSVVIKCPSGPPPPRTLSEAGQAAVAYSVAWEAKVLTRAWWVHGHQVSKSAPTGEYLSTGSFMIRGKKNYLLPEHLQFGFSFMFRLEDSSIDRHRDDRKAVQADDASDVTSVISADEQEIVVSDDDEPSDNEDKEKKLNTIAEEVTKIDLEDNTEEKPKETNDKDLDHKDSDGNENELKIKDDLKNEDSESDDETGVLHTHVKVDHATGEVFVASKTRTISEMSDKSEEPMTFPSLPKKGGKKPQKEVKKREEVKEKQGPKRGQKGKLKKIKEKYKDQDEEDRALMMEILKPDKSAKETKKAQKQVSKSKQKQAIKKIPQPAPVLLEAESDDEPTPDNEPEAEPAADADAELLCQLTGAPLDEDELLFAVPVVAPYSSLLQYKFKVKLTPGSNKRGKAAKTAVQVFLRDKNTSSREKDLLKAVKEENIARNFPGKVKLSAPQLHKHKK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: