MonarchBase - Protein-coding gene

DPOGS206291
Transcript	DPOGS206291-TA	3345 bp
Protein	DPOGS206291-PA	1114 aa
Genomic position	DPSCF300290 + 320994-330297
RNAseq coverage	383x (Rank: top 31%)

Annotation
*Heliconius*	HMEL013122	0.0	71.73%
*Bombyx*	BGIBMGA010803-TA	0.0	63.45%
*Drosophila*	CG6511-PA	5e-173	43.41%
EBI UniRef50	UniRef50_F4WEA1	0.0	40.22%	Erythroid differentiation-related factor 1 n=5 Tax=Myrmicinae RepID=F4WEA1_ACREC
NCBI RefSeq	XP_001607933.1	0.0	39.69%	PREDICTED: similar to conserved hypothetical protein [Nasonia vitripennis]
NCBI nr blastp	gi\|383851762	0.0	41.07%	PREDICTED: erythroid differentiation-related factor 1-like [Megachile rotundata]
NCBI nr blastx	gi\|322789850	0.0	40.66%	hypothetical protein SINV_10770 [Solenopsis invicta]

Group
KEGG pathway
Orthology group	MCL13014		Single-copy universal gene

Nucleotide sequence:

>DPOGS206291-TA
ATGGATGACGTCGAGAATGAAAATGAGTTCAATCGAAACAAGGGGCGAAGTCCATCTCCAGGTGTTAAATCAACAGCGGTTGTAAAATATACAGCATTCCAGACTCCTGCTAGTTATGCCAGGTTACAGTGCAACACAGATATCAACCTCCCTCCATCCAACTGGGGTGGGATAGACACTTACGGCTTGAAGCAGATACTCACAAGAGATTCGGGACTTTCAAGCTTCAGAATGGCTCACATGTTCCCCGACTGTGTCGGAGAGGTGGACGTTATATCTGATGCAGATTGCATAAAGAATCTCCTCAAGCTACCCTACCAACCTAATGGAACTGTTAGTATGATGGTGCATAGAGTTGAAAATACATTGCTATTGGACGACTTTGATGTCTACGAATACCTGATGAAGTCGGAGTGGTCCTGGTTAAAGGATTTCTTCTACGAGAATGTACTGAAGACTATGTCGGAAAAGGATCGTATCTCTCTGACGTCATCGGCTAGTAGGAGTGCCCTCCAGCTGACGCACAAGTTCCTATCCCACAGTGTGGTGGCGCCACCTCTGCCAGCCAGCCAGCCCTGCCAGCCGATATGTTTACCAGGACCATTTCTCCCGGAGCCGGAGACTCGTCCGGAAGAACCAGCTAAAGAACAGAGTTTCAATAGGAACGTGCTCTGGACATTCGAAGACATACACATGTTGATAGGTAGCAACCTACCTATTTTCGGCGACAAGGACAGGCCTTGCGTCAGTTTGCGTTTACGAGACGCGAGGGAACCGATAAACGTACTCACGGGCATCGACTACTGGCTGGACAACCTCATGTGCAACGTCCCTGAGGTTCTGATGTGCTACCACTTGGACGGTATCGTGCAGAAATACGAGCCAATGAAGACAGAAGATTTGCCGCACATGGAGAACTCCAAGTTCTCGCCAAAGGTTATAAGGAATGTCGCACAGAATATTCTATCGTTTTTAAAATCTAACGCGACTAAGGCCGGTCACACATACTGGTTATTCAAAGGCCCCCACGACGATGTTGTCAAGTTGTACGACCTGACGACTCTTTGCCCCGATGACATGGACAATCCCTTCACGACGCCCGTGGCGATGCTATTGTACAGGGTGGCCAGGAACATGAGGATGATGAACAGGTCCAAACATGTCCGGCAGCTGCTGGAACACGTCGTGGAATTGCTCGGAAGCGAGAGATACCCTCAGATTGTAGCGTCCTCGCATTATATGCTGGCTGATCTGTATGTACCCGCCACCACAAACCCGGCACATCCAGATTTCAAAGACGAAAGCTCGGACTCCGAAGAGGAAGCTGAGTTTGGTAACTACGCGGAGTGCCCCTCGGCCGACAGGGGCAGACGGACAGACAAGGACGACGAGATTGTACGAGACGTCACTAATGACGATAAGTGCGAGGGAGATGGAAATATAAACCGGGAAGAGTGCGAGCGAGACGGCGATAGTGCTGGCGAACTCACTCTCCGAGTACGGGGTCTGGCGTTAAGAGACATCGGCGATAGGCAGACACACGATACTACGAAGAAAACTAAGAGATCCACTACAGGACTGGGCATCGAACCCGCTACCAGATGTGGGCGGGCGCTGAAACACGCGCTCACCGGACTCAAGGCTCTACATCATCTGACCATAGATAAATCTATGGAAGAGGAAAGAGAACGTCTGAGACAGCAGAAGATCAAAGAGGAACAACATCCGAAAATGGCCAATCCTTACGAACCCATCAGAATGGGCTACAAGACGTCCAAGCTAAAAGATAAAGAGCACACCTCGAGGAGCAGGCGTCGGCGGACGAGGCGGAACTCGTCTAACCACATAGAGACCAACTCGAACGTAGACAAAAACGCTATTTTAGTGCGGAAAGAGAACACGATAACCCTGCAAGAACCGAACCGGGACGACAACTTCGCCTGGAAACTACATCTGAAGACGCTGCTGTATGAAAAAATATGCCTCGCGTACGCCACGCTAGCCGAATACAGCTACTCACACGAGCAGTACGGCTTCTCCTTGAAGTATATAGATCTGGCCAGCAAATGCCAGAAGCTGTTGAGCAATATGATCATCAAGAGTCGCGTGGTGGACGCCAGCTGTCTCATAGGCAGGGTCGGCGACAACTACTTCCAACTGAGCAAACACTGGCCCAGCTTGGACCAGTACAGCAAACAGTTCGGCATGGACCACGAGATCGATAGGGAGATAAGAAACGAGATAGAGAGCGATATGGCGGAAGAAATGGAGGGCTTCGGGGGAGATGAGTTTGAACTGGAGATATACATGTCGTCGTTGGACACTTCGGATACGTTGCCGGAGGAGTTTCGTCATCTGTCCAAAAAAGCTGCCGAATATTTGGACGAGGCTACTGAAATATTCCAACACGTGAACGACGTCCCCAACCTGGCCTTGTTGTACTGCAATAAGGCCAGATACATGAGGTTCAAAGTTCACTGCGACAAAGGAGTTTTCGATGATGAGAAGCGTCGGACTTATAATTCAGCCGAAGAGCTGTACTCCCAGGCGCTCAGGCTGGTGGGATCTCGGGAGGCAGCTATCAAAGACCTGGTATGCTGGGAATTGTCCTGCCACCTGTACACTAGGGCTGTACTCTTGCAGGACCATCCGGAAATCTATGCTAGCGAAGTTACAGAAGTAGCGGAGGCTTTCAAACACGCTCTGAAGCACTGCCTGTTGAGTCCGGGCCCGAGACAGTACTTGTATCAATTCAGAGCCGCTATGATATATCACCGGCTGGGATCGCTGTACCATTCACAGTACAGGAAGAGCCAAGACCCCTCCATCCGCCGGCGCATGTTATCCGCGACGTGTTCCCACTATGAGAAGGCGGCTCTCCAATTCGCCTCCCTCGAGGACCCCGCCATGTTCCTCACAGCACGACTCGAGCACATTGCAGCATTAGAGGCACACGCCGCAGTGTCGCCGAATCTGAAGTTGAAGTCGCTTCAAAACGCAATAGACTTACTTCGTCAGTGTCACTCAATAATGAAGCTGTTAAAAGATAGAGATCCGGACGAAAAGAAAGAGAAAGATAAACCAGAAGACGGCGACGAGAAAAGTCTGAAAAACGAACATAGTTTACTGAGCTTATACGAGAATAGGCTTCACTATATTTTGAAAAGTATCATACAATACTGCAGATCGAAGTCCAACAAAGACTATGACAAGATGACAGAGATGTACAAGAAGCTGTACAGCGCGTCCCTGAAGATAAGGAGAGACGAGGACGTGCGGCTGTACGCGGCCAGTGTGTGCGACGTGCTCGCGGCCATGGACAGCATCATAAGCGAGTTCCAGTAG

Protein sequence:

>DPOGS206291-PA
MDDVENENEFNRNKGRSPSPGVKSTAVVKYTAFQTPASYARLQCNTDINLPPSNWGGIDTYGLKQILTRDSGLSSFRMAHMFPDCVGEVDVISDADCIKNLLKLPYQPNGTVSMMVHRVENTLLLDDFDVYEYLMKSEWSWLKDFFYENVLKTMSEKDRISLTSSASRSALQLTHKFLSHSVVAPPLPASQPCQPICLPGPFLPEPETRPEEPAKEQSFNRNVLWTFEDIHMLIGSNLPIFGDKDRPCVSLRLRDAREPINVLTGIDYWLDNLMCNVPEVLMCYHLDGIVQKYEPMKTEDLPHMENSKFSPKVIRNVAQNILSFLKSNATKAGHTYWLFKGPHDDVVKLYDLTTLCPDDMDNPFTTPVAMLLYRVARNMRMMNRSKHVRQLLEHVVELLGSERYPQIVASSHYMLADLYVPATTNPAHPDFKDESSDSEEEAEFGNYAECPSADRGRRTDKDDEIVRDVTNDDKCEGDGNINREECERDGDSAGELTLRVRGLALRDIGDRQTHDTTKKTKRSTTGLGIEPATRCGRALKHALTGLKALHHLTIDKSMEEERERLRQQKIKEEQHPKMANPYEPIRMGYKTSKLKDKEHTSRSRRRRTRRNSSNHIETNSNVDKNAILVRKENTITLQEPNRDDNFAWKLHLKTLLYEKICLAYATLAEYSYSHEQYGFSLKYIDLASKCQKLLSNMIIKSRVVDASCLIGRVGDNYFQLSKHWPSLDQYSKQFGMDHEIDREIRNEIESDMAEEMEGFGGDEFELEIYMSSLDTSDTLPEEFRHLSKKAAEYLDEATEIFQHVNDVPNLALLYCNKARYMRFKVHCDKGVFDDEKRRTYNSAEELYSQALRLVGSREAAIKDLVCWELSCHLYTRAVLLQDHPEIYASEVTEVAEAFKHALKHCLLSPGPRQYLYQFRAAMIYHRLGSLYHSQYRKSQDPSIRRRMLSATCSHYEKAALQFASLEDPAMFLTARLEHIAALEAHAAVSPNLKLKSLQNAIDLLRQCHSIMKLLKDRDPDEKKEKDKPEDGDEKSLKNEHSLLSLYENRLHYILKSIIQYCRSKSNKDYDKMTEMYKKLYSASLKIRRDEDVRLYAASVCDVLAAMDSIISEFQ-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: