MonarchBase - Protein-coding gene

DPOGS211742
Transcript	DPOGS211742-TA	2742 bp
Protein	DPOGS211742-PA	913 aa
Genomic position	DPSCF300364 - 86570-95759
RNAseq coverage	339x (Rank: top 34%)

Annotation
*Heliconius*	HMEL016817	0.0	55.98%
*Bombyx*	BGIBMGA004382-TA	2e-153	59.65%
*Drosophila*	CG12702-PA	8e-20	22.27%
EBI UniRef50	UniRef50_E2BP19	2e-55	28.28%	Protein KIAA1524 n=9 Tax=Formicidae RepID=E2BP19_HARSA
NCBI RefSeq	XP_393467.2	3e-49	28.43%	PREDICTED: similar to CG12702-PA [Apis mellifera]
NCBI nr blastp	gi\|307189231	1e-58	28.73%	Protein KIAA1524-like protein [Camponotus floridanus]
NCBI nr blastx	gi\|332017089	1e-63	24.54%	Protein CIP2A [Acromyrmex echinatior]

Group
KEGG pathway
Orthology group	MCL14552		Insect specific

Nucleotide sequence:

>DPOGS211742-TA
ATGATGGAGGTTGACGGTGTGGAGAGTTGGAACAATCCTATGGAAGGAGCGAAATTCGCAAATTTAAAAGCTTTTGTAAATGCTGCTCGCGAATTTGAAGCTACTCACAGTGAATCTGCAATAAATATGATGACTCGCTATTTAGGATTGATAGCTTCATCATGTGATCTTACAATTTTTTCTCCCGGTCGGAGTGAGGTGTGCGCGTTTTTTAGTTCCCTTTGGAGGGTAATGTGTGATGCGAGAGGTCCTCACTGGGCAGGAGTAGCAGTACTCGCCCGGGCCGCTATAGAATCCAGTACTAGACATGCCTTAACACATACTTACAAGTTTATGCCTATTTTGTCAAGACTTCTCTCAGACAATATTTCAAATGATAAAAAAATTAAACTTCTATCTGTGATGCAGGACATCTCATATGGTATAAAAATAAGCTGGCAAGAGTCCTATCTCACTGGACTCATGAAGCAGCTCACCGATTGGATAACGCAGCCCATGACTGAACCACAGCAGCGTGCTATTGGTCACAAATCATTGACTGTACTTGTTAATGTGTGCTATGGAAACCTCCCGGCCATTTATGCTTTAATGAGGACCGTTGATACCAAGGAGTTTGTTTTACATTTGATAAGTTTAAAGGATGGTGCATACGGTGGTGTTGAAGTGTGCCGTCTACTACTCTGCCTCTCAAGCGCCACCCGCGGCGCTGCTTCTACGAGACAACCAGACGTCCACAGCTACCTATGTTGCACTATGCGGACGTTCTCTAAGGCTATAGTTGAAAAGGATTCAACTCAGTTACTTCATGCATACACATTCATTAATGACCTTTGCTCAGACAGCGGTTTAAGAAATTATGTTCTGACATACACAAAATTTAATAACTCGCTTCTGGATTCATTGAATAACATTGAAGGACTGTGTAAAACGTCTCCGGATGATATGGGCGAATCCGAGAACTGTACGAACTGTTTGTGCAATGTGCTGAAATTTCTCACGGTTTTAGTAAATTTAGATATATATTCGCTGAGAAGCTTCCACAGTCAGCTGGTGTGTCTGTGTATGAAATCGTCTCGCATTTGTCTGCCGGAGTCTTTAGAGCTTTTCGCTGCAATTGTTTCCGTATATAAAGACGAGGGTGCCCTTCCAAGGGAATTGATAACAGTGATAAATGATGGATTACCAGCTCTATTGGTGCCACCGGCCTTGGAGCCGGGGAAAGCTGGCTTACAATGGTTACAAGTAGTTGGAGTGTTATGCGAAATGAGTGAAACCCAAGAGCGGGTCTTGCAGGAAGTAACCCCTGACGCGTTCGAGGACACCCTGTATAGCGTGTTACAATATACATCACAGAACGGTCCGGTGGGTAACGAGACGGCCCAGCAGTGCGTGGTGGTGGCTTGTCGCGGCGGGTTGTGTCTGGCGCCGCTGCACACGCACTGGGAGGCCGCGTTCAACAGGATGCTCGCACACCACCAGGTCCGTAAGTTGTTAAGCGCTGGTCTGACAAGCGGTAGCGGTCCGCGTCGCAGACAGATCTTACAACTAATCAAACATCACTATTTTCCATCTGAACATATGAATCAGATATTCGGTGATAATCTTCAAAATGTATCAGACATCAGTGTGGAAAGTGTGTCGCCTCGTGAGGAACTCGATAGTGTATGGTCAGACAGACTCACACCAGCCCAGGAGAGAGCTATTGATGAGCTCATCAACATTATGAGGGAATCTCTAGTCAGCGGGAAGGTCCGTAAGTTGTTAAGCGCTGGTCTGACAAGCGGTAGCGGTCCGCGTCGCAGACAGATCTTACAACTGATCAAACATCACTATTTTCCATCTGAACATATGAATCAGATATTCGGTGATAATCTTCAAAATGTATCAGACATCAGTGTGGAAAGTGTGTCGCCTCGTGAGGAACTTGATAGTGTATGGTCGGACAGACTCACACCAGCTCAGGAGAGAGCTATCGATGAGCTCATCAACATTATGAGGGAGTCTCTAGTCAGCGGGAAGATTAATGACATAGCTACATCAAGTGTAATGGAACTCTACGGATACAAGATGACTTGCTTAGAACAGAGGTTGCATTCACATTCCTTAGCGTTACAGGGAGCCACAGAGCATATGGCGTCATTGCAACATGCGCTTGCATTGTTACAAGCAACGAATACATCACAGCAGGATGTATTATACACTACACAGATGCAAAACGAAAAACATAAAAAAGTAATAGAGGATCTTCACAAGCAATTAGAAGACGCTGAAACAACAGTACGTGGATACCGAGCGAAGTTGGCCGCTGAGAGATTGGATAAAGAAAATCAAAAAGAGCACTTACAGAAAGAGTTGCGAGCCCAAATAGTTACCATAGAAAATGAAATGAAAGTACGCGAAAGAGAATTAGAAGAGCGTTTGAAGCAACAGGAAGCGGATAATAGAACATTACAAAAGAAATTGGAACAACAGTCAAACAAGAACAACGAGCTGGCCGGAGTGTTGATAAAGTTCGAGGAAAGAGTTAAACAGCGCGACAAGAAGTTGGAAGAAGCGGCCGCCGCTGACACCGCGCTCAGGAAGGAAATAGAACAGAAAGAGAATACTATAAAACAATTAGAGAAAACGGTAGTGGAGCGAGAAAACAGATTGTTCCAAGTGACGTCACAGCTGGAAGAAATGAAACGAGTCCAGGAGATGGTTGCTAAGCTTATGAGCAAAAGCGCGTCTACTGCCAGCTAG

Protein sequence:

>DPOGS211742-PA
MMEVDGVESWNNPMEGAKFANLKAFVNAAREFEATHSESAINMMTRYLGLIASSCDLTIFSPGRSEVCAFFSSLWRVMCDARGPHWAGVAVLARAAIESSTRHALTHTYKFMPILSRLLSDNISNDKKIKLLSVMQDISYGIKISWQESYLTGLMKQLTDWITQPMTEPQQRAIGHKSLTVLVNVCYGNLPAIYALMRTVDTKEFVLHLISLKDGAYGGVEVCRLLLCLSSATRGAASTRQPDVHSYLCCTMRTFSKAIVEKDSTQLLHAYTFINDLCSDSGLRNYVLTYTKFNNSLLDSLNNIEGLCKTSPDDMGESENCTNCLCNVLKFLTVLVNLDIYSLRSFHSQLVCLCMKSSRICLPESLELFAAIVSVYKDEGALPRELITVINDGLPALLVPPALEPGKAGLQWLQVVGVLCEMSETQERVLQEVTPDAFEDTLYSVLQYTSQNGPVGNETAQQCVVVACRGGLCLAPLHTHWEAAFNRMLAHHQVRKLLSAGLTSGSGPRRRQILQLIKHHYFPSEHMNQIFGDNLQNVSDISVESVSPREELDSVWSDRLTPAQERAIDELINIMRESLVSGKVRKLLSAGLTSGSGPRRRQILQLIKHHYFPSEHMNQIFGDNLQNVSDISVESVSPREELDSVWSDRLTPAQERAIDELINIMRESLVSGKINDIATSSVMELYGYKMTCLEQRLHSHSLALQGATEHMASLQHALALLQATNTSQQDVLYTTQMQNEKHKKVIEDLHKQLEDAETTVRGYRAKLAAERLDKENQKEHLQKELRAQIVTIENEMKVRERELEERLKQQEADNRTLQKKLEQQSNKNNELAGVLIKFEERVKQRDKKLEEAAAADTALRKEIEQKENTIKQLEKTVVERENRLFQVTSQLEEMKRVQEMVAKLMSKSASTAS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: