MonarchBase - Protein-coding gene

DPOGS211604
Transcript	DPOGS211604-TA	3351 bp
Protein	DPOGS211604-PA	1116 aa
Genomic position	DPSCF300232 - 91111-108149
RNAseq coverage	177x (Rank: top 50%)

Annotation
*Heliconius*	HMEL003404	0.0	78.83%
*Bombyx*	BGIBMGA008219-TA	3e-168	68.79%
*Drosophila*			%
EBI UniRef50	UniRef50_D2A3B9	2e-101	52.20%	Putative uncharacterized protein GLEAN_07953 n=2 Tax=Tribolium castaneum RepID=D2A3B9_TRICA
NCBI RefSeq	XP_001815376.1	3e-102	52.20%	PREDICTED: hypothetical protein [Tribolium castaneum]
NCBI nr blastp	gi\|270005841	6e-101	52.20%	hypothetical protein TcasGA2_TC007953 [Tribolium castaneum]
NCBI nr blastx	gi\|270005841	1e-141	40.66%	hypothetical protein TcasGA2_TC007953 [Tribolium castaneum]

Group
KEGG pathway
Orthology group	MCL15557		Insect specific

Nucleotide sequence:

>DPOGS211604-TA
ATGGCCAGGACTGTAAGGAAACTAAAACGAAGTAAAGGGAAAGAGGCAAAACAGCTCCCGGCCATAATAATAACCCCGCCCGAGTTAGACATGAAATTCAAATCTACCAACTACAAGGAAAACTCATCCACAACCGACATGGAGTTCAGTGTTCACGATCTGATAGCTCAGCTCTCCGAGAACTCGAAGGCATCGAAGGAGGAAATAGAGAGCATACAGAGGAAGCTGCTCCATCAGGCCAGCGAGATCCTGAAAGTGGACAGGTTCGCCAACCAACCGTCTCCAGACCCACGTGTCGTGAGCGCCACCCAAAAATACAACGGGCCGATCTACGGCAGACCCATATCGATCCGGAGACAATCGGTGATCAATCAAGACGCTCAATTAGTGCCCGAGAAATTACAAGAGAATGTCAGCGCGGTAAACAAGCATCAGGTCAACGTGGTCGGCGCGGGAAGAGGAGATGTCTTTAACGGAACGGGTTCTGAGGCTAGAGTCGCCAGTGCGCGCGACGCGGCCGTCCGAGGTACCTCAGAGCCGGTGCCTCCGTACAGAATGCCGCCAGCGCCCGAGGCGGCTCTACCCGGTGCCCCCGCGCCCCCCGTCCAAGGCATACACACGCACGCCAAGTTTCCCATAGAGCGAGATGTAATTCTGTCGTCTGGAGATAAGAATTCAAAAGTGCCGATATTACAAGAGGCTAGAAAGAGAGGGAGGCTGGGAGCAGTGGCTCCCGATACACCCCCCAAAGCTCTGTCAGCGTGGACTCATACTGAGAATCAACAAGCCGGCCCATCTGGTGACTTTAGACAATACGAACAAAACTACGGGTATGCTATGCACCAAAACGTTAATCCGAATCAGGGTGCTGTGGCTAGAAACTTACAGAACTATGACTCACCAAAACCTCCTGTACCAGCCAAGAACGCTTACAAACCGGAACAAAACAATTCTCATATAACAGTCACAGTCGAAACCGGAAAAGATAACACAAAAGATGCTCCTAAGAGCAACAAGTCGGTTAGCAAAACTTATCACACTTTAAAAGACATGATATCGAGTAGATTTAAAAATAAAGACGGGAACGATGCAGAGAAAAACAACGAGGAAGCCAGACTAAATAATAACGAAGAACGGAAAAAGCCAGATCAAGAACCAGTAACACCACGAGAGACACCGAGGAAAGTTGAACAAGGCATTTATGGAAGACCAATGCCACAAAATCGACCAGATATGCAATACAATCAAGGCATGCCAAACAATATGGCATATCACAGCCCTTCCCCTCATAGACAGTTAATTCACCAGCAACAGCAAATAGTCCAACAGCAAATGATGTTGAACCATCAGGCTCGCTCTCAGGAGATGTTGGCTCACCGACCACAGGCTTTGGGTGCAGACGCTCTTTACCAATACGGGCCGCCAGGAAGACGTAGTGCTGTTTATCAAAGGGAAGATTTGAGGTCTTTGGCAAATTTCACATCGCTGAAAACAACTCCACAACCACAATTCGAAAATTCACATTCGAGGCTTGATCTCAGAAGTCCACAACAATTAGAAAGGGATATTGGACGGCAAAGAGGATTGGGTGAAGGAAGGCGAGCAGCGTCACATCCACATCTTCTAGAAGAGATACAACATCGACAAGAAATAGTCAGCCCCCAAATTCATAATCGATCTAGGAGAAATTCCCAAGCAAACTTGTTAGATGGAATATCTCATGAAAATGATCCCATAAGAAATAACGAAGAGCGGGAGTCTGATGACGGTGGTTTTAGACTGAGGCATGCTACCCAAAGTAGGTTAAGTTATGAAGAAAGAATTCGAACCAGTGGTCGGTCCTTAGAATCACACCACGAAAGATCTCATGAAATGTATCGAAGGACACCCGATAGCCATAAAGAATCAAGAAGAACGCCCGATTCCTTAAGCCTAAGACAAAAAGATGAACCTTCAACATCCAGAGAAATAGAGAGGAATGACGAAAGTGCGAGTCAAAAATCAGCAGACAGTGTGTATAACTCCAGTGGAAAAGCCGAGGCGTACACTCCCCAACCGTCTTCCTCAAGACAAACACCGAGTAGGATCGAAGACTTAAAGGCTCATGGAAAGAAAGGACCCAGTGGATCAGGAGCCAGTTCGGATTATGATAAAACCGGCGGTCAATCTTCCAACGTGGATTCAGGTCGTGGGAGCGCTGCGAACTCGAGCGGGAGACGCGCAGAGACCACACGAGCACCTCCGCATGATGCCACAGCTGCACCAGAAAACGAATGGGCAGATTTAGTGGAATGCGAGTTGCGTCAAATCCTGGAGCCGAAGCTCTCCAGCATGAGGTTGGACAGCTCGGCCAGTTCGGATGGATCGGTCACGCCTCCACTACCACCGCTGTCTCCATCTTCAGATCTTCACAAACGGAACAGTCTTCCCGGCCGTGTTGAGTATTCTGACGATCGACGTCGCCGCGAGTCCCCTCGCTGGCCCTCTCACTCACACTCGCACTCACACAAGAAATCGTCAAAAAGAGATCATCATTACAAGAAGCACTCCTTTGGCCCTGACACAACGGACGTCACTTCAACGACGACACGCAGTCTGGATCTGTCTTCCTTGTTAGATGCAAGAACAGACAGCGACGCATCCACAGATGCACGCGCCATACGAAGGCAGCTCCGAGGACTGGAGAACATGTACGGGGAGGTGCTGCAGTTGTTGGGGGTCAGGAAACCAGCTGGAAAGAACTCCTGGGAGGCACGGTTAACTTCCAAGCGTCGTTATGGCAGCATGTCCTCGCTGCCGTCCAGCTCCGTCAGCAGTCGACCTGTCAGGGATAAACGAAGGTCATCCAACGAACATCGGAAGAAGAATGATTATAAGGGCATCAACAAGCGCTTCCAGCGGCTTGAATCCCACGTGGTGACACTGGCTCGGTCGGTGGCGCACTTGTCGTCCGAGATGAGAACACACCACTTGGTGCTGCAAGAGATGGACACCATCCGCGCCGAACTGGCCGCCCTCAGGCACATGTACAGATCTGGCGCCCCAAGTCGAAGACGCACTTCAGGGTTCAGTGACCCCGAGCGTGTGAAACGTCTCACCAAATTCTTTGGAGATGAACCACCGCTCATGAGACTGTTCCTCAAGAAACTTGGATACGAGAAATATGCAGCTCTTCTTGAAAAGGAGAAGGTGGGCGCGGCGGAACTGCCCTACGTCGGGGAGGACAAACTCAGAGCCCTAGGAGTTCCATTAGGTCCTAGGATGAGAATACTCAAAGAGGCTGGGATCCATCAGGACCTACATTTATCTAGAGATGATCATAACACAACGACTACTTTGGCTATAGTGTAA

Protein sequence:

>DPOGS211604-PA
MARTVRKLKRSKGKEAKQLPAIIITPPELDMKFKSTNYKENSSTTDMEFSVHDLIAQLSENSKASKEEIESIQRKLLHQASEILKVDRFANQPSPDPRVVSATQKYNGPIYGRPISIRRQSVINQDAQLVPEKLQENVSAVNKHQVNVVGAGRGDVFNGTGSEARVASARDAAVRGTSEPVPPYRMPPAPEAALPGAPAPPVQGIHTHAKFPIERDVILSSGDKNSKVPILQEARKRGRLGAVAPDTPPKALSAWTHTENQQAGPSGDFRQYEQNYGYAMHQNVNPNQGAVARNLQNYDSPKPPVPAKNAYKPEQNNSHITVTVETGKDNTKDAPKSNKSVSKTYHTLKDMISSRFKNKDGNDAEKNNEEARLNNNEERKKPDQEPVTPRETPRKVEQGIYGRPMPQNRPDMQYNQGMPNNMAYHSPSPHRQLIHQQQQIVQQQMMLNHQARSQEMLAHRPQALGADALYQYGPPGRRSAVYQREDLRSLANFTSLKTTPQPQFENSHSRLDLRSPQQLERDIGRQRGLGEGRRAASHPHLLEEIQHRQEIVSPQIHNRSRRNSQANLLDGISHENDPIRNNEERESDDGGFRLRHATQSRLSYEERIRTSGRSLESHHERSHEMYRRTPDSHKESRRTPDSLSLRQKDEPSTSREIERNDESASQKSADSVYNSSGKAEAYTPQPSSSRQTPSRIEDLKAHGKKGPSGSGASSDYDKTGGQSSNVDSGRGSAANSSGRRAETTRAPPHDATAAPENEWADLVECELRQILEPKLSSMRLDSSASSDGSVTPPLPPLSPSSDLHKRNSLPGRVEYSDDRRRRESPRWPSHSHSHSHKKSSKRDHHYKKHSFGPDTTDVTSTTTRSLDLSSLLDARTDSDASTDARAIRRQLRGLENMYGEVLQLLGVRKPAGKNSWEARLTSKRRYGSMSSLPSSSVSSRPVRDKRRSSNEHRKKNDYKGINKRFQRLESHVVTLARSVAHLSSEMRTHHLVLQEMDTIRAELAALRHMYRSGAPSRRRTSGFSDPERVKRLTKFFGDEPPLMRLFLKKLGYEKYAALLEKEKVGAAELPYVGEDKLRALGVPLGPRMRILKEAGIHQDLHLSRDDHNTTTTLAIV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: