MonarchBase - Protein-coding gene

DPOGS210956
Transcript	DPOGS210956-TA	3624 bp
Protein	DPOGS210956-PA	1207 aa
Genomic position	DPSCF300004 - 1086032-1098624
RNAseq coverage	9x (Rank: top 85%)

Annotation
*Heliconius*	HMEL010128	0.0	82.91%
*Bombyx*	BGIBMGA006383-TA	0.0	72.51%
*Drosophila*	CG13855-PA	2e-87	32.87%
EBI UniRef50	UniRef50_D6W9N3	7e-125	38.64%	Putative uncharacterized protein (Fragment) n=1 Tax=Tribolium castaneum RepID=D6W9N3_TRICA
NCBI RefSeq	XP_002073739.1	1e-90	32.68%	GK14267 [Drosophila willistoni]
NCBI nr blastp	gi\|270003003	2e-124	38.64%	hypothetical protein TcasGA2_TC030746, partial [Tribolium castaneum]
NCBI nr blastx	gi\|270003003	2e-130	38.95%	hypothetical protein TcasGA2_TC030746, partial [Tribolium castaneum]

Group
KEGG pathway
Orthology group	MCL14812		Single-copy universal gene

Nucleotide sequence:

>DPOGS210956-TA
ATGGATGTGGAAAGGACAATAGGTATTTCTCCAAACTCAGAGTGTTTAAAGGGATCTGTTTCGTGCCAATGTGAATTAGGTCGAGAGAAATTGCTAACCGCTCCGCCTTACAAGCGTAACTTATCTCCAATTGAAGATGATATAAAATCACGTCTACAAACAGCACCGTGTGCAAGAGAACTCGAACAGTATAAATGCCCAGTCAGCCATATTCCAGTGAATTTCAAATCGCCTCTGCACCCTAACGAAGTGTTTAACAAAGTCTTCCCGTCAAACACCCCAATTAAACTAGTTAAACGCAAATTAGCCAAACTATTATCTATTTCAAATAGCAATCTTTTATTAACCAAAAATAGAAATGTATTAAAGGAAACAAGCCTCCTTTCTGAACTAAAAACTGATGCTTTAGGAAATCTTTTTATAGATGTTTTTACTAAAGATTCTGAAGAGTTTTCTTTATCATCTATACCCAAAGAGTCTTATGTTCACGAACTTTTACAAGCAATGATGCCAAAAAAGAAGACTATGCCTTTTATTGCTATTAAATTTAGGGTACACAATCAAAACACCGCATTCACGCGGTCGTACCACTCGATCATGAAAGTTCACGAAGTGAAGAAAAATTTGGCTGGTATATTTCAAACAGCTCCCGATAATATTGTCATCCTAAGAGAAAATCGCCCTTTGAAAGATCGCATGGCACTTTTGGACCTGGATTATGATAAATATGGCATCGTTGAAGTGGATCTATTCACTAAAAACAATGACACTCTTAACCTAGACAAACTTTACAAAGAATTGCCAATGACTGACGTGTTGACAGTAACAGTTCCGTTCGGGAGCACCATTAAACATATAAACGTTGAAGTATTTTCGGAACCGATGCGTAAACCCTTTTTGGGTGGCTATCGAAATGTACACACAGGTATTGTTTATCATCACGCTTACACGCAGACACCTCAAAAAGCTGAAAAATTGCCTCCCGAAAAGAAAAACTGTAGAGACACGCAAACGGCTGAAATGCGAGAGAAAATATATGACACCAATTATAGCCGAGCTACTCAAATGAATACAGTACACGCTTATGTACCAAACGTCACAGATAGAATTATAGTACCGAAACCTTATGAAACTTACGAGGAAATGATCGCAAGACTCAATCACGACCACTACGCTGCAATTATACAACGCGCGTTTAAACACCATCAGTTTAGACAAAAAGTTAAGAGATGGCTTCAGGAATGCATGGAAAGAATTGCTAGAATGGAGGAAGAGCGAAGGCTGGAACGCGAAGCAATGGAAAGAAGACTTAAAAGAGATTTGGTTACTAAGACGTTTCCAAAAACCAGAGAAGACTTTGACCAACTTTACGCAATGGTCGATCGCTGGAAACATGCAGAAATAGCCAGAATATCACAGTTGCATTCCAAGGGTCCAAAAATTGCAGAATTTACACTTTTACTAGACAAAGAGGTTGAACTTCTCCGTTGCATTGAAGCATATCGAGTTAAAGTAAAGGAGGACAGTCGTAAAATTAAAGAAAAACAATTCCTAGAAGAAATATCGAAACCTGTAGCGTGGTATGGACGTGACGGAAAGCTCATTACCATGGACACTGTAGAGATACAAAAGGCAAGGAAATTGAAGGAATTGTATAATTCATTTATAAGAGACGACGTTGAAGTTAAAGAACGCATAGAACTTCTCGTAAACATGAAATTCGCTCTTCAAGAATTCCGTCATCCTTTAGCTGAGGAGACCATTACGCTTTTGGATCGCGAGTGCGATCTCCTTGTAAGAAGATGTGACGACCAACAATTAGAATTTTTAAGGCGACGAGTAGCAGCCTGTGTGTTGCAACTGATAAAAACATCCGAGTTAAACTCCGGCGTGACAAAACGTAAAGAGGTCAGAGATTATAGAAAGATCGAGAACAGTAGATTGCAATTCTGCGAAATGTGTCACCAGGTTAAAATTAATACAGACTTTCCTTTAAACGCTAAGATGTCAGGTTTCACAGTTTGCACGTCGTGTTCGTGGAAGGATGTATCGGAACGTTGTTGGATTGACATGACCCCGTACAAATTCATTTTGCGAGCCGTCCAACGTGACGAGCGGAAAAGAAAATGTTGGGGTTCTTTGGCTTTTGTTCTTCAGGAGAAGGATATATTTTTCATAGTCGAAAAGCTTTGGCATTCGCATTCAGCAATAAGTGAGTGTACAGAAATGACCGAGTTACGGCTCTGTCGTTGGCGTGTCAATGAAGATTGGTCGCCTTGGAATTGCTTTCTGGTGACAGTACAGGAAATGAAGGCGCACTGTAAATTAGAAGACCCCGAGGCAGTTTATGACGAAGAGTTAGTTCAAAAAGTCCTCAATAAACACAAACTAGCGAAGGCAAACTTTGAACAACTTTTAGCTGTAAATAAAAGGTTTACAGAAAGCGGTGATTGGGCTGGAATTCGTGCACCCGCCATAGTACGAGCCAACGCTGTCGATCGCTGGAAACATGCAGAAATAGCCAGAATATCACAGTTGCATTCCAAGGGTCCAAAAATTGCAGAATTTACACTTTTACTAGACAAAGAGGTTGAACTTCTCCGTTGCATTGAAGCATATCGAGTTAAAGTAAAGGAGGACAGTCGTAAAATTAAAGAAAAACAATTCCTAGAAGAAATATCGAAACCTGTAGCGTGGTATGGACGTGACGGAAAGCTCATTACCATGGACACTGTAGAGATACAAAAGGCAAGGAAATTGAAGGAATTGTATAATTCATTTATAAGAGACGACGTTGAAGTTAAAGAACGCATAGAACTTCTCGTAAACATGAAATTTGCTCTTCAAGAATTCCGTCATCCTTTAGCAGAGGAGACCATTACGCTTTTGGATCGCGAGTGCGATCTCCTTGTAAGAAGATGTGACGACCAACAATTAGAATTTTTAAGGCGACGAGTAGCAGCCTGTGTGTTGCAACTGATAAAAACATCCGAGTTAAACTCCGGCGTGACAAAACGTAAAGAGGTCAGAGATTATAGAAAGATCGAGAACAGTAGATTGCAATTCTGCGAAATGTGTCACCAGGTTAAAATTAATACAGACTTTCCTTTAAACGCTAAGATGTCAGGTTTCACAGTTTGCACGTCGTGTTCGTGGAAGGATGTATCGGAACGTTGTTGGATTGACATGACCCCGTACAAATTCATTTTGCGAGCCGTCCAACGTGACGAGCGGAAAAGAAAATGTTGGGGTTCTTTGGCTTTTGTTCTTCAGGAGAAGGATATATTTTTCATAGTCGAAAAGCTTTGGCATTCGCATTCAGCAATAAGTGAGTGTACAGAAATGACCGAGTTACGGCTCTGTCGTTGGCGTGTCAATGAAGATTGGTCGCCTTGGAATTGCTTTCTGGTGACAGTACAGGAAATGAAGGCGCACTGTAAATTAGAAGACCCCGAGGCAGTTTATGACGAAGAGTTAGTTCAAAAAGTCCTCAATAAACACAAACTAGCGAAGGCAAACTTTGAGCAACTTTTAGCTGTAAATAAAAGGTTTACAGAAAGCGGTGATTGGGCTGGAATTCGTGCACCCGCCATAGTACGAGCCAACGCTGTAGACCGAATATGA

Protein sequence:

>DPOGS210956-PA
MDVERTIGISPNSECLKGSVSCQCELGREKLLTAPPYKRNLSPIEDDIKSRLQTAPCARELEQYKCPVSHIPVNFKSPLHPNEVFNKVFPSNTPIKLVKRKLAKLLSISNSNLLLTKNRNVLKETSLLSELKTDALGNLFIDVFTKDSEEFSLSSIPKESYVHELLQAMMPKKKTMPFIAIKFRVHNQNTAFTRSYHSIMKVHEVKKNLAGIFQTAPDNIVILRENRPLKDRMALLDLDYDKYGIVEVDLFTKNNDTLNLDKLYKELPMTDVLTVTVPFGSTIKHINVEVFSEPMRKPFLGGYRNVHTGIVYHHAYTQTPQKAEKLPPEKKNCRDTQTAEMREKIYDTNYSRATQMNTVHAYVPNVTDRIIVPKPYETYEEMIARLNHDHYAAIIQRAFKHHQFRQKVKRWLQECMERIARMEEERRLEREAMERRLKRDLVTKTFPKTREDFDQLYAMVDRWKHAEIARISQLHSKGPKIAEFTLLLDKEVELLRCIEAYRVKVKEDSRKIKEKQFLEEISKPVAWYGRDGKLITMDTVEIQKARKLKELYNSFIRDDVEVKERIELLVNMKFALQEFRHPLAEETITLLDRECDLLVRRCDDQQLEFLRRRVAACVLQLIKTSELNSGVTKRKEVRDYRKIENSRLQFCEMCHQVKINTDFPLNAKMSGFTVCTSCSWKDVSERCWIDMTPYKFILRAVQRDERKRKCWGSLAFVLQEKDIFFIVEKLWHSHSAISECTEMTELRLCRWRVNEDWSPWNCFLVTVQEMKAHCKLEDPEAVYDEELVQKVLNKHKLAKANFEQLLAVNKRFTESGDWAGIRAPAIVRANAVDRWKHAEIARISQLHSKGPKIAEFTLLLDKEVELLRCIEAYRVKVKEDSRKIKEKQFLEEISKPVAWYGRDGKLITMDTVEIQKARKLKELYNSFIRDDVEVKERIELLVNMKFALQEFRHPLAEETITLLDRECDLLVRRCDDQQLEFLRRRVAACVLQLIKTSELNSGVTKRKEVRDYRKIENSRLQFCEMCHQVKINTDFPLNAKMSGFTVCTSCSWKDVSERCWIDMTPYKFILRAVQRDERKRKCWGSLAFVLQEKDIFFIVEKLWHSHSAISECTEMTELRLCRWRVNEDWSPWNCFLVTVQEMKAHCKLEDPEAVYDEELVQKVLNKHKLAKANFEQLLAVNKRFTESGDWAGIRAPAIVRANAVDRI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: