MonarchBase - Protein-coding gene

DPOGS209613
Transcript	DPOGS209613-TA	3366 bp
Protein	DPOGS209613-PA	1121 aa
Genomic position	DPSCF300015 + 303832-312522
RNAseq coverage	151x (Rank: top 53%)

Annotation
*Heliconius*	HMEL016466	0.0	93.00%
*Bombyx*	BGIBMGA006678-TA	0.0	88.81%
*Drosophila*	tio-PA	9e-178	43.01%
EBI UniRef50	UniRef50_E0V8X9	0.0	52.02%	Tiptop, putative n=5 Tax=Neoptera RepID=E0V8X9_PEDHC
NCBI RefSeq	XP_001809602.1	0.0	55.29%	PREDICTED: similar to tiptop [Tribolium castaneum]
NCBI nr blastp	gi\|270014284	0.0	56.02%	teashirt-like protein [Tribolium castaneum]
NCBI nr blastx	gi\|270014284	0.0	57.45%	teashirt-like protein [Tribolium castaneum]

Group
KEGG pathway
Orthology group	MCL15545		Insect specific

Nucleotide sequence:

>DPOGS209613-TA
ATGATTGCGTATGGCCGCACTCCCAGACCACGGGCAATAATTCAAAAGCGTCACGATAACGCCACGCGTCATTTAAATTTGACTTTGGAGAGCGCTCAGAGGCAGGCACTAGCGGATGCACAGGCTTCCTTTGATCGGAATCGAGCGTGTTTATTCGATTGTGAGGAATCAACAAGTCCAGAAAGCGGAGTGAAGGAATTAGGAGGACGCGAACGGGAGGCGCGGGGAGAGGCAGGGGAGTCGCGCTCTCCATCGCCAGCATCCCGTGCCTCCCCCACACCCGAAGATCGGGATATAGAGCACAGCATACCAGCTACCCTCATACAGGATCCCAATGCTGAAAGGGAGAGTCCAAGATGTTTATCGCGGGAGTCGTCCGGCGCGCCGCGATGTCCCTCTAACGACTCGGTGTATTCGGGTCGGAGCGCGCCCAGCCTGCCCTTGCCAGCCGCCCTATCAGCAGCGTTACCGGCAGCCCTGCCCGCAGCGCTGATGCCACCCCACTCCGCTGCCGTCGCAGCCTATCTCGGAGCAGCAGCTGCGGCAGCCCAGCAACGATTACTCATGTCCTACCAGGAAGACATTACGGACGCTGAAAGAGCGGATGCCGTATTAGACTTCAGCACTAAACGAAGTGAATCCCCGGTCGACGATGAGGAGGATGACGCCGTTAATCTCACAAAGAATGAAAATGGTCCATTAGACTTATCTGTAGGTACTAGAAAAAGGGGGCCAGAGGATTCTCCATCTCCCGTCCCTAGTAGAAAAAGTTCTCGTACTTCCGACTTCAAAGCTTTATCGACACCTTGGTCTACACCGGTCGCGCCACATCTTCCTTATTTTGCTGCCGCCGTTGCTGCTGCAAGCTTATCACCAAAAGGTGGAGTTCCAGCTGATTGGAATGGTAAACTTAAACATGGAGCGCCTACACCAAGCGATGCTACTAAAGCACTGGAAAAAATGAGCGAATTGAGTAGATTAGGTGGAGAAGAACTTTTTAGATCTGTTCAAAGTGCAGCTTTGGGTGCAGGTCTTACACCAAATGCAGCTGCACGACATTCAGCTTGGCAATCTCATTGGCTGAATAAAGGAGCAGACCAGACAAAAGATGTCCTAAAATGTGTATGGTGCAAAAAGAGCTTCAATTCACTTGCTGATCTAACTGTTCACATGAAGGAAGCTAAGCATTGTGGAGTTAACGTTCCTGTACCCCCTTCAACTGGAGCTCCGATTCCGCCTTCACTACAACCACCATCAAGTTCGCCTTCCACGCCATCCCATAATTCGTCGTCCTCGAGTGGGTCGTCAAAACCAAATCATAATGATTTAAATATGCTTATAAAAGAAAACATGCCGATTCCTAGAAAATTAGTACGAGGTCAAGATGTTTGGCTAGGAAAGGGTGCAGAGCAAACTAGGCAAATTCTAAAATGCATGTGGTGTGCAGAAAGCTTTCGTTCCTTAGCTGAAATGACGAGTCATATGCAACGCACTCAGCATTATACTAATATTATATCACAGGAACAAATAATTTCCTGGAAATCCTCAGATGAAGCTAAGGGATCTAACTCTAGCACCCCGGGTACAAATAACGCTGTTCCTCCAACAACAGGAACAAGTAGCCATGTTAGCGCGGTATTAACTTGTAAGGTTTGCGACCAAGCGTTTAGTTCCTTAAAAGAGTTAAGCAATCATATGGTAAAGAATTCTCATTATAAAGAACATATTATGCGATCTATTACGGAGAGTGGTGGTAGAAGACGCCAGACACGCGAAAAACGAAAGAAATCGTTACCAGTAAGAAAATTACTTGAACTTGAACGAGCCCAACATGAGTTCAAAAATGGCGAAGGTAACGGTGTTCCCATGGGAAAACCGATCAGGGATTTCGGTGCTGGTAGCCGTATTACTTGCGAAAAATGTGGAGACAAAATAGAGACTGCTGTATTTGTAGAGCATATTCGTCAATGCATTGGATCACCAATGTCAAACACCCAAAGGAATTTTCTAAAAAGTGCTCTTCTTTCTAATAATATTATTCCACCTGATGTACCTGGCCATATCACCCCCACTAGTCGCGATGGTCGAAAAAGCATTAACGAGGAAATTCCATCTCCTGGTTCAGCTCATCACCGTTCCCCTTCTTCGGTTAATGATTCTTCTCCCAGTTCCAAAGATCATAATGCCAGCAACGACAAAAGTTCATCTCCATCGGTGCTTAATGCTATAGAACAATTAATAGAAAAAAGCTTTGATACACGCTCCCGACATTCAGTACCAGGTATACCAGGTGGAGCTTCACATGCTCCAATCGGGTCAAGTATCCTAAAAAGGTTAGGAATAGATGAAAGCGTAGATTATACCAAACCGTTAGTAGATCCTCAGACGATGAATATGCTTAGAAGTTACCACCATCAACAGGGATACGGTCGCCGTGAACGCAGCGGTAGTGAGTCTAGTTCTATGTCAGAAAGGGGTGGTAGTAGGGTTGAATCTCTAACCCCAGACAGGAAGCTGGATTCCTACCACATGACGCCTCGTACTACTCCTGATACTCGTGGCTCTCAAACTCCGGCATCTGAGGAACGGCTCACTGAGGTTAGGATAAAAAAAGAAGTCACAGATGAAGAAGAACGCGAAAACGGTGTAGACTTGAGTAGCCAACCAGTTAGAGTAAAAACTGAAGTTGAGGATGAGGAAGAGCAACAGAGACCAAGCAGTGCAGTTGACGAGGACGTAAAGCCAACTGTTCCAAAACGTGAAAGTGAGGGCCCAAGTCCAGCTGCTAGTCCTCGCAGTCCGGCCAGTGACCGATCAGCGCCAACGCCCGGTACTGACAGGAAACCGGCTTCCAGCCTAGGAGCTCTCTCTTCTATGTTTGATAATCTAACCGGCGGAGGTTCCTCAAACGAGCCAAGTTCTTCTCGTCGCGGAGGCAGTCACCCTTTAGCAGCTTTACAAAAACTTTGCGATAAAACGGAAACGAATTCATCTCGTGCTCCTGCCCCAGCCCCATCTCCCGCTGGTCCACCTAGCATCCTTACTTTTAGCTGGGCCTGCAACGATGCAGTAGTGACTGACTCTATAATGAAATGCGCCTTATGTGATACACCGTTTATATCAAAGGGCGCTTATCGGCATCATTTATCGAAGATGCATTTCGTTAAAGACGGCGCCCTGCCGGAGCCTGTGCCAGTGAAGGCTCCACCGGCGGCACCATCCCCAGGACCTCACAAGAGCAGCGGATCAAACGCGGCCTCACCTCAAGATCCGAGAAGTCCGTCTCAATCTTTCGATGAGAGTCCTCACTCTAAATTCCTCAAGTATACGGAACTGGCTAAACAATTATCCAGCAAGTACGTCTAA

Protein sequence:

>DPOGS209613-PA
MIAYGRTPRPRAIIQKRHDNATRHLNLTLESAQRQALADAQASFDRNRACLFDCEESTSPESGVKELGGREREARGEAGESRSPSPASRASPTPEDRDIEHSIPATLIQDPNAERESPRCLSRESSGAPRCPSNDSVYSGRSAPSLPLPAALSAALPAALPAALMPPHSAAVAAYLGAAAAAAQQRLLMSYQEDITDAERADAVLDFSTKRSESPVDDEEDDAVNLTKNENGPLDLSVGTRKRGPEDSPSPVPSRKSSRTSDFKALSTPWSTPVAPHLPYFAAAVAAASLSPKGGVPADWNGKLKHGAPTPSDATKALEKMSELSRLGGEELFRSVQSAALGAGLTPNAAARHSAWQSHWLNKGADQTKDVLKCVWCKKSFNSLADLTVHMKEAKHCGVNVPVPPSTGAPIPPSLQPPSSSPSTPSHNSSSSSGSSKPNHNDLNMLIKENMPIPRKLVRGQDVWLGKGAEQTRQILKCMWCAESFRSLAEMTSHMQRTQHYTNIISQEQIISWKSSDEAKGSNSSTPGTNNAVPPTTGTSSHVSAVLTCKVCDQAFSSLKELSNHMVKNSHYKEHIMRSITESGGRRRQTREKRKKSLPVRKLLELERAQHEFKNGEGNGVPMGKPIRDFGAGSRITCEKCGDKIETAVFVEHIRQCIGSPMSNTQRNFLKSALLSNNIIPPDVPGHITPTSRDGRKSINEEIPSPGSAHHRSPSSVNDSSPSSKDHNASNDKSSSPSVLNAIEQLIEKSFDTRSRHSVPGIPGGASHAPIGSSILKRLGIDESVDYTKPLVDPQTMNMLRSYHHQQGYGRRERSGSESSSMSERGGSRVESLTPDRKLDSYHMTPRTTPDTRGSQTPASEERLTEVRIKKEVTDEEERENGVDLSSQPVRVKTEVEDEEEQQRPSSAVDEDVKPTVPKRESEGPSPAASPRSPASDRSAPTPGTDRKPASSLGALSSMFDNLTGGGSSNEPSSSRRGGSHPLAALQKLCDKTETNSSRAPAPAPSPAGPPSILTFSWACNDAVVTDSIMKCALCDTPFISKGAYRHHLSKMHFVKDGALPEPVPVKAPPAAPSPGPHKSSGSNAASPQDPRSPSQSFDESPHSKFLKYTELAKQLSSKYV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: