MonarchBase - Protein-coding gene

DPOGS203437
Transcript	DPOGS203437-TA	3666 bp
Protein	DPOGS203437-PA	1221 aa
Genomic position	DPSCF300242 - 202206-208491
RNAseq coverage	298x (Rank: top 37%)

Annotation
*Heliconius*	HMEL015024	3e-142	36.54%
*Bombyx*	BGIBMGA011156-TA	2e-26	49.21%
*Drosophila*	CG16742-PA	5e-07	38.46%
EBI UniRef50	UniRef50_F0ZDD5	4e-10	37.19%	Putative uncharacterized protein n=1 Tax=Dictyostelium purpureum RepID=F0ZDD5_DICPU
NCBI RefSeq	XP_969485.1	2e-12	26.39%	PREDICTED: similar to Protein FAM21A [Tribolium castaneum]
NCBI nr blastp	gi\|380027334	1e-09	41.67%	PREDICTED: uncharacterized protein LOC100869481 [Apis florea]
NCBI nr blastx	gi\|242020274	1e-37	21.74%	Tanabin, putative [Pediculus humanus corporis]

Group
KEGG pathway
Orthology group	MCL21908		Insect specific

Nucleotide sequence:

>DPOGS203437-TA
ATGGAGGGAGATACTACTCGTCTGAGGTTGTCGGCTCCCGACTGGTCTCTCGCAGGAGACTCACAGTTACTGGACATCTTACAGAGCTTGCATCAGACCATCATAACCAAATGCCAGGAGACCAATGTTCAGTTGGAGTCCATGATGTCGTCCCTGGATGAGGCCAGCATTCACTTGCAGAATGTTAACAACAAATTCCTCGGACTCAGTAACAGTCAGTTTGTCGAAAGTCGCGTGTACGATGATCACACGGAGATCGCTGAAGATAATAACAACAAGGATCCTCCGCAGCGCGCCCCCCTCAGTCCCGTGTCGTCTTTGAAGCTCTGTCTCCACACCCTGGAGAGTCTTCACGAAGCTGTCCCCGTGATGGACTCCGACAGTGACGAAGAGGGCAGCGCCCGCGTGGTGCTCCGGCCTCTGCTGCGTCGCGGGCGCGTCGCTCATGAAGCTGTATCATCAGACGCGGACAGCGAGGAGTCCTCCCAGCAGGAGAGGCAGCTGGAGGCGGAGTACTCGGACTCGAGTTCTGAACACGAACAACAGACGGACGCACACGAACATACTATTCCACCGCCGCCTTCCGTGTTAGTGACGTCACACACGCCGCCCGACACGAGGACCACGGAGCCGGTCACCTCGCCCGAGTCGAATGTATCGCCAAAAGTGAGGAAGCTGTACACAGTAGACAAACCCGTCACAGCTCAAATCTTCCCCGAGGAGCCTCCGCCTCTTGACAAGTATGACTCCGACACTGACGATGACATCTTCGCTGACTTACACACACATGCACATACACATACACACACCCACACACACACAGCGCCAGACACGGGCGACATCGTAAACGACCTGTTCGGAGGAGGAGGAGGGGGAGGAAGAGCAGGGTTTGACAGAGATGACGTCACAGAACACACGCGAGTGAGGCATTCACACTTTGTGAGAGAGGAGTCGCCTGGAGCGACCAGTGTGGAGCCAGTGGAGCCAGAGTCAGAACAGACTCCGCCACGGGAATATACTACAAAGGAAAATGTTAAAAAACCCGCTGGTGGTATATCTCTGTTCGGCGGCGCGGGTCCTGAAGCTATCGGAGCGGCCGTCCTGCGAAGAGCACGAAGACAGTCATCAAGTGACGGTGAGGTCGCGGACACTCGCACCGACAGAACCAATGTCATCGACGAATTATTTATAAAACCAACTAAAAATGTCAAAAAACCACCCGTCGATGTTAAGAAAGAACCGAAAGTTGCTAAAGATATAGCTGAGAGTAGCGCTAAAGATAAAAAAGATAAAATAGATCTGTTCTCTGATGATATCTTTGATGACATCGATGATATCTTTACGAGTAACGTTACGAACACGACAAAAGACAGCAAGGAAACGTTGTTTAATGATGATCTGTTCAATGATAACAATGATCTGTTTAACGATAACAGTAAGTCTGTTAAGATTGAGAGCAGCGTTACTAAAGACGACAAAGTAAGAAACATATTTGATAGTGACAGTGAAGACGATTTGTTCTTTGATGCTAAAGGAAAAGATAAAGATTCAGACACAAAAGATAGCACTAAAGTTAAAGATTATAATTCAAATGAAAGCTTAACAGTCAAGAACACTAAAGAAGAAAGTAAAGTTGAACTGAAAAATCAGTTGAGTCCCAATTTATTTGATGATGATGATGATGACCTGTTCAATGTGACGCCGTCCAGGAGAGTGGCGAGTGAACACGGTGATAGGAACGCTGAAGAAACACGAGATAATCAAAGACAAGACAAGAATGAGGCCGAAAAGATGGAAGGAATCAAGACAAGTGACACGCAGGGGGAAGACTGTTTGGAAGAAAAACATGTCGGTGATCCCGTGACAACTGAAAGAAGTGATGCAAACATGCGCGTTCCAGAAAAAAACGTTGTACGAAACGAATTTCACGACGATTTTAATGATTCTGGACCAATAGAGGAAGATTCGGCAAAATCTACTGATAGAGAAGATAATGATGAGAAATCAAAAGGTGATAATAGTCTGCCGAAAGAAAAAGACTTTATAAAAGAAACGAAAGAAAATAAAAGTGAGGAGGAAGCGATAGATGTAAAAGATACTAACGCCAATGACATATTCGTCGACATCTTCAGTGATCTGCCTCCAGCCTTCGAGAAACCGATTGAACCGAAGAAGAGTAAAAACGTCAATGCTCTGTTCGACGATGACTCTGATGATGAGGCGCTGTTCTTCAAGAAAGATGACGTCATCACCGACGAGAAACCGGAAATGGACTTCGGCAGTGACAGGTTTAGAATATTCCATGACGAACCACCCGATATTGATGTGGATTTCACAACGAAGTCTGCGAGCGGACCTCATACGACTGATGTGGCAGATGCTTTGGAAGCTGCGGCGGACGTTGAAGCTGTGACCCATGGAAAAGCTGACACGGCATCAGAAAAACAGATTGAAAAATGTAAAGAGACGGGAAACGAAAATATGCCTCATGAAACAAAAAACAACAACAAAATAAACATACTGAAATTACTAGAGAATGAGGAAAACAATACTGATGGAGGAAATGAAAAGAAAGAGGATTTATTTACCGGCACAGAAAAAGATGATGCGAACTCTGCGAGTAAAACAAAAACAAGAGATGTCAAGACAGAAGAAGAATCAGACTCCTCGGAAAGAGAGAATAGAGTTATTGGAAAGCTGAAGCCGACGAAGCTCAATATAAATGTTAATACGTTGTTACCGGGAGCTGTTCCGAAGAAACCTGTGAACTACGAAGAGACCGACGGACAGGTCACATCCAGAAGTAAAGAAGACTCCGCTCTGGTTGAAGAGCACAAAGAAAAAGTAGTCAGCTTCAAGGAAGAAACGAACTCGGAAGTCCTAGATAACAAACTATCCAAGGAGAGAGCTCGGATTCAGGTCAAAAGACGACCGTCGACTAGACGAGCTAGACTTGAAGCTGTGAGGAAGACTGGTCTAGACTTCGGGTCAGACTCCACAGACAACTCCAGCTCGTTTGACGAACCGGTCAGAGAGATACCAAGAGACAGCGCTCCTAACAAAGAAACAACGACGAAAGTGACCAAACAAGCAGACAACAAAGATGTCATCTCTAAAGTTGTTTATGTTCTGAACGACGAGGACATCTTCGACATTCCTCCGACAGAAACAACTGCTGGAAAACCTCGGAAAGAAGATCTCACGGAAACAATGAACTCTACTGGAATCAGACACCAAGAAACACAAGGAGACGAGAGTCGGAAAAAGAAGACAGAAGAAAAGAAAACAAAAACATCATTATTTGATGATAGCGACGAGGAAACGGATCTGTTTGGGAAACACACTAAGAGATATATATTCGACTCGGACAGCGACAGCGAACTGTTCGGGAAAGATAAAGGAAAGATAGTGAAAGATACAAGAACAGAGGAAAAAGATAAAGAAAGGAGAATCGACAAGGTACAAGCGAAAATACCTCTGTTCAGTGACGACAGCGATGAAGACTTGTTCGGAGGAAAATCAAAAAAAATAGAAGTAAAGAACACATCACAAGCGAGAGCAGTCCCTGGATCATCACAAGTGAGAGCAGTCCCTGGATCATCACAAGCCTTCGATGATCCGCTCTCAGTGCTCGGGGACGAGCGCTCACACAACGTGCATATATAG

Protein sequence:

>DPOGS203437-PA
MEGDTTRLRLSAPDWSLAGDSQLLDILQSLHQTIITKCQETNVQLESMMSSLDEASIHLQNVNNKFLGLSNSQFVESRVYDDHTEIAEDNNNKDPPQRAPLSPVSSLKLCLHTLESLHEAVPVMDSDSDEEGSARVVLRPLLRRGRVAHEAVSSDADSEESSQQERQLEAEYSDSSSEHEQQTDAHEHTIPPPPSVLVTSHTPPDTRTTEPVTSPESNVSPKVRKLYTVDKPVTAQIFPEEPPPLDKYDSDTDDDIFADLHTHAHTHTHTHTHTAPDTGDIVNDLFGGGGGGGRAGFDRDDVTEHTRVRHSHFVREESPGATSVEPVEPESEQTPPREYTTKENVKKPAGGISLFGGAGPEAIGAAVLRRARRQSSSDGEVADTRTDRTNVIDELFIKPTKNVKKPPVDVKKEPKVAKDIAESSAKDKKDKIDLFSDDIFDDIDDIFTSNVTNTTKDSKETLFNDDLFNDNNDLFNDNSKSVKIESSVTKDDKVRNIFDSDSEDDLFFDAKGKDKDSDTKDSTKVKDYNSNESLTVKNTKEESKVELKNQLSPNLFDDDDDDLFNVTPSRRVASEHGDRNAEETRDNQRQDKNEAEKMEGIKTSDTQGEDCLEEKHVGDPVTTERSDANMRVPEKNVVRNEFHDDFNDSGPIEEDSAKSTDREDNDEKSKGDNSLPKEKDFIKETKENKSEEEAIDVKDTNANDIFVDIFSDLPPAFEKPIEPKKSKNVNALFDDDSDDEALFFKKDDVITDEKPEMDFGSDRFRIFHDEPPDIDVDFTTKSASGPHTTDVADALEAAADVEAVTHGKADTASEKQIEKCKETGNENMPHETKNNNKINILKLLENEENNTDGGNEKKEDLFTGTEKDDANSASKTKTRDVKTEEESDSSERENRVIGKLKPTKLNINVNTLLPGAVPKKPVNYEETDGQVTSRSKEDSALVEEHKEKVVSFKEETNSEVLDNKLSKERARIQVKRRPSTRRARLEAVRKTGLDFGSDSTDNSSSFDEPVREIPRDSAPNKETTTKVTKQADNKDVISKVVYVLNDEDIFDIPPTETTAGKPRKEDLTETMNSTGIRHQETQGDESRKKKTEEKKTKTSLFDDSDEETDLFGKHTKRYIFDSDSDSELFGKDKGKIVKDTRTEEKDKERRIDKVQAKIPLFSDDSDEDLFGGKSKKIEVKNTSQARAVPGSSQVRAVPGSSQAFDDPLSVLGDERSHNVHI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: