MonarchBase - Protein-coding gene

DPOGS213509
Transcript	DPOGS213509-TA	1794 bp
Protein	DPOGS213509-PA	597 aa
Genomic position	DPSCF300033 - 1014371-1027167
RNAseq coverage	5x (Rank: top 88%)

Annotation
*Heliconius*	HMEL007785	9e-137	76.64%
*Bombyx*	BGIBMGA011684-TA	2e-77	82.08%
*Drosophila*	CG12502-PB	1e-48	79.17%
EBI UniRef50	UniRef50_B4N3B4	2e-52	77.50%	GK12496 n=1 Tax=Drosophila willistoni RepID=B4N3B4_DROWI
NCBI RefSeq	XP_001984108.1	1e-53	73.85%	GH15186 [Drosophila grimshawi]
NCBI nr blastp	gi\|195014939	2e-52	73.85%	GH15186 [Drosophila grimshawi]
NCBI nr blastx	gi\|270014925	1e-54	44.98%	hypothetical protein TcasGA2_TC011532 [Tribolium castaneum]

Group
KEGG pathway
InterPro domain	[215-336] IPR018787	3.6e-31	Protein of unknown function DUF2371, TMEM200
Orthology group	MCL25879		Lepidoptera specific

Nucleotide sequence:

>DPOGS213509-TA
ATGTGGTCGCACGTGCAGGCACAGGTCTCGATGTGCCTCCTCAGCTCCAGCTCGATCTCCCAGGGCGGCTCCATGAGCGCGCGCCGCGGCGTGCCCGCGCCTCCGCGCGCTGCTACTGCGGGCCCAGGCCGTGCGCGGGCCGCACCTGCGCGAGGCCACCTGCCGCCCCGCCTCCCGTGCGGTGCCCTTCAGCATGCAGCCCGCAGCGCTGGGGGCGCCGGCTGCGGTCGCGGCGCGAAGCTTCAGCTAGCCCGGGACGCAGGCCGCCGGGCGAGTGACCGCGTAGGGCACGAAGGTGAGCGCGACGACGCGCATAGCGATGCGGCCGGCTGCCGGCAGGGGAATGCCGCGGCCGGGTCGCTCGCCGAGAGCCCGGGCGGCCCGGCCGCGCCGGCGCCCCGAGCTCCACGTGACACTTCTCTCCACCCACCGCCCTCCGCGCAGAACGACGACCGTCCGGCGGATCTTTCGGATGCACAATCCTCGACTTCAATTTGCGCTGAACAGGTTCAACGATTGCACGGAGCTGTTCGATTTTGTTTGTTGAATCGGTCTGGATGGAGCAAGGAGGCAGGATGCGTGCGCACAGTCGCGACTCAGATGGCAACGAGAGCGGCAGTCGCTATGAGGCGAGCGCGGAGTGTCACAGGGCCCTTGCGGCGAGCCCACCCCGCATCCGGGGCCACCTGGAACGTCCAGGTGGTCAAGGGGAAAATGAGCTCTCAGTGTCTGTGGCACGCGTGCAGAGCGCTGTCCGCCGGCCTCTTGCTCATGCTGCTGGGAGCGGCCATGGCCGTTATAGGTTACTATGCCGATACGTTGTCAGTGGCGGAAGAAGTGCGTGGCAACTCCACTGTATCAGTGAAGGATGAGGCGAGGGGGTTTCATCTTAACAACCTGTCTTACGCCGGACCCATCGTGATGGGTTTTGGAGGTTTCATAGTAGTAGCAGCCTGTGTTATGACATTCGAGGCTCGGGATAGCGCGGCTAAAGTGACGCCCGCGCGACCCCAGACCATCCCGCGACCCCTGCCTCGCCGGGGTCCATGCGCCCCCGCCAGACTGGACACTCTCGGGGTGTACAGACTACCCCACGTTCTGCCGCTACCACACTCACTGCCACTCGCGCCAGTCAGGGTACGACCACACGTCCACAGAACCAGTGGAGATAAAGCTAGAAATCGTGCGCGTTTCGGCTCCGCTCCGGACTTGAGGAGCGGTAGCGGCCTCGCTACGCCGTCCGTAACCGCGCTACGACGACCGCTACGACGCTACGCTCTCTCTGTTGACGAACCGCCGCATTCAGCTGTCAGAACCCAGCACCATTATCTACACCCTAGCACTATAACCAAACCCAGCTCCCATTCCATATCCAGCGCTAGTGCGGTGGAGTCCGAGTGCGGGTCTCAGTCTTCTTTGGCATTGGATCTTCACGCAAGCGGGGCCTGTGCTGGCGTCACGCTGAGGGTCAGAGATAACACGAGAAGAAGACCCCTGGCAAGACAACAGAGACTCAACGAGGACACTATACACCCATCTGGAGAAAGCGCCGGCCATGTAGCCAACACACGTCAGTTTCCGAGAAACAACGAACAGAACGAAACTGTGGGATCCACTCAGTTAACTGTGGAGCAAGAGGCGCGTGCGCGTAGTGCACCCCCTCCGTGTCATTCCACCCCCACCTCCCCCGTACCGGTCATAACACCCCCCATATCACCGAAACAGGACACAAACATCATCATCGAACAGCCAGAGACAGATTGCACGGATGAACCTCCTCCGGCCGTCGAGTGA

Protein sequence:

>DPOGS213509-PA
MWSHVQAQVSMCLLSSSSISQGGSMSARRGVPAPPRAATAGPGRARAAPARGHLPPRLPCGALQHAARSAGGAGCGRGAKLQLARDAGRRASDRVGHEGERDDAHSDAAGCRQGNAAAGSLAESPGGPAAPAPRAPRDTSLHPPPSAQNDDRPADLSDAQSSTSICAEQVQRLHGAVRFCLLNRSGWSKEAGCVRTVATQMATRAAVAMRRARSVTGPLRRAHPASGATWNVQVVKGKMSSQCLWHACRALSAGLLLMLLGAAMAVIGYYADTLSVAEEVRGNSTVSVKDEARGFHLNNLSYAGPIVMGFGGFIVVAACVMTFEARDSAAKVTPARPQTIPRPLPRRGPCAPARLDTLGVYRLPHVLPLPHSLPLAPVRVRPHVHRTSGDKARNRARFGSAPDLRSGSGLATPSVTALRRPLRRYALSVDEPPHSAVRTQHHYLHPSTITKPSSHSISSASAVESECGSQSSLALDLHASGACAGVTLRVRDNTRRRPLARQQRLNEDTIHPSGESAGHVANTRQFPRNNEQNETVGSTQLTVEQEARARSAPPPCHSTPTSPVPVITPPISPKQDTNIIIEQPETDCTDEPPPAVE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: