MonarchBase - Protein-coding gene

DPOGS202230
Transcript	DPOGS202230-TA	3903 bp
Protein	DPOGS202230-PA	1300 aa
Genomic position	DPSCF300149 + 460945-476105
RNAseq coverage	60x (Rank: top 68%)

Annotation
*Heliconius*	HMEL009179	4e-49	36.36%
*Bombyx*	BGIBMGA013529-TA	2e-07	33.94%
*Drosophila*			%
EBI UniRef50	UniRef50_C3XTU3	9e-13	37.04%	Putative uncharacterized protein (Fragment) n=1 Tax=Branchiostoma floridae RepID=C3XTU3_BRAFL
NCBI RefSeq	XP_002165884.1	8e-11	31.68%	PREDICTED: similar to Rpgrip1-like [Hydra magnipapillata]
NCBI nr blastp	gi\|260834621	3e-12	37.04%	hypothetical protein BRAFLDRAFT_221898 [Branchiostoma floridae]
NCBI nr blastx	gi\|328781761	1e-13	23.71%	PREDICTED: hypothetical protein LOC725833 [Apis mellifera]

Group
KEGG pathway
Orthology group	MCL21015		Lepidoptera specific

Nucleotide sequence:

>DPOGS202230-TA
ATGAATGATGGCAAGGGGCATCTCTCTTGCAAGAGTCACACAGCAAGAAATGAAAAGGATATATACAGGATATGCCCATCTAAAATAAGCAAACGAGAATTGGAAGATTTGTATTTCGCATTATTAGAACAAAATGTACAGTTGAAGACGACAATCAATGATCAAAAAGACCAAATAAAGATACTGAATACCAGATTACAGAGAATGACCGCTCAGAAGCCAGGGACTGGAGCGTATAATAAAGACTTCAGTGGGGCTGGGAGAGGAATTATAAATGAACAAAAGGAATGTATAGCAGATCTGAAGAAAGATAATGAGCGTCTATCAGAGCGTGTCCGCTTACTGAACATGCGCCTGTGTTCCGCCAAGCAGTTCCTCAGGCGGAGTCCTTCTCAATCCGCCTCCAGATGTGTCAGATGCATCATACCAGATACATCTGCTAAGAATTTATCTACAAGCGCACTAAACAGCAAAAGAAGCGAGGGTAACCTGAAAACTGAAATTTCAACGTCACAGCTTGTTGAGGACGAAAGCCCATTACAATTGCCTGAAATAACTTCAAGTCAAGCTGAAATACCAGTTCAGGATGAGCCCTGCCAACGGAATAAGTGCAGAGTCGAGATGGATGAGCTGAAAGGAAAAATTGCTTCCTTGGAGAATGAAATGTCTTCCCTCCAATCGTCCTGGTCTTCCCGTGCCGACGAGCTCCAATCACTACTGTCTTCCGCACGCGCTGAACACGCCACGTGTCCAAATAGATTGGCAGCCCTCACCACAGACCTTGGGGGTACTCGGACACTAGCAGACGAGCTGACCAGCCAGTTACAGCTGGAACGAGCTCGTGTGGGTGAGCTGGAGGCGCAGCTGAGGGCGGCGCGGATCGACTACAACGTGGCGCTAGTGGCCGAGGGTCTGAAAAACCAATCACACAAACTCAGCGACGTCAGTAAAGTCAACCCGCCAGTGACCGTGCTCTCCGACTGGGAGGATAGTCCACCAATAGTGGTCCCAAATAATTCCGGAATATCCGTGGTAAATGAAGAGAACGCGAATGACCGAATGCAAGAGTCGGCTGACGGCGAGACCAAAAACAAAAATCATACAAATCATAAAAACGAAAGGGCAGTGGCTCTTCAAACACAGGGTGATTTTATTCTCACACAAATAGCGAGTCTTCAGTCCCAGTTGGACGGTTTAAAGCTCACTATCGGGGAGCGTCCCGCCGAGTCGTTGGCAGCGGACTCCAGCCTCAGTCACGATATCTTCAGCACCTTGCGGTTGAAGACAGTCACCGACATTGTGAAACCTCCGGAACCCTCGCGGCACGACGATACTCTCGTTTCCAAAGAATTTATAGAGGATGAAGAAGGAACGTTGGTGTCGCGACCGCAGACACACGAGGAAAACCAATATGAACAGGAGTACAAGTATCCAATACCCGGACCTTTATCATTGGACATGCCGAGATCGTCTCTGGCGGATATCACGGATATCAAGGTCAACAATGAGACGAAAAAGAGAAACTCGGAGAGCAGCAGAGGCAGCAAAGGCAGCGTGAGGATCAACCTGGATAACATCACGGCGTCAAAGAACGGAGACGGTCGGGTGGTCCAAGACCTGAACCAAAACGGTCAAGAAGATGTGTTTAAAAAGTTCAGACGATCCAGCTTCAGGTTTCCCTTCGATAGGAAACAGAGCAAAGACCTAGCGGTGCGATACGGACAGACGCAGACTTACGGGAGTCAAGAAGACAACAGGGAGGAAGCGAAGAAAGTCTCCATAGGAATCAACACCGAGCGACCCTACGACCAGGACCTGGGCCGCAACGATCACGACAGGCCCGGCGACCACAACGATCAAGTGGCCACACGGAAGATACGGTACATGAGTGAGGAAAATACGCAAGTTGGCGAGGAACCGGGAACCAGTGTTGGCTGTGACGAGACGACGGAGAACGGCGCTCAGAGGAGCAGCAGGGACAGGAACCAGCGAACGAATAGTGTAGAGATACAGTGTGACGGCCCCTCCCACACCAGGGAGCCGCATACTGGCTCTACAAAAAAAGAATTTCCAGAATCAGCAGCAGATGAGGGAAATTATGTCCAGCTCTGTTCCGGTCACGCGGTGATGTGTCCCTGTCCCGCGCTGGCTCCCTCGCCCCGCTCGGTACGGACCTGCGCCGGGGGACTGGCGGCCGCGCCCCCTAACATACTGAGGCTCTGTCGCTGTGGGGACCGCGTTAATAGACATACTCCCCATACATCTACTGCCACACCGGAACCTCCCCGGCCGTCCACGGCGTCTCCTACGCCGTGTCCGTACGACGAGACTGTTACTATATCAGGACCTTCTTCCCCGGACACCACTGAACCCGGGGCGACCTGCGACCTTGACACGCAGAGGACTGACGAGACTGGTCCGACGGACTACATCTCCCCGGGCGAGGAGAAGGCCACGTCAACACTCAGCGAGTCATACGGCACCACAGACTACAGCTGTCTAAGCGAGGGAGAGGTTCCCGCTGAAGGAGGTAAGAGGCTGTCGGCCACGGAAGATAAAATGTTGGAAGCCATAGGCTCCCGCTCCGATAAGATGGAGGAGGCGCTGCGGGCCATCAGCGAGGAACTGACACGCTGCAGGGAGCTGCTGCAGGGGAGGGGGGCAGTGCACTCGCCGAAGACCTCTCGCGAGGTGTCGATGATGACCGAAGAAGTTGTACCCATAGCACTGAAAAGAGCCGATGCCAAGTTACGTCTACGAGATTCGTATACACCGAAGTGCATATTCACGCTGCATGTCGGCACTGTGGTGCTATCCGACCAGGCGGTCCTTCTCTCTCACGACAAGTCGTTACTGTTAACTTGGCGCTTCTACAATCAGACGCCATCCATGACTCGTCTACTGGCCGGACGAGTTATGAATTTCGACTTCTCAACAGAATACGATCTCAAGATAACTGAACATTTCCTGTACTATTTAAAACATGAAGAGATGCCGATAACAATATCAGAGATGGACAAACAGGACGAGGCGTTCGCTATCTGTTCCCTGCCGTTAAGGGATGCTCTGCTTCATCCGAACAGAAGAGTTGATATGTCACTCGCTCTGGTGGCAGGCAGACAGATGACCAGAGAGCGTGGCTCGGCAGACTGTGAGGAAGCAGGGGTGCTAGATGTATGGTGCATGCTCAGGGTCGACCCTAGCGCTTTGCCCGCTATCAACACGGCCATCATCAGGCCCTCGTCCTTGAAGAGCCAGCAGCACTCTTCATCCATCATGGAGCAGATGCTGGATGACGACCAATCATCCGACTACCGGTACTCCCGGGACCTGCACAGGCGCAGCAAACGAACGACCGTCGTAAGCACCGACGAAAACCTTCAAAGTCTGGACATCACAATACAGTGGCTAGCTCTCAATGAAGACTGTAAGGCGATGATTGATCCCAATGTGAGGAGGTTGTATGTAGCATACACCTTCCTTGGCCGAAGCGGTGCTGACATGGAGACGCCCGTCAGTCTGCCGAAACCGAAGCATTACATGGACAAATGTCACTTTCTGTTCAAGAAAACGTTCATAGTGAACGAGTGTGATATGGTGACGTTGGGTCACTTGGCTCAGTGTCACGAGCCGGCCAACGAACCTGACCCTCAGTGCGCGGTGGTGTTCAGCGTAGTCAGCGAACCCGCCGAGGATCCACTAGGCCTGGACAGCTGTGAGGATATCGGCTACGCGTATCTATACTTGGGGGATGTGCTGGCCAGCAGTTCCACTGAGACGTATAACGGGGTGCTGGTGGTTCGGGATCCTCGTGGTGTGGACTGCGGAGCCCTGGCCCTTAGGCTCGATGGCCTGACTCTGCTGCGGCGATGCAGGGATCTGGCCGGGAACGCCAGTCATTGA

Protein sequence:

>DPOGS202230-PA
MNDGKGHLSCKSHTARNEKDIYRICPSKISKRELEDLYFALLEQNVQLKTTINDQKDQIKILNTRLQRMTAQKPGTGAYNKDFSGAGRGIINEQKECIADLKKDNERLSERVRLLNMRLCSAKQFLRRSPSQSASRCVRCIIPDTSAKNLSTSALNSKRSEGNLKTEISTSQLVEDESPLQLPEITSSQAEIPVQDEPCQRNKCRVEMDELKGKIASLENEMSSLQSSWSSRADELQSLLSSARAEHATCPNRLAALTTDLGGTRTLADELTSQLQLERARVGELEAQLRAARIDYNVALVAEGLKNQSHKLSDVSKVNPPVTVLSDWEDSPPIVVPNNSGISVVNEENANDRMQESADGETKNKNHTNHKNERAVALQTQGDFILTQIASLQSQLDGLKLTIGERPAESLAADSSLSHDIFSTLRLKTVTDIVKPPEPSRHDDTLVSKEFIEDEEGTLVSRPQTHEENQYEQEYKYPIPGPLSLDMPRSSLADITDIKVNNETKKRNSESSRGSKGSVRINLDNITASKNGDGRVVQDLNQNGQEDVFKKFRRSSFRFPFDRKQSKDLAVRYGQTQTYGSQEDNREEAKKVSIGINTERPYDQDLGRNDHDRPGDHNDQVATRKIRYMSEENTQVGEEPGTSVGCDETTENGAQRSSRDRNQRTNSVEIQCDGPSHTREPHTGSTKKEFPESAADEGNYVQLCSGHAVMCPCPALAPSPRSVRTCAGGLAAAPPNILRLCRCGDRVNRHTPHTSTATPEPPRPSTASPTPCPYDETVTISGPSSPDTTEPGATCDLDTQRTDETGPTDYISPGEEKATSTLSESYGTTDYSCLSEGEVPAEGGKRLSATEDKMLEAIGSRSDKMEEALRAISEELTRCRELLQGRGAVHSPKTSREVSMMTEEVVPIALKRADAKLRLRDSYTPKCIFTLHVGTVVLSDQAVLLSHDKSLLLTWRFYNQTPSMTRLLAGRVMNFDFSTEYDLKITEHFLYYLKHEEMPITISEMDKQDEAFAICSLPLRDALLHPNRRVDMSLALVAGRQMTRERGSADCEEAGVLDVWCMLRVDPSALPAINTAIIRPSSLKSQQHSSSIMEQMLDDDQSSDYRYSRDLHRRSKRTTVVSTDENLQSLDITIQWLALNEDCKAMIDPNVRRLYVAYTFLGRSGADMETPVSLPKPKHYMDKCHFLFKKTFIVNECDMVTLGHLAQCHEPANEPDPQCAVVFSVVSEPAEDPLGLDSCEDIGYAYLYLGDVLASSSTETYNGVLVVRDPRGVDCGALALRLDGLTLLRRCRDLAGNASH-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: