MonarchBase - Protein-coding gene

DPOGS213778
Transcript	DPOGS213778-TA	3378 bp
Protein	DPOGS213778-PA	1125 aa
Genomic position	DPSCF300212 + 462780-466386
RNAseq coverage	1967x (Rank: top 6%)

Annotation
*Heliconius*	HMEL010402	0.0	74.57%
*Bombyx*	BGIBMGA009263-TA	0.0	68.88%
*Drosophila*	CG13003-PB	3e-53	42.50%
EBI UniRef50	UniRef50_UPI00021A6D06	1e-103	31.75%	UPI00021A6D06 related cluster n=2 Tax=unknown RepID=UPI00021A6D06
NCBI RefSeq	XP_001603237.1	2e-59	40.13%	PREDICTED: similar to RE03018p, partial [Nasonia vitripennis]
NCBI nr blastp	gi\|340715010	5e-103	31.75%	PREDICTED: hypothetical protein LOC100646063 [Bombus terrestris]
NCBI nr blastx	gi\|350417203	2e-125	32.00%	PREDICTED: hypothetical protein LOC100740269 [Bombus impatiens]

Group
KEGG pathway
Orthology group	MCL18348		Insect specific

Nucleotide sequence:

>DPOGS213778-TA
ATGACAGTCGATTTTGTCGCAGACCTCGCGGCCTTCCTGCTTCGTGGTCATTACTTCTTAATTTCCAAATTAAACGGTTGGTTCTCAATGCCACCTAGATCGAAGATGGTGAGAGGGGCGACGTCAGTGCTGACCATAGCGCTGGCATGGGCGTGCGTGGTTCGTTCTAGCGTCCTTGTGCCCACCTACGTGTTGCCGCCTGACTCGTTCGTTCGTGACCAACGATCTCTCGACACACGATCTGACAGCGACACCTCCGAATCACAGCGTATGATAAAACGGCTGATCGGAGGGCATATGAAAATCAAAGCTGAAAAAGATCATGGCAACCCTAAAAACTCGATTAAACTGGACTCAAAGAGTGAAAGTTCTAAATTCGCTGGAGTAATCTTGCCGGACCTTTCAGGCGGCACCGTGGGTTGGAACCAAGGTATCTGGGATGACGGCATGCTCATGTCCAGCGCGGGAGCGGGGAAGGATACGGGAAAAATGAAAGAGGATGATGAGGACAAAAAAACCTTATCAGACCAAGTGGCTGAAGGAAAATACGGATTAATACAAAATGAAATATTCTCCAAGGCACCGAAACGTCCTGGTATATTAAGCTATGAGCCCAATTCCGAAACAAGAACTAAAGATAATGTGCAAAGTCTTGGCGGCCTTAAAAAGGAAGAGATATGGCTCGCTGAGGACCACCTCCTGGTTTTAAAAGGAGGCTCATTCCCAGAACGTTCCCAGGAAGCTGAAAATAACCCGTGGCCACCAATAGACAACTATGAGGCGCCCAGGAGGCAAGTAAAGCTACCACAGAAACCAAAAGTACCACCGCCCTTTCCGGTTCGACTCTCCGACGACGGACCGCTCGTCTTTCTCACACCTAACGGCAGTATCCCTGCGCCCATTTACCCACCCTTCCCTACAGGAGAAGGCGAAGGCCCTCTACCTCCTTCGTCATTCCTTATTCCAGACGATGCGCCCTACCCGGAAAGTGATTATCAAAAAAACACTTCTGCCGGGCCCTCTTCGTTGCCAAGTCCTCCGTTCCCATTCCTATCCGGGAATGCGAGCGAAGGAGCATTTCCCTACCCTCCATCCATAAACGGCTCTTTTCCAGAAGGCTTTCCTCCGGGCGCAGCATTTCTACCACCACCCAGCAACCAAACCGATCTATACGACGAAGACGACCCTTCGATATATTATCCGCCGCCATACAATTTTTCCTATCACGCTGATTACAAAAGCAATGTACCAGCTGGACCTCTGGTACCTGGGATAATTTTACCACCTCCGCCAGATTTCTTTGCGCCTCTTGAGGAAAAAACAACAACGGAGACGGACAAACCTTCAAGGCCATCTCCAACCCCGACGTACTCAAGAGCAAAGACTACTACTAAACAAATAGTAAATAGAGGCAAATATAAAACAAGACCAACAACAACTGAAAGTGCACAAACGAGTGAGCTTCCTACAACGACGTCAATGCCAACAGTTGAAGTTGTAACTTCCCCGAAATACAGAAAAGTCCAACGCTTGCCACTACCTCCAAGGCAATCTTTCAGATCGCAAAATCTTCCAAAGGAACCAGTCACTAAACCCAAGACTGATAAGCCAGTTTACAAAACACGAACAAAATTGACATCAAAACCCCTTTCTGTGTCAGTAATTTATGATTACCCACAACAGGCTTACGATAATAATCCTCCCACAACTACGGAGAAACCTTACATCTATTACGAAGTGCCACAAAAAACAAAAGAAGTCGCCAATGACATAACGTCAACAGCCGTACCATTACGAGCATATTATTCAAACCATCAAAACGACGAGGTCCCAACGACAAAGTTGCAACCAGTGTACAATCGGAAACCGAATGAAGATGCTATCGCTTCGTTTTACTTCTTTGACGAACAACCTAAAAGTTCACCCAGACCTGATAACTTTTATGATGGAAGAAATTACTACAAAACTGTACCCAGTCAAACTCCATACAATCCTCAACAAAATAGCAACTCTCAAACCGGATACAGACCCACAGTCGATGTTGAATACGGATCTATCGACCAGGAAGCCCTATTTTTATGGCCGCAGAAACAAGGACCGAAAACATTAACACAAGAATACTTCAGCATACAAAAACCAAGACAACAGGTTTATGTTCAACAGATTAAACAGAGACCTGATCCATTCTATCAACAAATAGCAGATATACAACAAACTATCGAGTTATATACAACTAAGAGACCGAAATCGCATAGAACACACACCAGCAAACCTCAACACACGAACCCCAGGCCGGTGTATCAATTTAGTTTTGAAACAAACCCTCGACCTGAGAAACTGACCTTCAGAGCACCTAAACTTGACCCCGAACCATTCAGACCGATGGTTAGTTACAGTAAACCATTCAATTTACAAAACGAGTTCAATGCCATCACACCGTCTGCCTCTCCTGTTTACCATCAGCAATATCTAGTAGAAAATGTTCAAGTTACAACTGAATCTCCCACTTCATCGAGATATTATCCTAAAACCAAGACAAGGGACGATGATTACGAAGATACTGTATATCAAAAGGACACAGTTCCACAGAACAACATAAACCAGATCCCAGTAAGAACGGGAAAACCTACGATATCAATAAATAAACATCCGAGCACAACACCAAATCCAATTAGTAATGGCTATTACACTAAACAGGATGAGAAGTATTTTGACGACATCACAAAAAATTCATTTGATGTCTTTGGTCAAAAACTGGAAGACACGCAAGACGTGAATGGAGTAGCCGTCACAGAACCGATTGGCACCGTGAAGACGCCGATCGATAACAACATAAACCAACAATACTACGAAGTTATTAACGCGAATCCAAACGCACCGACTCTGAGCAAGGACACTATCGTCAACGACCGATTTCCGCGACCGACGGTCAATCCTTACAGTGTACCGATTGACCATCGACCACACAACGAAGAACTGATCGAGCAACCGAAACCGATTTCTCTATACGGTGACACGTTGGTCAACGAGAAACTTCCACGACCCATGATAAATCCAGACAGCGAGTTCATACCAATACCGGATCCTAATTACAGGAAACCCCAGCAGTATAGACAACAGAGCCAGGTTCAGAGACCTCAGTATACTGGTGAACAGTATGACCTGAACGGTCCTTCGTTAGCTGGAGATACCGCCGTGAATTACAAGCGGCCCCTACCACCAGTCAATCCGGACTCGGAGTGGATAGGACCAGTGAATTCTGGCGAAGGTCGCCCCGGATCATACGTATCGTATCGTCTGCCAGGCGACGGCGCCCACGTTTACTTCCTAACACCCCAGACGGCACAAAGATACAGAAAACCGGGTTACGGTCGTTGA

Protein sequence:

>DPOGS213778-PA
MTVDFVADLAAFLLRGHYFLISKLNGWFSMPPRSKMVRGATSVLTIALAWACVVRSSVLVPTYVLPPDSFVRDQRSLDTRSDSDTSESQRMIKRLIGGHMKIKAEKDHGNPKNSIKLDSKSESSKFAGVILPDLSGGTVGWNQGIWDDGMLMSSAGAGKDTGKMKEDDEDKKTLSDQVAEGKYGLIQNEIFSKAPKRPGILSYEPNSETRTKDNVQSLGGLKKEEIWLAEDHLLVLKGGSFPERSQEAENNPWPPIDNYEAPRRQVKLPQKPKVPPPFPVRLSDDGPLVFLTPNGSIPAPIYPPFPTGEGEGPLPPSSFLIPDDAPYPESDYQKNTSAGPSSLPSPPFPFLSGNASEGAFPYPPSINGSFPEGFPPGAAFLPPPSNQTDLYDEDDPSIYYPPPYNFSYHADYKSNVPAGPLVPGIILPPPPDFFAPLEEKTTTETDKPSRPSPTPTYSRAKTTTKQIVNRGKYKTRPTTTESAQTSELPTTTSMPTVEVVTSPKYRKVQRLPLPPRQSFRSQNLPKEPVTKPKTDKPVYKTRTKLTSKPLSVSVIYDYPQQAYDNNPPTTTEKPYIYYEVPQKTKEVANDITSTAVPLRAYYSNHQNDEVPTTKLQPVYNRKPNEDAIASFYFFDEQPKSSPRPDNFYDGRNYYKTVPSQTPYNPQQNSNSQTGYRPTVDVEYGSIDQEALFLWPQKQGPKTLTQEYFSIQKPRQQVYVQQIKQRPDPFYQQIADIQQTIELYTTKRPKSHRTHTSKPQHTNPRPVYQFSFETNPRPEKLTFRAPKLDPEPFRPMVSYSKPFNLQNEFNAITPSASPVYHQQYLVENVQVTTESPTSSRYYPKTKTRDDDYEDTVYQKDTVPQNNINQIPVRTGKPTISINKHPSTTPNPISNGYYTKQDEKYFDDITKNSFDVFGQKLEDTQDVNGVAVTEPIGTVKTPIDNNINQQYYEVINANPNAPTLSKDTIVNDRFPRPTVNPYSVPIDHRPHNEELIEQPKPISLYGDTLVNEKLPRPMINPDSEFIPIPDPNYRKPQQYRQQSQVQRPQYTGEQYDLNGPSLAGDTAVNYKRPLPPVNPDSEWIGPVNSGEGRPGSYVSYRLPGDGAHVYFLTPQTAQRYRKPGYGR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: