MonarchBase - Protein-coding gene

DPOGS210169
Transcript	DPOGS210169-TA	3057 bp
Protein	DPOGS210169-PA	1018 aa
Genomic position	DPSCF300352 + 122864-137686
RNAseq coverage	175x (Rank: top 50%)

Annotation
*Heliconius*	HMEL017372	5e-55	59.40%
*Bombyx*	BGIBMGA013922-TA	2e-34	40.00%
*Drosophila*	Incenp-PA	4e-17	28.68%
EBI UniRef50	UniRef50_UPI00020647C1	8e-22	35.67%	UPI00020647C1 related cluster n=1 Tax=unknown RepID=UPI00020647C1
NCBI RefSeq	XP_001986730.1	3e-17	29.51%	GH21527 [Drosophila grimshawi]
NCBI nr blastp	gi\|383855744	2e-21	32.77%	PREDICTED: uncharacterized protein LOC100880529 [Megachile rotundata]
NCBI nr blastx	gi\|345484715	3e-47	24.74%	PREDICTED: hypothetical protein LOC100679418 [Nasonia vitripennis]

Group
KEGG pathway
Orthology group	MCL21035		Lepidoptera specific

Nucleotide sequence:

>DPOGS210169-TA
ATGTCAATTTTTAGTGAATTGCTACCAAAACTAAATGAAATATCAAATGCGTTTACTAAAAATTTTAACGATGACCTCGAGGCCGCATTCCTCTCATTGGATAAGTTAAAGGATGAATATCTGAATTCCAAGAGTAAAAGCCGCGATAAGTCTCAAAAGGATAAGAATCATACGACAATCCTTCAAAGTATACACGAGGACGAAGATGAAACACCCAAAGCTGATGAACCGTCAGATAACACGGAGCAAAGACCTAAGAAACGTAGCAAACATGAAGTGGAAGGTATGGAGAGTCCTGAAATTGAAAAACGACAGAAACGCAAGGCATCCGTTAAAGCTCAAAGCATTATTAGCAAACAAGTCAGAGGACAAGTCAGAATTTTTGATGGAAACATCATTGTGCTATCTCCAGATGTGGCCGCATTCCTCTCATTGGATAAGTTAAAGGATGAATATCTGAATTCCAAGAGTAAAAGCCGCGATAAGTCTCAAAAGGATAAGAATCATACGACAATCCTTCAAAGTATACACGAGGACGAAGATGAAACACCCAAAGCTGATGAACCGTCAGATAACACGGAGCAAAGACCTAAGAAACGCAGCAAACATGAAGTGGAAGGTATGGAGAGTCCTGAAATTGAAAAACGACAGAAACGCAAGGCATCCGTTAAAGCTCAAAGCATTATTAGCAAACAAGTCAGAGGACAAGTCAGAATTTTTGATGGAAACATCATTGTGCTATCTCCAGATGTGGTAAATGTAAATCTAACTGAGAAACTCCGTAGAGAGAACTCAACTCAGAAGCGCAGGCGCCGAAAAGACGACGACAAAGAAAACGACCCCGAACCGACAATACGGAGTACGTACGTAAAAGAAGAGAAAATTTCACTCCCTCCCGAGCCAATAGATATCGAATCCGTGCCAGTCAATGTGGAAGTGAAGCAGGAGTTCAAAGAGGAAATAGCAATGCCGCCTCCGCCTGTACCGACCGCGCGACCCGTCCGCTCGAGTCGTGCCAGACTCACAGAACAAGAAGACAGAGAAGGAAACAGGAGAACCAGGGGGAAGAAGGCTCAAGAAACATCAACCGTTGAGGCGGAAAAGGAAACTTCTGTCGAAAACGTAACCGCGTCCCCGGCTGAGAAACCGCGGCCGAAACGTACGAGGAGAGCGAGAAAAGTTTCTGAAAAACAAGAAAACGAAGATAAAATTGAAAACGACATTGAAAAAAAGGAAAGTGATTTGGAAATAAAACCAGTAGATACGTCAGACAGCGAGGCGCGGTCGCCCGTGCTGCAGACGATAGTGCCGAAGACGAAACTCAGGGTGCGCGAGGACTGCGGAGACGACGCAGACCAGCAGGGGCGGGGCGCGCGGGCCGCGGGCGAGCAGCCGGCCGAGGGCGTGCGCGGCCTGGACTGCACCGTCACCATCAGCTGCCACATGGATGACACGGTCGTGCTGCCGCAGGCCGAGTGCCCGCGCGCGCCCGACACGCCCCCGGCGGCGAGGAAAATGAACGAGACGGTGGTGCTAGACAAGCAGAACAGAACAGAAGACAAGCGGAACGACGGGATAATGAACGAAACAGTGGTGTTGGAGAAAGGTGACTATACACAAAGAACTTCTATAATAAGGCTGCAGCTGAACCGGGCGACGACTCGCTGGGGGGCCGCGGGCGAGCAGCCGGCCGAGGGCGCGCGCGGCCTGGACTGCACCGTCACCATCAGCTGCCACATGGATGACACGGTCGTGCTGCCGCAGGCCGAGTGCCCGCGCGCGCCCGACACGCCCCCGGCGGCGAGGAAAATGAACGAGACGGTGGTGCTAGACAAGCAGAACAGAACAGAAGACAAGCAGAAGGACGGGATAATGAACGAAACAGTCGTGTTGGAGAAAGATAAGGCTGCAGCTGAACCGGGCGACGACTCGCTCTTGACTGACGACGAATCGCTGGAAATGAAGACGCCGCCTAACAGACAGCCGCCGGAGCCCACTTCCGCTGTGAAAGAGAAAGTGCAACAGTTTGAAGAAATGGCTACGAGAGTGACCCGCACTAAGACTAGAGCTATGACTAAAAAGGAGGTCCCAGTCGACCCAGACACTCAGACGCCGCCGGACAGGACGAGGCCGGTTATATCGACGGACACGCTCAGCAAGATGAACAACCTCATATTCAACGGAAAACCACCGCAGATATCATCGTCGGCGTCGAAGCCTCGTTCTAACATCCCTATGAAGACTTCGGTAACAGCCTCCGCCTCTAAGATAAGTGTCGCCAGAGACGACGAGAGAAGAGAAAAAGAGGACGCGAGAAGGAAGAAGGAGGCGATGCTAGAGGCTAAGAAGGAGATGCAACGAAGAAAGAGGGAAGAGAAAATGTCAGCGGCTGCAGCGGCTAGAACGGCGGCTGAGAACATGAGACGTGCAGCGCTTCAAGCAGCCGAGAAGGAAAGACGGGAGAGGCAGATACAGGCCGACCAGGGGAGGATGGATAGACTTAAAGAGGTCGAGAAGAAAAAGTTGGAGCAAGCACGTAAGGCTGCCGAGACAGAGGAACGAAGGAAGCTAGAGGAAGCTGCACGAGCCAGTAGACTGCAGAACGAACAAAGGAAAGTCGAGGAGGCTAGGAGGAGGCAGCTGGAGGAGGAAAAGATCATGAAGAAGGAAGCAGCTCAAATGCAGAAAGAGATAGAGCGGAGACAACGAGAGTTCATGGAGAGAATGAAGATGAAGAAATTAGAGGGAGACAGAACACCCAACAAGATGGCGGCCATAGAGCCCGTGTACATGCAGGACGGCTTCCAACACCTCAACTCCGACGAAGAAGAACCCCCGGAGAGACCACCACCAGTATGGAGCACCTCCAAGAATCGTCGCATTCAACTGTCGATCCAGTCCCGTATCAGCCAGCATCACATCGACCGTCTCTTCTCAGTGAGGGAGCACACTCCGGACCTAAGGGAGATCTTCCCTAACATAGAGCGAGCCCGCCTCAAGAGAACGTCCTCCGCCGTTTGGAGGACACCGCCCAGGCTGGCCACGCTCGACGAGTGA

Protein sequence:

>DPOGS210169-PA
MSIFSELLPKLNEISNAFTKNFNDDLEAAFLSLDKLKDEYLNSKSKSRDKSQKDKNHTTILQSIHEDEDETPKADEPSDNTEQRPKKRSKHEVEGMESPEIEKRQKRKASVKAQSIISKQVRGQVRIFDGNIIVLSPDVAAFLSLDKLKDEYLNSKSKSRDKSQKDKNHTTILQSIHEDEDETPKADEPSDNTEQRPKKRSKHEVEGMESPEIEKRQKRKASVKAQSIISKQVRGQVRIFDGNIIVLSPDVVNVNLTEKLRRENSTQKRRRRKDDDKENDPEPTIRSTYVKEEKISLPPEPIDIESVPVNVEVKQEFKEEIAMPPPPVPTARPVRSSRARLTEQEDREGNRRTRGKKAQETSTVEAEKETSVENVTASPAEKPRPKRTRRARKVSEKQENEDKIENDIEKKESDLEIKPVDTSDSEARSPVLQTIVPKTKLRVREDCGDDADQQGRGARAAGEQPAEGVRGLDCTVTISCHMDDTVVLPQAECPRAPDTPPAARKMNETVVLDKQNRTEDKRNDGIMNETVVLEKGDYTQRTSIIRLQLNRATTRWGAAGEQPAEGARGLDCTVTISCHMDDTVVLPQAECPRAPDTPPAARKMNETVVLDKQNRTEDKQKDGIMNETVVLEKDKAAAEPGDDSLLTDDESLEMKTPPNRQPPEPTSAVKEKVQQFEEMATRVTRTKTRAMTKKEVPVDPDTQTPPDRTRPVISTDTLSKMNNLIFNGKPPQISSSASKPRSNIPMKTSVTASASKISVARDDERREKEDARRKKEAMLEAKKEMQRRKREEKMSAAAAARTAAENMRRAALQAAEKERRERQIQADQGRMDRLKEVEKKKLEQARKAAETEERRKLEEAARASRLQNEQRKVEEARRRQLEEEKIMKKEAAQMQKEIERRQREFMERMKMKKLEGDRTPNKMAAIEPVYMQDGFQHLNSDEEEPPERPPPVWSTSKNRRIQLSIQSRISQHHIDRLFSVREHTPDLREIFPNIERARLKRTSSAVWRTPPRLATLDE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: