MonarchBase - Protein-coding gene

DPOGS214134
Transcript	DPOGS214134-TA	2673 bp
Protein	DPOGS214134-PA	890 aa
Genomic position	DPSCF300014 - 1340053-1358426
RNAseq coverage	555x (Rank: top 23%)

Annotation
*Heliconius*	HMEL002505	83.50%
*Bombyx*	BGIBMGA006181-TA	79.85%
*Drosophila*	CG17684-PC	51.80%
EBI UniRef50	UniRef50_UPI0002247153	54.14%	UPI0002247153 related cluster n=2 Tax=unknown RepID=UPI0002247153
NCBI RefSeq	XP_001688473.1	50.63%	AGAP005043-PB [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|340721639	57.24%	PREDICTED: dipeptidyl aminopeptidase-like protein 6-like isoform 1 [Bombus terrestris]
NCBI nr blastx	gi\|350404853	57.24%	PREDICTED: dipeptidyl aminopeptidase-like protein 6-like isoform 1 [Bombus impatiens]

Group
Gene Ontology	GO:0016020	1.9e-53	membrane
	GO:0006508	1.9e-53	proteolysis
	GO:0008236	2.5e-29	serine-type peptidase activity
KEGG pathway
InterPro domain	[195-560] IPR002469	1.9e-53	Peptidase S9B, dipeptidylpeptidase IV N-terminal
	[687-877] IPR001375	2.5e-29	Peptidase S9, prolyl oligopeptidase, catalytic domain
Orthology group	MCL16464		Insect specific

Nucleotide sequence:

>DPOGS214134-TA
ATGACCTCCGTGTCCGCAGACTCGCAGACTCGCCACAATCCGACCGAACATGCATCACCTGATGGGGCTGTCCGTGTTCCGGTGTGTCGCGAGTGTCGCGTCTGTGGCGTCCGTGGCGTCTGTGGCGTTTGTGGCGCGCGTGTCAGTGTCGCGGGCGAGGTGGTGTGCGGGCGCGTAGGGCTGCGCGGTGGCGGGTGCGCGCGCGGCTCGGCCGGCTCGGGCGGCGGCGCATTATCTGCGAAGGAAGAGGACCTGTACCCCGGCGATGGACACAATTGGAGAAGCATCATATTCTCATTGATGGTCATCAGTTTTGTGATAGCAGGCATTGTCACAGCGATTTACTTATTGGGATATGTGGACGAGCTGCTGTACTGGTCGGGGCGTCGTATGAGGCTGGACGAGTTCCTGCGAGGAGACCTGACTGGCGAACGTCTGCCGACCACGTGGGTCAGCTCACACCAGCTCGTGTACCAGGCGGACGACGGAGGTCTACTCGCCCTGGACACCTTCAACAATACGCTATACGTGCTCGTCACAAACCACACTCTCAGGCAGCTCAATGTGCGAGGGTATCAATGCTCGCCAAATCTACGCTTCGTGCTGTTCCAACACAACATCAAAGAGGTTTACCGACGGACTTTTACTGCGCATTACACGGTTTATGACGTCACAAATGACCACCATATCCCCCTCTTCGGCGAGGGTCAGAGCAGTTGGGAGTGGCAGCACGCGGCTTGGCTCGGTACAGAAGGTGCTATCGTACTGGCTGCAGACAACGAGGTCTTGGCGAGACCAGCACCTCCTGCACGAAGAGCTCCCTTACTTCGACTTACAAATGATGCTGTCGCGGGCAGCGTTTATAACGGGGTGTCGGATTGGTTGTACCAAGAGGAGGTGACAAAAGAATCATCAGCGACTTGGGGATCATCAGACGGGGCTTTCGTGTTATATGTCCAGTACGATGACAGGAAGGTGTCTCAGATGAGGTTCCCACATATTTCCTCCGGGATAGGTGGCGCTGGTGCCTCCAGATCAGGGTTTTTGCTTCCCGCTTTCAACAACAGTAACCCAACCATTTTCCCTGATCACGTAACGATCAGATATCCCACGCCCGGTAGTTCAATACCTCTCGTTAAGTTGTGGATAGTTGCGGTACAAAACGTAACATCTCCACCCAGGTGGGAAGTAAAACCTCCAAGTACATTAGATGGCATGGAATATTATCTCATATCAGCCCAATGGGTGGGCAAAGAAAATTCTCATATAGGAGTAGTTTGGATGAACCGTGCACAGAATCTAACTACCCATTCAGAAAAAGCCACTGATGAGCCTTGGTTAGAAGTTCATCAGCGTCCGGTTTACTCAGAAGACGGCAGTGCTTTTCTACTTCTAGCAGCAGTCCAAGAAGGCGGAGGCCAATACTATACTCATATTAAGCATGTTGATGTCCTCCGTCAACGCATAGCTGTTCTATCGCACGGTAAAGTGGAGGTGGCGAAGATCCTGGCGTGGGACCAGGAAAACAATTTAGTTTATTATTTAGGTAGCGCAGATAGACCGGGCCAGAGGCAGGTGTACGTGGTACGTGATCCAAGCTACGGAGGAGCTAGCAACTCCGTCAGAGCTAGAGCTGAACGCGAGGAACCACGTTGCCTTACGTGTGAGTTGGCTGTATGGCCTGCTCGGCTTCATTACGCCAACTGCACTTTCTGGAGCGCGACGTTCCCACCTCCTAAGCCGAAGCGTGGTATAACTCATTACGTTCTGGAGTGCAGAGGTCCTGGGCCTCCACTCGCAGGTCTTCACGATGCCAAGACTCATAAGTTAGAGAGAATTTTATACGATACGAGGCCTTATAGATCTGTACGATTACGTGAGTTGGCATTACCTTCTCGTAGATCATTTGATGTACAATTGAGTAGTGGCTCTAAAGCCCGTGTACAGCTTCTGCTGCCGCCGTCTTGGAGAGAAGAACTCCGTGACGCAGCATTTCCTGTACTAGTTCACGTAGACGGTCGCCCTGGCAGTCAACAAGTGACAGATGAATTCCTGGTAGACTGGGGAACGTATATGTCCTCACGTAACGACGTAGTTTACGTTAAATTAGATGTAGCAGGCGCTAAAGGGCTACCCCGAGCGCTGTTACGAGGTCGCCTCGGTGGGGTCGAGGTGGCCGATCAATTGGCTGTTATTAGATATTTATTAGAAACATTTAAATTCTTGGATGTAACTCGTGTTGCTGTTTGGGGATGGGGTTATGGTGGATATGTAACGTCAATGTTGTTGGGGTCTCAGCAGTCTACTTTAAAGTGTGGTATAGCGGTGTCACCGATCACAGACTGGCTGTATTACAACGCAGCATTCACGGAGCGTATCCTGGGCCAACCGTCAGTTAATTATAAAGGGTATGTGGAGGCTGATGCGTCCCAGCGCGCGCACCACGTGCCGCCGCACGCGTTGTACCTCGTGCACGGGATGGCAGACATGAGCGCGCCGTACCCTCACGCTCTGCAGTTGGCTAGGGCCTTGACTGATGCTGGAGCGTATGCTGATGAAGGACACGACCTTGAAGGTGTTATCGAGCATGTTTACCGGTCAATGGAAGATTACCTCCTAGAGTGCTTGTCCCTCGACCCAGAAGACACCAAGCTGCCTCCGCCAGATAGATAA

Protein sequence:

>DPOGS214134-PA
MTSVSADSQTRHNPTEHASPDGAVRVPVCRECRVCGVRGVCGVCGARVSVAGEVVCGRVGLRGGGCARGSAGSGGGALSAKEEDLYPGDGHNWRSIIFSLMVISFVIAGIVTAIYLLGYVDELLYWSGRRMRLDEFLRGDLTGERLPTTWVSSHQLVYQADDGGLLALDTFNNTLYVLVTNHTLRQLNVRGYQCSPNLRFVLFQHNIKEVYRRTFTAHYTVYDVTNDHHIPLFGEGQSSWEWQHAAWLGTEGAIVLAADNEVLARPAPPARRAPLLRLTNDAVAGSVYNGVSDWLYQEEVTKESSATWGSSDGAFVLYVQYDDRKVSQMRFPHISSGIGGAGASRSGFLLPAFNNSNPTIFPDHVTIRYPTPGSSIPLVKLWIVAVQNVTSPPRWEVKPPSTLDGMEYYLISAQWVGKENSHIGVVWMNRAQNLTTHSEKATDEPWLEVHQRPVYSEDGSAFLLLAAVQEGGGQYYTHIKHVDVLRQRIAVLSHGKVEVAKILAWDQENNLVYYLGSADRPGQRQVYVVRDPSYGGASNSVRARAEREEPRCLTCELAVWPARLHYANCTFWSATFPPPKPKRGITHYVLECRGPGPPLAGLHDAKTHKLERILYDTRPYRSVRLRELALPSRRSFDVQLSSGSKARVQLLLPPSWREELRDAAFPVLVHVDGRPGSQQVTDEFLVDWGTYMSSRNDVVYVKLDVAGAKGLPRALLRGRLGGVEVADQLAVIRYLLETFKFLDVTRVAVWGWGYGGYVTSMLLGSQQSTLKCGIAVSPITDWLYYNAAFTERILGQPSVNYKGYVEADASQRAHHVPPHALYLVHGMADMSAPYPHALQLARALTDAGAYADEGHDLEGVIEHVYRSMEDYLLECLSLDPEDTKLPPPDR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: