MonarchBase - Protein-coding gene

DPOGS209498
Transcript	DPOGS209498-TA	2970 bp
Protein	DPOGS209498-PA	989 aa
Genomic position	DPSCF300127 - 122701-130588
RNAseq coverage	38x (Rank: top 73%)

Annotation
*Heliconius*	HMEL016022	4e-140	82.58%
*Bombyx*	BGIBMGA007341-TA	3e-146	67.40%
*Drosophila*			%
EBI UniRef50	UniRef50_B0W012	3e-39	34.18%	Putative uncharacterized protein n=4 Tax=Culicidae RepID=B0W012_CULQU
NCBI RefSeq	XP_001842046.1	5e-40	34.18%	conserved hypothetical protein [Culex quinquefasciatus]
NCBI nr blastp	gi\|170028325	1e-38	34.18%	conserved hypothetical protein [Culex quinquefasciatus]
NCBI nr blastx	gi\|170028325	1e-48	34.10%	conserved hypothetical protein [Culex quinquefasciatus]

Group
KEGG pathway
InterPro domain	[377-486] IPR012462	2.4e-20	Peptidase C78, ubiquitin fold modifier-specific peptidase 1/ 2
Orthology group	MCL14646		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS209498-TA
ATGTCGAGCAGCCCTTTCCCATACACGTGTGAGTTATGCGGGGCTGAAGGCCTCACAGACGAGGGTATGCGGTCGCATACTCTGGAGGCCCACGTGGCCGGAAGACCAGACTGCCCCTTCTGTGACTGCACCGTCCCGCAGCCACAGCTCGTAGGACATGTACAACGAGCACACCTACATTACCTGACGCCGGAAAGAGAACTCATGGCGTTCATTGATGATCAGAGCCCAAGTTTCGAAGAAGATTCCAAAATGACGACAACAGATAGCTGCAGTTACAACACGCCGGGCTCTATGAACGGTTGGCACAGCCCCGAGGCGGCGTCCTACCACAACGGCGCCATTTCAAAAAACTACTACAACGGCTTCCAAGACAAAGATAATTATAGAGAAAAAGATGACGATAAATACTCTCGTTCGCCCAAAAATATAAACCTTACCAACGGCATGAAAAGCATGAACATTAATAATACAGCGAAAAAGAAATGCAGCAGAGAGAACTCCATCGACCGCGATTACATTAATGGACACGATAAAAAAGCTGCACATACTAACTCAAACCATAACAGTAACGATAGCTCACCAAACAAAAATAAACTAACAATGGCAAGTGCAGGTCAAGGGTCGCCTCTTAGGTCACAACTGGCACTTAAACTGAAGTCCAATACACCTAAAAAGAATGCGCCAACGCCTAGCCCAACAGTGCAGTGTCTTCTATGTGACTTTAAGTCGACATGTCCAAGAAAACTCGAAGAGCATATAAACCGGGCTCATTTTGATTTAACTTCTCCCTCAGTGTTGGGAAATGCCAATGATAACTCCAATATTACTAACAACGCCACACTAAGTCTTAGTAACGCCACCATAACCCTGGATAATCCAACCCTGGCGTTAAGTGCTATGTCAATATCACCAGGACCGCATTCCTCGAGCTACCAATGTCCTATATGCGAAGTCGAATTTTCCAATGGGTCGGAAGTCGAGGTTCACGTCAATGTTGAGCACAGGGATATCTTAAGCCCACAGAAATCTGATCAAGCAGACAATGCCTTGTGTGATGATGTAGTTATGATGGAAGAGAGTCCTGTCAGTAACTGTCCTGTCTGCTGTCAACCATTGCCACTGTCACAACATGACTGTCAGTTGATAGACTTCCATAAACCGACGGCGGCTGACGGCTCCCATCCTGCGCTCTTCGACTATGTCCTGAGATACTTCACACACGATCCAAACGCTTTCAAACCGCCGTTATACCTTCAACATCAAGGTCACTCCAGAACAATCATTGGCTACGAAAAACACAAGGACGGTAAGGCGACACTGCTAGTTTTGGACCCGTCGCATTCCCCGGCACAGGTGCGACAGGTGTCTGTGGGGTCGTGGTCGTCAGCGGCGAGCGCGCTCCGCCTGCTGAGACGAGGAGCCCCTGCGCTGCGAGCGAGGCAATACCAGCTGCTGTGTGTGGACGGACTCATTACCACCGACCAGGAGTACCAGGTGATGTACCACCTACCCCCTACATGTACCACCTACCACTTCCATAGACAACATATAGATGGTCTTATTACCATTGACCAGGGGTACCAGGTTATGTACCATCTACCCCCTACATGTACCACCTACCACTTCCATAGACAACATATAGATGGTCTTATTACCATTGACCAGGGGTACCAGGTTATGTACCATCTACCCCCTACATGTACCACCTACCACTTCCATAGACAACATATAGATGGTCTTATTACCATTGACCAGGGGTACCAGGTTATGTACCATCTACCCCCTACATGTACCACCTACCACTTCCATAGACAACATATAGATGGTCTTATTACCATTGACCAGGGGTACCAGGTTATGTACCATCTACCCCCTACATGTACCACCTACCACTTCCATAGACAACATATAGATGGTCTTATTACCATTGACCAGGGGTACCAGGTTATGTACCATCTACCCCCTACATGTACCACCTACCACTTCCATAGACAACATATAGATGGTCTTATTACCATTGACCAGGGGTACCAGGTTATGTACCATCTACCCCCTACATGTACCACCTACCACTTCCATAGACAACATATAGATGGTCTTATTACCATTGACCAGGGGTACCAGGTTATGTACCATCTACCCCCTACATGTACCACCTACCACTTCCATAGACAACATATAGATGGTCTTATTACCATTGACCAGGGGTACCAGGTTATGTACCATCTACCCCCTACATGTACCACCTACCACTTCCATAGACAACATATAGATGGTCTTATTACCATTGACCAGGGGTACCAGGTTATGTACCATCTACCCCCTACATGTACCACCTACCACTTCCATAGACAACATATAGATGGTCTTATTACCATTGACCAGGGGTACCAGGTTATGTACCATCTACCCCCTACATGTACCACCTACCACTTCCATAGACAACATATAGATGGTCTTATTACCATTGACCAGGGGTACCAGGTTATGTACCATCTACCCCCTACATGTACCACCTACCACTTCCATAGACAACATATAGATGGTCTTATTACCATTGACCAGGGGTACCAGGTTATGTACCATCTACCCCCTACATGTACCACCTACCACTTCCATAGACAACATATAGATGGTCTTATTACCATTGACCAGGGGTACCAGGTTATGTACCATCTACCCCCTACATGTACCACCTACCACTTCCATAGACAACATATAGATGGTCTTATTACCATTGACCAGGGGTACCAGGTTATGTACCATCTACCCCCTACATTGAAACGACCAATGGTTATTCGTCTAGGATTGTTGGTAGATTTGGAAACGACTTGGAAAATTGTGTCACATTTTACATTGCTTCCCCGTAACGTGAGCGACTCTGTGTCGATAGTCTCGCTTGGGTCATTTTGTTTGGACGCCGGCTCGTGGTTGTGGTCGGTGCAGTACTCGGTAGACGTGGATTAG

Protein sequence:

>DPOGS209498-PA
MSSSPFPYTCELCGAEGLTDEGMRSHTLEAHVAGRPDCPFCDCTVPQPQLVGHVQRAHLHYLTPERELMAFIDDQSPSFEEDSKMTTTDSCSYNTPGSMNGWHSPEAASYHNGAISKNYYNGFQDKDNYREKDDDKYSRSPKNINLTNGMKSMNINNTAKKKCSRENSIDRDYINGHDKKAAHTNSNHNSNDSSPNKNKLTMASAGQGSPLRSQLALKLKSNTPKKNAPTPSPTVQCLLCDFKSTCPRKLEEHINRAHFDLTSPSVLGNANDNSNITNNATLSLSNATITLDNPTLALSAMSISPGPHSSSYQCPICEVEFSNGSEVEVHVNVEHRDILSPQKSDQADNALCDDVVMMEESPVSNCPVCCQPLPLSQHDCQLIDFHKPTAADGSHPALFDYVLRYFTHDPNAFKPPLYLQHQGHSRTIIGYEKHKDGKATLLVLDPSHSPAQVRQVSVGSWSSAASALRLLRRGAPALRARQYQLLCVDGLITTDQEYQVMYHLPPTCTTYHFHRQHIDGLITIDQGYQVMYHLPPTCTTYHFHRQHIDGLITIDQGYQVMYHLPPTCTTYHFHRQHIDGLITIDQGYQVMYHLPPTCTTYHFHRQHIDGLITIDQGYQVMYHLPPTCTTYHFHRQHIDGLITIDQGYQVMYHLPPTCTTYHFHRQHIDGLITIDQGYQVMYHLPPTCTTYHFHRQHIDGLITIDQGYQVMYHLPPTCTTYHFHRQHIDGLITIDQGYQVMYHLPPTCTTYHFHRQHIDGLITIDQGYQVMYHLPPTCTTYHFHRQHIDGLITIDQGYQVMYHLPPTCTTYHFHRQHIDGLITIDQGYQVMYHLPPTCTTYHFHRQHIDGLITIDQGYQVMYHLPPTCTTYHFHRQHIDGLITIDQGYQVMYHLPPTCTTYHFHRQHIDGLITIDQGYQVMYHLPPTLKRPMVIRLGLLVDLETTWKIVSHFTLLPRNVSDSVSIVSLGSFCLDAGSWLWSVQYSVDVD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: