MonarchBase - Protein-coding gene

DPOGS210040
Transcript	DPOGS210040-TA	1263 bp
Protein	DPOGS210040-PA	420 aa
Genomic position	DPSCF300017 - 1400938-1424947
RNAseq coverage	174x (Rank: top 50%)

Annotation
*Heliconius*	HMEL006467	5e-81	90.51%
*Bombyx*			%
*Drosophila*	CG18769-PC	4e-82	48.15%
EBI UniRef50	UniRef50_UPI00017924E6	2e-101	65.04%	UPI00017924E6 related cluster n=1 Tax=unknown RepID=UPI00017924E6
NCBI RefSeq	XP_316356.3	8e-105	65.44%	AGAP006330-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|158295687	2e-103	65.44%	AGAP006330-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|91082059	3e-102	67.27%	PREDICTED: similar to LOC100037005 protein [Tribolium castaneum]

Group
KEGG pathway
InterPro domain	[162-369] IPR006769	8.5e-55	Coiled-coil domain containing protein 109, C-terminal
Orthology group	MCL14891		Single-copy universal gene

Nucleotide sequence:

>DPOGS210040-TA
ATGAAGTTGGAAGATGTGGCGAAGTACGATAATCAATTTTCTTTAATTTCTATTCCTCCTAATATTTATTTATCAAAAGAAGTATTAGTGACATACCGGCGTGGCCTGCCTGTGATAACAGTGCCTCTGCCGTCAAGACGGGAACGTTGTCGGTTTACATTAAGACCAGTGTCGCAAACCGTCGGAGATCTCCTCGAACAGGTGAAAGCGGAAGACCGTGGTGTTGAGCGCGCGGTTGCTTTGGCCGCTGATGAACGTGTGAGAATTGCAGCCAGTGACACCGTAGAGTCACTGCTGGAAAACGACTTCAGGCTCTTGATCAATGACACTGAATACTACGTCAAGAGTCCGCCACAAGTAAAAGTATTAGTGACATACCGGCGTGGCCTGCCTGTGATAACAGTGCCTCTGCCGTCAAGACGGGAACGTTGTCGGTTTACATTAAGACCAGTGTCGCAAACCGTCGGAGATCTCCTCGAACAGGTGAAAGCGGAAGACCGTGGTGTTGAGCGCGCGGTTGCTTTGGCCGCTGATGAACGTGTGAGAATTGCAGCCAGTGACACCGTAGAGTCACTGCTGGAAAACGACTTCCGGCTATTGATCAATGACACTGAATACTACGTCAAGAGCCCGCCACAAGAACGTCTAAGCACCGAAGAGATAACTCGTCTAAGCGATGTTCGTAATCTCGTTAACCAGCTGTACGAGGCTCTGAACGTCCGTGAGCACCAGATCAGAAAAGAACGTGAACTGAGGAGCCAGCTGGAAAAACTAACAGCCGAGCTGCAGCCTTTAGAAGAGAAACGCATGACGTTAGAGCATGAGACGGCTCGTTCGACGTCAGCCCTCACTTGGGTGGGTTTGGGTCTTATGGGGGTTCAGTTCGGGGTTCTGGCTCGTCTAACCTGGTGGGAATACTCCTGGGACATCATGGAGCCGGTCACGTACTTCGTGACTTACGGAACGGCCATGGCGGCGTACGCCTACTTCGTGCTGACGAAACAGGAGTACATTCTACCTGATGTCAAGGATAGACAGCATCTGATCACTTTGCACAAGAAGGCGAAAAAAATTGGTCTCGACATAAATCAGTACAACCATCTTAAAGATGAGGTTGACAAATTACAAAAGGATCTAGCTCGTCTGCGGGACCCCCTTCAGATACATCTGCCAGTGAACAGAATGGACGAAGCGAAGCGCTCCCCGCTCACCAAGATCAAAGACATGCTCGAAGAGACGACCAAAAAAATGAAAATAACGTAA

Protein sequence:

>DPOGS210040-PA
MKLEDVAKYDNQFSLISIPPNIYLSKEVLVTYRRGLPVITVPLPSRRERCRFTLRPVSQTVGDLLEQVKAEDRGVERAVALAADERVRIAASDTVESLLENDFRLLINDTEYYVKSPPQVKVLVTYRRGLPVITVPLPSRRERCRFTLRPVSQTVGDLLEQVKAEDRGVERAVALAADERVRIAASDTVESLLENDFRLLINDTEYYVKSPPQERLSTEEITRLSDVRNLVNQLYEALNVREHQIRKERELRSQLEKLTAELQPLEEKRMTLEHETARSTSALTWVGLGLMGVQFGVLARLTWWEYSWDIMEPVTYFVTYGTAMAAYAYFVLTKQEYILPDVKDRQHLITLHKKAKKIGLDINQYNHLKDEVDKLQKDLARLRDPLQIHLPVNRMDEAKRSPLTKIKDMLEETTKKMKIT-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: