MonarchBase - Protein-coding gene

DPOGS204840
Transcript	DPOGS204840-TA	1722 bp
Protein	DPOGS204840-PA	573 aa
Genomic position	DPSCF300227 - 197870-202282
RNAseq coverage	205x (Rank: top 46%)

Annotation
*Heliconius*	HMEL013896	1e-112	68.79%
*Bombyx*	BGIBMGA011735-TA	0.0	68.07%
*Drosophila*	CG10948-PC	5e-70	42.39%
EBI UniRef50	UniRef50_E0VIU7	2e-95	39.00%	Putative uncharacterized protein n=1 Tax=Pediculus humanus corporis RepID=E0VIU7_PEDHC
NCBI RefSeq	XP_002426041.1	3e-96	39.00%	conserved hypothetical protein [Pediculus humanus corporis]
NCBI nr blastp	gi\|242010576	6e-95	39.00%	conserved hypothetical protein [Pediculus humanus corporis]
NCBI nr blastx	gi\|91092928	2e-105	40.24%	PREDICTED: similar to ecto-NOX disulfide-thiol exchanger 2 [Tribolium castaneum]

Group
Gene Ontology	GO:0000166	1.3e-09	nucleotide binding
	GO:0003676	1.7e-08	nucleic acid binding
KEGG pathway
InterPro domain	[106-184] IPR012677	1.3e-09	Nucleotide-binding, alpha-beta plait
	[122-175] IPR000504	1.7e-08	RNA recognition motif domain
Orthology group	MCL11019		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS204840-TA
ATGATGATGAGTGGCATGTTCAATATGATGATGCCCAATCCAATGATGGCTGGAGGGATGATGCCTTCGAGCGGAATGGAGATGATGCAGAGCACCAGTATGGAGATTATTTCACAGCCACCAATAGACATAACCGCTATGGGAACACAACCCTTAGCCGCTCCGCCTTTGACACCATCAATGGACATGAGTATGATGGGTGGTGTTATGATGGATCCATCCATTATGGGTATGTTTCCAAACATGAGTAACGAAATTGTGCCAGAGAAGAAGGAAATTGTCCTTAAGCATAGTAAGCTAGTGGCACCAGCCCCAGGAACCCCACAACCTCCTCGAAGGACCAGGCCTCCGGGGTGTCGCACAATCTTTGTTGGTGGCTTACCAGAAAAAATAAGAGAGAATGCTGTAAGAGAAATATTTGAGCGTTATGGAAGAATACAAATATTAAGGTTGTCCAAGAAAAACTTTTGTCACATACGTTTTGATAGAGAGAGTTGTGTGGATGCAGCCATGGTTATATCAGGATATAGGATCAAAGTTCTGAACAAGGAAGGTGATAAGGAAGAAGACGATAATAATGCCTCAAGTGGCTGGCTTCACGTTGATTACGCTTTGAGTAGGGACGATCAGAACGAGTATGAAAGACGCCAGCGTCTAGCGCTGCGTGTTCAACAACAACAAATGCAACAGATGTCCGCACAACACGAGGCTATGAGTAACAGAAACGCCACGTACAGAAGATCTCCCTCACCCCTCAGGATACAACCCTTCTCAGCGACAGCCATCGTACAGTTGACAGAGAAAATTAAAAGCGAAGAACATTTCGCCACCACACTTCCCACACTGATATCGTGGTTGGAACGCGGGGAGTGTTCCAAAAAGAGCGCCAATCAATTCTACTCTATGATCCAAGCGACCAATTCTCACATCAGACGACTTTTCAATGAAAAAATGCAGGCTGAAGAGGAATTACAGGAATGCAAAGATAGAGTGAAAAATAATATACAGAATGTCATCGAGCAACTCGAACAGGTGGGGAAAGTGTTTAACGCAGCGACCCACCAGCGTGTCTGGGACCACTTCACTAAACCACAAAGGAAGAATATAGAAACGTGGCAGAAAATGACGCAGGAGTTCAATACATTGAAGGAGGAGTTCAGTGAGAGGTTCTTTAACGATGACTCGGAATACAATGGCACGAGCAAGGGCAGTTACGATAGCAATAATGAAGACATAAACCAGTTGAAGCGTGAAAATGAGAGTTTACAATTCCAATTGGAAGCGTACAAAAACGAGGTGGAAGTTATAAAGAACGACGCGCAAAAGGAAATGGAGAAATTTAAGGCACAATTTATAGCGCGACAAGCATTGTTAGGGGCAATGGAAAACAAACCTCCCCTACCGTCGTCAGTATCAGAGCAGCCCCCGCCTCCCCCTCCGCTGCCTGATGACGCGGATGACTCCCTGAAGACGGCCGCCGAGGTCGCGCCAGGGGAGGCCAGGCTTATAGGAGTCATGTCAGCCTTCTTACAGGTACACCCCCGGGGAGCCAGCCTGGACTACGTGGTGTCCTATGTACGAGCGTTATTCCCAAACGTAACACAAGCAATAATACACCATGTACTGCAGAAGTACGAAGACGTGTTCCAGAAAACCACCAGCGGGGTCGGAGCCAATATTGAGAACCGTTGGACCTTTGTAGCGTTTAATAATAAGACGTAG

Protein sequence:

>DPOGS204840-PA
MMMSGMFNMMMPNPMMAGGMMPSSGMEMMQSTSMEIISQPPIDITAMGTQPLAAPPLTPSMDMSMMGGVMMDPSIMGMFPNMSNEIVPEKKEIVLKHSKLVAPAPGTPQPPRRTRPPGCRTIFVGGLPEKIRENAVREIFERYGRIQILRLSKKNFCHIRFDRESCVDAAMVISGYRIKVLNKEGDKEEDDNNASSGWLHVDYALSRDDQNEYERRQRLALRVQQQQMQQMSAQHEAMSNRNATYRRSPSPLRIQPFSATAIVQLTEKIKSEEHFATTLPTLISWLERGECSKKSANQFYSMIQATNSHIRRLFNEKMQAEEELQECKDRVKNNIQNVIEQLEQVGKVFNAATHQRVWDHFTKPQRKNIETWQKMTQEFNTLKEEFSERFFNDDSEYNGTSKGSYDSNNEDINQLKRENESLQFQLEAYKNEVEVIKNDAQKEMEKFKAQFIARQALLGAMENKPPLPSSVSEQPPPPPPLPDDADDSLKTAAEVAPGEARLIGVMSAFLQVHPRGASLDYVVSYVRALFPNVTQAIIHHVLQKYEDVFQKTTSGVGANIENRWTFVAFNNKT-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: