MonarchBase - Protein-coding gene

DPOGS207371
Transcript	DPOGS207371-TA	1668 bp
Protein	DPOGS207371-PA	555 aa
Genomic position	DPSCF300267 - 119594-122592
RNAseq coverage	359x (Rank: top 33%)

Annotation
*Heliconius*	HMEL012246	0.0	88.75%
*Bombyx*	BGIBMGA009004-TA	0.0	76.21%
*Drosophila*	qtc-PF	1e-116	46.90%
EBI UniRef50	UniRef50_Q16G88	1e-116	51.49%	Putative uncharacterized protein (Fragment) n=1 Tax=Aedes aegypti RepID=Q16G88_AEDAE
NCBI RefSeq	XP_314710.3	4e-131	53.93%	AGAP008614-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|118785512	8e-130	53.93%	AGAP008614-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|118785512	3e-127	53.93%	AGAP008614-PA [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0005515	3.9e-07	protein binding
KEGG pathway
InterPro domain	[508-549] IPR000237	3.9e-07	GRIP
Orthology group	MCL12645		Insect specific

Nucleotide sequence:

>DPOGS207371-TA
ATGAATAGAAACTGTGGTAGAAAGACAGAGTTTCAAGACGAGCACTACTGCGCCGGAAATGTCACTGGGAATTTCCGACGCGCTTGTTCACTGCGGCTGCGCGGTGAAAAAATGGTGCAACGATCCCCTTTAACAACTAGAAAATATATTCCAATAATCACGGAAAATACAAACCAGAAACAAAGAAATGGTTCCCGTCTTCCGGAGCCGAGCTACCGCGCAAGGAGTCAATCATTTAACTCCACACAAAAACCGAAAAAATCCTGTTTAAAATTCCAAGAAACCTCCATAGATAGAAACCTCAGTATGACAGACTCGGCCCACACACCACCAGGATCTCCAGAAGATTTACCCGACGATGAATCTTTACATAGTTACGGAAGCGCAGCCACGGCCGCCTCTATTGATGCTGGATATGCACCATTCAATGGCACTACTTTCAGTGGTAGATCGATGCGTTATGTCTTACACTGTTCCTCACATGCCGGCTTAGCTGGAGAAGATTATCTCACACCAACCCAGAGAGCCCAAAAGCAAATACGTCGATTGAAATCTCTGTTAGCTCAGGCCAAGAAGGATTTAGAAGAAAAGGATAGTGAAATTTTTCAACTTACAAAAGAAGTTGTTGAGCTCCGTCTCTACAAAGCTTCAATATTTTCTCCAGATGAAAAGTCAAATTCAAGTGAAATTGTGACCGTCCGAGAAAATAATGATGAAGCTTCCATAGAAGAAGAGAGCATCAAATGTAAAAGTGCCCTTCGGTCATTTGACATCACTGATAGTCCTTTGTACAAAGATCAAACACCAACAAGATGCCGCAATGAGATGCAGGGCTCGTTTACTGATTCCGGTCACTTTGAGGACCTAACTAATTCTTCTTTACATTCAAAAGAATCTGTGCACATGTTGACCCATGATGCTGCATGCATGACGGAGACAATTGACAGTGATGAAGAGCGCCGGAATTTAATAGCTTTCTATGAAAAGAAAGTAGAAGACATAATGAGAGCTCATGTTGGTGAGACACAAGAAATTAAAAAATCACACAATGACAAAGTAGAGGCGTTATTACAAAAGTTATCGGATGTCAACACCAGGTATTGTGAACTTCTACCAAACTATGAGCAGGCTAAAGAGAGGATACATATACTGGAAAAACAGTTGGAGAATGCCAGCAAACAGTTACAAGACGAAGAGAGCAGACACCGTACAGTATACTTACAAATGTACAACAAGGGAAAGGAAGCTGCAAAGTTTGAACTAGATAAAGAAATAGATCCCGAACCTAGTACAAGCCAGCTCAGTAGAGTCTCCGTCGAGGAACTGTTGGAACAATTGCAGATAACGCAGACCGAGCTCGAAAATGTCAGAGATTCGGCATTCACAGCGGACAGAACGGCAAAGTCACAAGTACTTCTTAGTGCAAAGGAGGCTGTTTCTTTATGGGTCCTAGGAGCTCGAAAGGCAATGTATCGACGTATTGTGGAGTCCCAGAAAGGAAACAAGACCATCATTGATCCGGAAGTGACCTTGCAGTTCCTGAAATCGGCGATCTACTACTTCCTGACGGATCCCGAAAACCATCAAGGTCACCTGAATGCCATCGAAAACATCCTAGGGTTCACCGAAGCTGAAAAGAAAAATATACGCAAAGCGAGAACGACGTAG

Protein sequence:

>DPOGS207371-PA
MNRNCGRKTEFQDEHYCAGNVTGNFRRACSLRLRGEKMVQRSPLTTRKYIPIITENTNQKQRNGSRLPEPSYRARSQSFNSTQKPKKSCLKFQETSIDRNLSMTDSAHTPPGSPEDLPDDESLHSYGSAATAASIDAGYAPFNGTTFSGRSMRYVLHCSSHAGLAGEDYLTPTQRAQKQIRRLKSLLAQAKKDLEEKDSEIFQLTKEVVELRLYKASIFSPDEKSNSSEIVTVRENNDEASIEEESIKCKSALRSFDITDSPLYKDQTPTRCRNEMQGSFTDSGHFEDLTNSSLHSKESVHMLTHDAACMTETIDSDEERRNLIAFYEKKVEDIMRAHVGETQEIKKSHNDKVEALLQKLSDVNTRYCELLPNYEQAKERIHILEKQLENASKQLQDEESRHRTVYLQMYNKGKEAAKFELDKEIDPEPSTSQLSRVSVEELLEQLQITQTELENVRDSAFTADRTAKSQVLLSAKEAVSLWVLGARKAMYRRIVESQKGNKTIIDPEVTLQFLKSAIYYFLTDPENHQGHLNAIENILGFTEAEKKNIRKARTT-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: