MonarchBase - Protein-coding gene

DPOGS210399
Transcript	DPOGS210399-TA	1803 bp
Protein	DPOGS210399-PA	600 aa
Genomic position	DPSCF300291 + 101646-136465
RNAseq coverage	183x (Rank: top 49%)

Annotation
*Heliconius*	HMEL021054	3e-78	83.64%
*Bombyx*	BGIBMGA008410-TA	5e-99	76.82%
*Drosophila*	sdt-PG	8e-42	50.00%
EBI UniRef50	UniRef50_Q7PQW5	1e-44	56.89%	AGAP002711-PA n=2 Tax=Anopheles gambiae RepID=Q7PQW5_ANOGA
NCBI RefSeq	XP_974746.2	2e-58	47.23%	PREDICTED: similar to AGAP002711-PA [Tribolium castaneum]
NCBI nr blastp	gi\|189236143	5e-57	47.23%	PREDICTED: similar to AGAP002711-PA [Tribolium castaneum]
NCBI nr blastx	gi\|189236143	7e-70	46.24%	PREDICTED: similar to AGAP002711-PA [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	8.9e-06	protein binding
KEGG pathway	aga:AgaP_AGAP002711	5e-42
	K00942 (E2.7.4.8, gmk)	maps->	Purine metabolism
InterPro domain	[55-102] IPR001478	8.9e-06	PDZ/DHR/GLGF
Orthology group	MCL18336		Insect specific

Nucleotide sequence:

>DPOGS210399-TA
ATGAATTCGTTCAACGCGCCTAATCAAATCAACGCTATTGACAAAATGACCACCGTGAAATGCAAGTCTGTCGATTTAGAAGGATACGTCATAATAGTCGTGCAGACCAAGGATAATAAAATAAAACTATACGGTTCACCTTCCGCCGGCAACTGGGAGAATCTGGAGCTGGCTGACGAGATCATGGATGTGAACGAAACCAAGCTAGAAGACATGACCAGGACTGAAGTACTCACACACATTCATGAGTGTATTTCATCGTGTGTCATCAAACTGCGAGTAAAGAGACGGAGTGAAACAAAGCTTTTATCAGACATCGGTCATAACGTGATCCAGGATGCCTTCCTCATTGCTGTGGAGGAACAGGCGAGGCAGCGTCTCCAACGACTGTCAGCTCTCAAGAGAATCACTCCAGTTGATATGTCCAAGCTGTCTGCTGAATTAAACAAAAGAAAACGAACGCAAACTGAGAGCCGACAGGAGTTGAACGGTTACATAGCAAACTCCACAGTATACGTGACTTCTATAAACGAGAACGGAGCTATCGAGAGCAAACCCACAATATCATCACCGAAATCACAACCGAAGTCCCTCCAAGCGAAGCCAGCACCGCTCATAGCCAACGGCATCCAAGACAAGAAGGACGCCGTCGAGGACGCAGTCGAACCAGAGAAACACGAAAAAGATTCTAGTGAGAAAAGTTTTAAGGTTGATAGTGAATTGAAGGAAAGTGAAGTGTTGAGTGTTAAAAGTGATGCGTACAATGTGGCTAGAGAGCATCTGAATAACGGGAGGTGCGAGAAACTGCTGGGGGAGCAACCGGATCATCGGATACGAGCCACTGCTGTAGTCGAGAACAGTAAACTAGGACCGGGAGAGAAAGGGCCTCGCAGACGTTCTGGCTCTAGCATTGTGGTGCTAGGAGCTGAAGAGGAGAAGCTTCCGCCCCCGGATGACGAGACAGACATGCTCACCATGCTCTCACTCACCACGGATACTGGCCCCCACCGCGAGATGGCGGTGGATGTCCCAGACAGCTTCATCGCTAGGAATAAGACCCCGCCGCGCTACCCGCCACCCCGCCCACCACAGGTACGCCCTCGTGCCAGAGATGATGAGCCCCTCTTATCATCAGGCGGCTCAGGAACTTCTTTTGGCAGCAAACAGAGCACCGTCCTCCAAAGCAACGTCGACATATCCGGCCCAAGCTCCGACGGCTCAGGCAGTTTCAAGATTAACAGCACCATGGAATTACTGTCATTACCCCAGAGCTCGGACAGTTCTGGGGTAAGTTTTGGCAGCAAGAAAAGCAAGGGTTCTGCGGAAACAGCGAAATGCGATATAGCATCAGAAAGGTCCGAATCGGTGGATTCTATTCTGTCACACAAAATACAACTGCTGATATCGAACGGTGAAGATTCTCTCTTGGATTGTAAGGAGGGTGTGACGTACTCCACGCGGACTGATTCAGTCCTCATCAGGGAAGCTGTGTACGCTTCTTACAAGCTGCCTCCGGGGTTTGATACGACGCCCGTGCTCCTTGGACGGGAAGTGGCGGTGGATGTTCCTGATAGTTTCGTTCAGATAGTGAAAACTACCCCAAAGTACCCGAACACTGCTGACAGGAAGACGTTTCAGGTGAATGGAACAGCGAAGGGTGCGCCTGTAGTGCCCCCTCGCGAGGCGCCTCGTGATGCTCCGCCCAGGCCGCCCGCTCACGATCTCACTAGAGAGCAAGTTGATTCAATCAAGAAGTATCAGGACTTTAAAGATGAGAGTCGATTTGCACAACGTAATGTGTAG

Protein sequence:

>DPOGS210399-PA
MNSFNAPNQINAIDKMTTVKCKSVDLEGYVIIVVQTKDNKIKLYGSPSAGNWENLELADEIMDVNETKLEDMTRTEVLTHIHECISSCVIKLRVKRRSETKLLSDIGHNVIQDAFLIAVEEQARQRLQRLSALKRITPVDMSKLSAELNKRKRTQTESRQELNGYIANSTVYVTSINENGAIESKPTISSPKSQPKSLQAKPAPLIANGIQDKKDAVEDAVEPEKHEKDSSEKSFKVDSELKESEVLSVKSDAYNVAREHLNNGRCEKLLGEQPDHRIRATAVVENSKLGPGEKGPRRRSGSSIVVLGAEEEKLPPPDDETDMLTMLSLTTDTGPHREMAVDVPDSFIARNKTPPRYPPPRPPQVRPRARDDEPLLSSGGSGTSFGSKQSTVLQSNVDISGPSSDGSGSFKINSTMELLSLPQSSDSSGVSFGSKKSKGSAETAKCDIASERSESVDSILSHKIQLLISNGEDSLLDCKEGVTYSTRTDSVLIREAVYASYKLPPGFDTTPVLLGREVAVDVPDSFVQIVKTTPKYPNTADRKTFQVNGTAKGAPVVPPREAPRDAPPRPPAHDLTREQVDSIKKYQDFKDESRFAQRNV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: