MonarchBase - Protein-coding gene

DPOGS210642
Transcript	DPOGS210642-TA	3309 bp
Protein	DPOGS210642-PA	1102 aa
Genomic position	DPSCF300401 - 160284-171231
RNAseq coverage	566x (Rank: top 22%)

Annotation
*Heliconius*	HMEL010789	1e-146	31.21%
*Bombyx*	BGIBMGA001804-TA	4e-74	32.14%
*Drosophila*	CG31224-PA	1e-19	26.46%
EBI UniRef50	UniRef50_F7AF16	9e-22	32.64%	Uncharacterized protein (Fragment) n=1 Tax=Xenopus (Silurana) tropicalis RepID=F7AF16_XENTR
NCBI RefSeq	XP_001947082.1	1e-21	25.66%	PREDICTED: similar to mCG121035 [Acyrthosiphon pisum]
NCBI nr blastp	gi\|260795637	2e-23	29.13%	hypothetical protein BRAFLDRAFT_275668 [Branchiostoma floridae]
NCBI nr blastx	gi\|260811041	4e-30	21.59%	hypothetical protein BRAFLDRAFT_66735 [Branchiostoma floridae]

Group
Gene Ontology	GO:0003676	1.8e-06	nucleic acid binding
	GO:0008270	3.6e-05	zinc ion binding
	GO:0005622	3.6e-05	intracellular
KEGG pathway
InterPro domain	[935-970] IPR013087	1.8e-06	Zinc finger, C2H2-type/integrase, DNA-binding
Orthology group	MCL16717		Insect specific

Nucleotide sequence:

>DPOGS210642-TA
ATGGAGGATAATTTTAAGAAAAGGTGTCGTAAGTCGAGGTTGGTGCCACGGGAATGCTTGGATACCGATGACGAATATATAGCAGTTATGCAGACTGATCATACAAATAAGATGGCTCCCAAAATCAAACAATCCCGAGAGGAAGTATTGAAGAAGAAGAGAGAGGCAGAGCGTGTGAGGTACTACAGAAGAAAAAATGACCCGCAGAAACGAGAGGAGATGAGGGTGAAACAAAATGTGAACTATGAAAGGAGGAAGCAGACAGGTTTGAGGAAGCTGGTCAAGGACATGACTCCCAACGAGCACAGCACAGCTCTACAGAAGTGGAAGGAATACTGCAGAGTGTACCGAGAAAGGAAACGGATCCAAGAGAGCCACGTTACTGATATTGATGAAATAGAGGAGACCATAGCTCGGATGACGTCAAATTCCATCCTCAAGAAGCTGAATCAGAGAAGTGAAGACAATCTGAAGTTTGATGTCAAAGTTGAAGTTGAGGAGGTGGAGGAACACCAGACGAACGATTTGAACATAACCATCGGTTCTGTCGTTAGTCTGAAGGGCACAGCCGATGATGCACTGGGCGCAGCTGATGAAGAACAGAATCTACATGACATAGCCGACACGAAACTGCTGGTCCGTGAATACGACTTCAAAGCTACAACTGTTATAGATGAGTTGAACAAAATGAAAAACATGACTAATATAGCCGATGTGCTCATAGATGTGAGCGTCAGGAACTATTTTGGACGATATTTCTTTAAAGTCGATGCCGAGGTTAAGGAAGCCAAGTTGCTGGTGGTCTTCGCCAAGTGGCAGACCTGGTGTAGGATGAACCCTGACGATAGAGACGCTCCTCTCCTGTACAAGTGCTATATATGCCGTCGATCTTGGTGGCATTACCATGAATTCAGAGAGCATTTCCACTGTCACGACGATTTCAACTTGGATATAGATCAGTTCGGCCAGGAATGTATCGTATTCGCCTACAGCAAGGAAATACAACAGAACGACATCAGCGTCACCGGAAACTGCTGGCGTTGCGGCAACGACTTCCTCTTCCACCAGAATAAGAGGAGATACAAGAAGCTATACGACTGCTCCGGGTGCCTGGCTAAGTTCACGACCTGTTTGAAATTATCCAATCATGTGGGGGGCTGTAACTACTATAAGAGATCTCTTCAGGCTTTGGGCAAAAACGTCTCTCAGATACACCCATGCGATGTTTGCCCAGTGAAGTGCTTCACTCAGACCGATTTGGCCGATCATATAAAAGACAGGCACTCGGTGAGATCGGATCTGCCGATAGTGACGAATCATCAAAAGTGCAGTCACTGCTCCCAGCCATGTGACGCCCTGACGCACGAATGCAAGAACCAACCGTATATAAAATGCTGTGAGCTGTGCGACAGGAAGTTCCACAGGCCTATAAACTATCAGATTCACGTGAAAAACAACAGAAACCAGTACAAATGCAAGGTCTGCGATGAACAGCTGCCTGGACAGTGCATGGAGGTGAAGCATCTGATGAAGCACACCAACAACTTTGTATATCTATACAGGTGTCTGCTCTGTCCCTCGCCGGTGTACTTCAGCAAGAAGAATATGCTGGAGGAGCACAACGACGCGCACCACCAGGAAAATAGTACGAAATATTTCTTTGACGAGGTCGTTGTACCAAAGTCGCTGATCAAAACGAAGATATTAATCAGCAGACCAAGGATAAGACGGAAAGACCAACTCAAGCCTATTAAACAAGTACAGAATAATGAGACGAAACCTCTCAGCATTCCATGGATGCACCGTGCGGGGGCCGGGTCCATGGGAGATGGAGGGGATACGGGTCAAACCCAGCAGAACAACACCGAACACCTGGAAACTAACGAGGCTATGTACAACCTGGAGCCAGTGATCACAATAAAGAAGGAATTGAACGAAGATGACTTGATGAGAGAAATAAAACAGGAAGCCGAGGAGCTGATGATCTATGATGGGATCGGTGATGAGATGGTGATCAAACAGGAGATAGTGGAACATGTGATACAAGTGTGTGAGTACGATGACATTAATGTGGGGATTAAAACCGAGCCGGCTGATGATGATGAAGTTACCAACGACGAATATCTCTTGGACATAAGAAACCTGGCTTACAACTGTACCAAGTTGTACAGCTGTAAGAAGTGCCTCTTCCAGGGTGTGCACCGGGAGTATATGGAACACCTCAAGAGCAAGTGCCTTCACCGCACAAAGTACTACTGCAGTAAATGCAAAACCACGTACCTGACGATGAAGAGGTACCTGGTTCACTTCAGGAGGCACGGCTACGAGGAGAACACCTGCCCCAAATGCATCAGGACAGTGGAGATGAGCCAGCTGATAGCGCACGTGTACCAGCACGTGAAGAACACCTTCATCGGCTGCCACTACATCAACGACAAGACCTTCAACAAGTGCTACCAGTGCAGGGAGTGTAGAGAGGTGGTGCAGTTCTGTGACTTCTTCAAGCACTGGGAGCTGCATCTGGAACTGAAGACTGAAGACAGCGCTGGCAGGAACGACCTGGTGGAGAACAAACCGCTGCTCAAAGAACTCATAGCGCTTCTCCTCGGCGACACCATGGACGTGTCCAAGGAGTTGCATCCGAAGCAGTGCATCATGTGCCTGAAGCTGTTCTCCAGGAAGAACGACCTGAAGCGCCACCTCATAGAACACCTGCTGAACGACGCGTACAGGAACAGGCAGAAGTATGAGTGTCTCCGCTGCCAGATATGCAGCGTCGGCTTCAACAAGACGGACATTTACAAGCGTCACATGAGGGACCACGGCTCGCTGCCTCTCTACAAGTGCGAGATCTGCGACAAGACCTTCAGTGACTCGAGTAACTTCTCCAAGCACAAGAAAGTACACAACATGTCCGTGGTCATCTGTGACATCTGCAAGAAGAAGTTCACCTGCAAGGCCATACTCGTCAAGCACATGGAGTTACACAAGATCCTAAAGCCCATATCGTGTGAGTGCTGCTCGCGGGTGTTCCACTCTCCGTCGCTGTACAGGAAGCATCGCCTGGGGAAGAACAGGTTCAAATGCCCCGCCTGCAAGGTGTTGTTCAACAAGCTCAAGGACAAGTGGGATCACATGTGGCTGGAGCATAAGGAGAGGAAGTACATAGCTGATTGTCCGATCTGCAAGAAATCCTTCAGGAAGTACCAGGACGTGAAGGTCCACATCAGGAGAGAACACGACGCCAAATACGTGTACAGGCCCGTGTTCCACAGAGTAAATGAAGAGGAGATTATAGTGTGCGACTAG

Protein sequence:

>DPOGS210642-PA
MEDNFKKRCRKSRLVPRECLDTDDEYIAVMQTDHTNKMAPKIKQSREEVLKKKREAERVRYYRRKNDPQKREEMRVKQNVNYERRKQTGLRKLVKDMTPNEHSTALQKWKEYCRVYRERKRIQESHVTDIDEIEETIARMTSNSILKKLNQRSEDNLKFDVKVEVEEVEEHQTNDLNITIGSVVSLKGTADDALGAADEEQNLHDIADTKLLVREYDFKATTVIDELNKMKNMTNIADVLIDVSVRNYFGRYFFKVDAEVKEAKLLVVFAKWQTWCRMNPDDRDAPLLYKCYICRRSWWHYHEFREHFHCHDDFNLDIDQFGQECIVFAYSKEIQQNDISVTGNCWRCGNDFLFHQNKRRYKKLYDCSGCLAKFTTCLKLSNHVGGCNYYKRSLQALGKNVSQIHPCDVCPVKCFTQTDLADHIKDRHSVRSDLPIVTNHQKCSHCSQPCDALTHECKNQPYIKCCELCDRKFHRPINYQIHVKNNRNQYKCKVCDEQLPGQCMEVKHLMKHTNNFVYLYRCLLCPSPVYFSKKNMLEEHNDAHHQENSTKYFFDEVVVPKSLIKTKILISRPRIRRKDQLKPIKQVQNNETKPLSIPWMHRAGAGSMGDGGDTGQTQQNNTEHLETNEAMYNLEPVITIKKELNEDDLMREIKQEAEELMIYDGIGDEMVIKQEIVEHVIQVCEYDDINVGIKTEPADDDEVTNDEYLLDIRNLAYNCTKLYSCKKCLFQGVHREYMEHLKSKCLHRTKYYCSKCKTTYLTMKRYLVHFRRHGYEENTCPKCIRTVEMSQLIAHVYQHVKNTFIGCHYINDKTFNKCYQCRECREVVQFCDFFKHWELHLELKTEDSAGRNDLVENKPLLKELIALLLGDTMDVSKELHPKQCIMCLKLFSRKNDLKRHLIEHLLNDAYRNRQKYECLRCQICSVGFNKTDIYKRHMRDHGSLPLYKCEICDKTFSDSSNFSKHKKVHNMSVVICDICKKKFTCKAILVKHMELHKILKPISCECCSRVFHSPSLYRKHRLGKNRFKCPACKVLFNKLKDKWDHMWLEHKERKYIADCPICKKSFRKYQDVKVHIRREHDAKYVYRPVFHRVNEEEIIVCD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: