MonarchBase - Protein-coding gene

DPOGS200304
Transcript	DPOGS200304-TA	1695 bp
Protein	DPOGS200304-PA	564 aa
Genomic position	DPSCF300026 - 249862-256607
RNAseq coverage	945x (Rank: top 14%)

Annotation
*Heliconius*	HMEL002913	9e-105	74.38%
*Bombyx*	BGIBMGA005626-TA	4e-150	66.29%
*Drosophila*	CG7368-PB	2e-51	61.19%
EBI UniRef50	UniRef50_D2A549	2e-93	44.76%	Putative uncharacterized protein GLEAN_15472 n=2 Tax=Tribolium castaneum RepID=D2A549_TRICA
NCBI RefSeq	XP_970666.1	2e-95	45.35%	PREDICTED: similar to AGAP001269-PA [Tribolium castaneum]
NCBI nr blastp	gi\|91084469	5e-94	45.35%	PREDICTED: similar to AGAP001269-PA [Tribolium castaneum]
NCBI nr blastx	gi\|91084469	4e-105	46.11%	PREDICTED: similar to AGAP001269-PA [Tribolium castaneum]

Group
Gene Ontology	GO:0003676	2.8e-10	nucleic acid binding
KEGG pathway
InterPro domain	[404-435] IPR013087	2.8e-10	Zinc finger, C2H2-type/integrase, DNA-binding
Orthology group	MCL18306		Insect specific

Nucleotide sequence:

>DPOGS200304-TA
ATGTGCGATATGCAGAAAATGCCAACAAGAGACGATGCGTCTTGCGACGAGGACTCAGATATGAATTTCACTACATTCTCGGCTGTGGGTGCAACGGGAACACATTTTGTCACAGCGGGTGGACAGTTGCCGGTCACTAAATTACAACAGAATGTCTCCAATAACGGCACACCCCTGTCTCAGGTGGTGGGAATGGTGAGCGGAGTGAATATGAGTGAAGGTGTGCAGTATGTACGAGCGATTGATTCATCGTCTCTCCAGGCGGGGCCTCAACTTATATCAGTGCCAATTGCCTTACCTGGAACAAAACCTGGTGACCCCCAGCCCACAGTGCAGATTCAGGTCCTCAGTCCAAATCTAACGCTGCAACAGCAACAACCAAAATATCAGATGCAAATACCAATTCAAGGATTTCAACAAGGTGGAGCGGTACTCACAGTGGCGTACTCGCCGGATGGGAACGAATCTGGTGGGATACAACTCATAGGAAACACATTACCAGAAGGTCTACAAGTGCTGGCGTTGCCTCAGGAGATGCAATTGATACAACAGGAAAATAAGGAACAAGTACAGCAAAACATACAACATCAGGTGTTCATAACGCCCAACAACCAGATCGTGATCAACGGCCCCGACAAGTCCGTGAACAACAACAACGACGGTGACGTCACCAACATCGTCATCAAGGAGGAGTGTAATGACGACAACAACGATGACAGTTCCCAAGGCACGGACACAGATGGCGTCCCCTGGCATATCGGTCAACCGTCGCAGGCTCTCGTTAAATACCTCAACACTCTCGCGCCACAGCAAACGCAAGCGTTGCCGGTGTCCTTACAGCAGTTCCTGAGACTGAACCCCACCGAGACTAAGAAGGTTGAGGCTGAGGACATTGACATGACCCCGGAGGAAGATAAGAAAGAGGTGATCACTGAAGCCGTCTTAGAAGAAGATGGTACTTTACGAGTTCAGACAAAGAAGAAGAAGAAATACAAGAAGAAAGCAGCTAAGCCGGCGCGGCCGAAGCCGGGGCAGGTGATTATAGCGACCGCTGCCGACGGTACGCCCGTGTACTGCTGCCCGCAGTGTGACATGGCCTACCCCGAGAAAGATCAGTTGGAGATGCATCTCTCCGTACACAAGATCGAGAGACGATTCATATGCGGAATATGCGGGGCTGGGCTCAAACGTAAAGAGCACCTTGAGAGACACAAGCTGGGTCATAACCCAGAGCGGCCGTACGTGTGCGGCGCCTGCGGGAAGGGCTTCAAGAGACGGGAACATCTCAACCTGCACGCTGTCATACACTCGGGCGTCAAGACGGAGATGTGCGGGGAGTGTGGGAAAGGATTCTATCGCAAGGATCATCTCCGTAAGCACACACGTTCACACGAGAGCAAGAGAGCGAGGGACGAGGCGAACAACGACTGTATGGAGACCAAGACTGGCAACACCAACGCTAACGTTAACATCACAAACACCAACACCATCATGCCGGAGATTACGATACACGTGCCGACAAGTTCTAATATGCAGGTCCCCGTTCAGATCAACATCCCTCAGCACGTGATGTCGTCTCTGGTGGGACAGACGCACACACACACGCACACCAACACACACACGCACATGCACGCCCACGACGAGGCGGGGGATGCGCACGCGCAGCTCGACGCGCTCCTCGCGCAGCACACGTGA

Protein sequence:

>DPOGS200304-PA
MCDMQKMPTRDDASCDEDSDMNFTTFSAVGATGTHFVTAGGQLPVTKLQQNVSNNGTPLSQVVGMVSGVNMSEGVQYVRAIDSSSLQAGPQLISVPIALPGTKPGDPQPTVQIQVLSPNLTLQQQQPKYQMQIPIQGFQQGGAVLTVAYSPDGNESGGIQLIGNTLPEGLQVLALPQEMQLIQQENKEQVQQNIQHQVFITPNNQIVINGPDKSVNNNNDGDVTNIVIKEECNDDNNDDSSQGTDTDGVPWHIGQPSQALVKYLNTLAPQQTQALPVSLQQFLRLNPTETKKVEAEDIDMTPEEDKKEVITEAVLEEDGTLRVQTKKKKKYKKKAAKPARPKPGQVIIATAADGTPVYCCPQCDMAYPEKDQLEMHLSVHKIERRFICGICGAGLKRKEHLERHKLGHNPERPYVCGACGKGFKRREHLNLHAVIHSGVKTEMCGECGKGFYRKDHLRKHTRSHESKRARDEANNDCMETKTGNTNANVNITNTNTIMPEITIHVPTSSNMQVPVQINIPQHVMSSLVGQTHTHTHTNTHTHMHAHDEAGDAHAQLDALLAQHT-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: