MonarchBase - Protein-coding gene

DPOGS214415
Transcript	DPOGS214415-TA	3309 bp
Protein	DPOGS214415-PA	1102 aa
Genomic position	DPSCF300069 + 183268-190982
RNAseq coverage	59x (Rank: top 68%)

Annotation
*Heliconius*	HMEL010614	2e-157	71.69%
*Bombyx*	BGIBMGA011248-TA	0.0	52.50%
*Drosophila*	crol-PE	5e-28	25.14%
EBI UniRef50	UniRef50_C3XX02	8e-67	31.91%	Putative uncharacterized protein n=14 Tax=Chordata RepID=C3XX02_BRAFL
NCBI RefSeq	XP_001945749.1	2e-55	28.76%	PREDICTED: similar to mCG7830 [Acyrthosiphon pisum]
NCBI nr blastp	gi\|260832612	6e-67	30.31%	hypothetical protein BRAFLDRAFT_261844 [Branchiostoma floridae]
NCBI nr blastx	gi\|260811193	3e-78	29.70%	hypothetical protein BRAFLDRAFT_66809 [Branchiostoma floridae]

Group
Gene Ontology	GO:0003676	4e-08	nucleic acid binding
KEGG pathway
InterPro domain	[537-565] IPR013087	4e-08	Zinc finger, C2H2-type/integrase, DNA-binding
Orthology group	MCL25825		Lepidoptera specific

Nucleotide sequence:

>DPOGS214415-TA
ATGGATTTTGTTAAGAGAGAGGATAATCATGTGTTGGAGGAAGAAAATTATAAATTATACATGCAAAACCTACAAAAATCACATCAAATCGATACAACGGAATATCAGCATACTGCAATATCAATGGAACAACTCCACCAAGCGGTGCAGTCCACACTCAACAATGGATCATTACACAACTTCCAATTACCGATATCCCCTCGACAAATGTCCACACTCATGCTGAAGACCAACCACCTCACACGATCACTCACTTATAATGATCTCCCGCAACATCTCTCAAAGAATCTGGCCATGGACATGGAATTGTTACCGATGACGAATGAAATTCAGCAAATCCGCCACGATGATATACTAAGCCAGAATCTGTCGAGAAATCTCGATATAACGCTGGCACGCAATCTTAACAATGAACTCGAATTACAGAACAGCTTGGCTCAAATACAAAGTTTACATGAACATGAAATGTCAAGGAATGCGGAGATCACTCAGAATTTAAGTCGAGTCAACGAATTAACACAGAACATGGGTCGGGAACTGTCACATGAGCTGATTAACGAAATCGACTTATCACAGCTGAGTAGACACGGATTAGATCAGAATATTTTAAGTCACGATGAAGGGAGACGAAGCCCAATAATTCATTCTGTTGATAATCATTTATTGGAGCACCACATTGCTCAAAGATTGGAACAGAATATAGCCATGCGATTGGATTCAGACAGATTGGATCAAACGCTATCCCAGAGGTTGGATCAAACATTAGCGCAAAGGTTGGATCAGACATTGGCCCAACGATTGGATCAAAGACTATTGAATCCTGGTGTCATACATGATCACAGGGTATTGGAGCAAAATGAGAACTTACTACCCATGCCTTTCCACATAAAATCCGAACAAGATGACGATAGCTATTTCTATGACAACCTGAATCAAGGAATCAATACAGCTTCCGTCAACAATGAGTTACAACAAAACGATCACAGTCAGACGAATTCAATACAACATGAACAAATGTATTCGTTATTCAATAACACATCAATACCGGCTCTGAACACCATAGACTTATATTCCCGGACCCCATACATACAGAACTATCCAGAAATTGCGCGGGAAAATCCACAGAATCTAGTCGTTCATAGACAATACGACAATAACAGTCCATACGCTGACGAAACAAAGAAAAAGCAAGAGGATGTCAAAAAGAATACCAAAATCGAACATCCCAAAGAGAATTTGAAACCTAACGATCAAAATAAACTATACTACGATTACAACGATTACGTGAACGTCGAAAAAAATGAGAACGATTCTAGTTCGCATAACAAAATAACAGAGGAACTCGCGTTGAATATAAAAGGTGAGTACGCGTGTTACAAGTGCAACGAAGTGTTCCCATCGAAGAGGTTATTGAAACAACATTCTAAGAATTGTGAAAGTGCTGATAGTGATTTAGATAAATTGGGTAAATTCAGTTGTTCACAGTGCGCGTATAGATGTCAATCTCCCGCCATTTTGAAAATACACGAAAGAACACATACAGGCGAGAAACCGTACGCGTGCACGTTCTGCGATTATAAATCAGGTCAAAAGAATAACGTGGCCAAGCACATACTAGTGCACATGAAACAGAAGCCTTTCAGCTGTCAGTATTGTGATTATAAATGCGCTCAAAAGAATAATTTAGTTGTCCACGAGAGGACTCACACGGGTTACAAGCCATTCGCATGCCCCTACTGCGATTACAGGACGGTTCAGAAGCCTAATTTAGTCAAACATATGTATTTGCACACCGACCAGAAGCCATTCAGCTGTGATATGTGTAATTATAGGTGCGTTCAAAAGACGAACCTTACGAAACACAAGCAACGTCATCTGACCGAATGCGACAAAATGGATATCAAAAATCAAGTGAAGCCCTACAAGCCTAGACAGAAATCGGTCAAATGCGCCCATTGTTCGTACAGGGTATTGGAGCAAAATGAGAACTTACTACCCATGCCTTTCCACATAAAATCCGAACAAGATGACGATAGCTATTTCTATGACAACCTGAATCAAGGAATCAATACAGCTTCCGTCAACAATGAGTTACAACAAAACGATCACAGTCAGACGAATTCAATACAACATGAACAAATGTATTCGTTATTCAATAACACATCAATACCGGCTCTGAACACCATAGACTTATATTCCCGGACCCCATACATACAGAACTATCCAGAAATTGCGCGGGAAAATCCACAGAATCTAGTCGTTCATAGACAATACGACAATAACAGTCCATACGCTGACGAAACAAAGAAAAAGCAAGAGGATGTCAAAAAGAATACCAAAATCGAACATCCCAAAGAGAATTTGAAACCTAACGATCAAAATAAACTATACTACGATTACAACGATTACGTGAACGTCGAAAAAAATGAGAACGATTCTAGTTCGCATAACAAAATAACAGAGGAACTCGCGTTGAATATAAAAGGTGAGTACGCGTGTTACAAGTGCAACGAAGTGTTCCCATCGAAGAGGTTATTAAAACAACATTCTAAGAACTGTGAAAGTGCTGATAGTGATTTAGATAAATTGGGTAAATTCAGTTGTTCACAGTGCGCGTATAGATGTCAATCTCCCGCCATTTTGAAAATACACGAAAGAACACATACAGGCGAGAAACCGTACGCGTGCACGTTCTGCGATTATAAATCAGGTCAAAAGAATAACGTGGCCAAGCACATACTAGTGCACATGAAACAGAAGCCTTTCAGCTGTCAGTATTGTGATTATAAATGCGCTCAAAAGAATAATTTAGTTGTCCACGAGAGGACTCACACGGGTTACAAGCCATTCGCATGCCCCTACTGCGATTACAGGACGGTTCAGAAGCCTAATTTAGTCAAACATATGTATTTGCACACCGACCAGAAGCCATTCAGCTGTGATATGTGTAATTATAGGTGCGTTCAAAAGACGAACCTTACGAAACACAAGCAACGTCATCTGACCGAATGCGACAAAATGGATATCAAAAATCAAGTGAAGCCCTACAAGCCTAGACAGAAATCGGTCAAATGCGCCCATTGTTCGTACAGGTGTGTACAGAAATCTAGTTTAGATAAACATATGCAATTCAAACATAGTGACATACAAACGGATATGCAATTCAAACAAAGTGATTTACGTACTGATTTGCAATTCAAACAAAGCGAATTGCAAAGTGACTTGAGTGATGGTGTTAATGGAACTAGTGACTTTGACAGTATACAGAATTTGAGTATAAAAGACATGTCTCAGGAGATCTGTACTTGA

Protein sequence:

>DPOGS214415-PA
MDFVKREDNHVLEEENYKLYMQNLQKSHQIDTTEYQHTAISMEQLHQAVQSTLNNGSLHNFQLPISPRQMSTLMLKTNHLTRSLTYNDLPQHLSKNLAMDMELLPMTNEIQQIRHDDILSQNLSRNLDITLARNLNNELELQNSLAQIQSLHEHEMSRNAEITQNLSRVNELTQNMGRELSHELINEIDLSQLSRHGLDQNILSHDEGRRSPIIHSVDNHLLEHHIAQRLEQNIAMRLDSDRLDQTLSQRLDQTLAQRLDQTLAQRLDQRLLNPGVIHDHRVLEQNENLLPMPFHIKSEQDDDSYFYDNLNQGINTASVNNELQQNDHSQTNSIQHEQMYSLFNNTSIPALNTIDLYSRTPYIQNYPEIARENPQNLVVHRQYDNNSPYADETKKKQEDVKKNTKIEHPKENLKPNDQNKLYYDYNDYVNVEKNENDSSSHNKITEELALNIKGEYACYKCNEVFPSKRLLKQHSKNCESADSDLDKLGKFSCSQCAYRCQSPAILKIHERTHTGEKPYACTFCDYKSGQKNNVAKHILVHMKQKPFSCQYCDYKCAQKNNLVVHERTHTGYKPFACPYCDYRTVQKPNLVKHMYLHTDQKPFSCDMCNYRCVQKTNLTKHKQRHLTECDKMDIKNQVKPYKPRQKSVKCAHCSYRVLEQNENLLPMPFHIKSEQDDDSYFYDNLNQGINTASVNNELQQNDHSQTNSIQHEQMYSLFNNTSIPALNTIDLYSRTPYIQNYPEIARENPQNLVVHRQYDNNSPYADETKKKQEDVKKNTKIEHPKENLKPNDQNKLYYDYNDYVNVEKNENDSSSHNKITEELALNIKGEYACYKCNEVFPSKRLLKQHSKNCESADSDLDKLGKFSCSQCAYRCQSPAILKIHERTHTGEKPYACTFCDYKSGQKNNVAKHILVHMKQKPFSCQYCDYKCAQKNNLVVHERTHTGYKPFACPYCDYRTVQKPNLVKHMYLHTDQKPFSCDMCNYRCVQKTNLTKHKQRHLTECDKMDIKNQVKPYKPRQKSVKCAHCSYRCVQKSSLDKHMQFKHSDIQTDMQFKQSDLRTDLQFKQSELQSDLSDGVNGTSDFDSIQNLSIKDMSQEICT-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: