MonarchBase - Protein-coding gene

DPOGS210192
Transcript	DPOGS210192-TA	3171 bp
Protein	DPOGS210192-PA	1056 aa
Genomic position	DPSCF300283 - 33473-61568
RNAseq coverage	632x (Rank: top 20%)

Annotation
*Heliconius*	HMEL009515	7e-68	37.38%
*Bombyx*	BGIBMGA013794-TA	4e-71	70.37%
*Drosophila*	enc-PE	2e-39	31.47%
EBI UniRef50	UniRef50_Q16WL5	3e-52	35.23%	Encore protein n=1 Tax=Aedes aegypti RepID=Q16WL5_AEDAE
NCBI RefSeq	XP_001653717.1	6e-53	35.23%	encore protein [Aedes aegypti]
NCBI nr blastp	gi\|157120944	1e-51	35.23%	encore protein [Aedes aegypti]
NCBI nr blastx	gi\|189238891	1e-53	30.34%	PREDICTED: similar to encore protein [Tribolium castaneum]

Group
KEGG pathway	aag:AaeL_AAEL009189	2e-52
	K02360 (ENC)	maps->	Dorso-ventral axis formation
InterPro domain	[30-124] IPR013783	1.1e-08	Immunoglobulin-like fold
	[34-136] IPR013098	9.2e-06	Immunoglobulin I-set
Orthology group

Nucleotide sequence:

>DPOGS210192-TA
ATGGTCGGACGGAATATGTTGTTGTGCATTTATCTGAGAGAGAAAAGAAAAATATATTATGAATGTAATATACAAAGAGAAAAAGGACCACCATACATAAGAACATTACCCCCGATAAAAGTACAAAGCGGTGATTCTTTGAAATTAAGATGTCCCTTCTATGGATTCCCAATAAGTAAATTAGAATGGGAACACAGAGGCAAAAAGATCATTAGCACAATGCTGCCACAGCACGCGAGATATAAAAGGACGGAAAACAGATTCTCGGATAAACATAACATAATAGAACGCAGGGAGAGACAGGTGATTGAGACTAGTGAGGATGGATTGCTTAATATACAGAGGGTCGTCAAAGAGGAGAACGGGGAAATGTATACATGTATAGTTTACAGTCCTTCTGGAGAGATGGCTAGGAGATCCTTTGAGATCCAGGTGGTTGAAGCCCCGGAACTGGATGAACTGAGAGTTGGCTCCGGCTTGAAGGAGGGTCAAATAGTACAAATAACCTGCAACATTATAGGTGGAGATCCCCCTATATTCTTCTCCTGGTTGAAAGACGGTATGAAAATACCCGCCAGTTTGAAGATTAGTACTGGAATGGAGCAACCGGAAGTCGAGAAGGGCTGCGGCAGCTCGGAGTACGGAGCACAACTTACAAGAAATAGAAGTTTCAAATCGAAGCAGCTAGTCCGCAGTCAGGCGATACGAGAAGCAACGTCGCCGCCACGAACAGCGTCACCGTTGGCGAGCGACAAACCAAACGTGACCGGAAACGCGGTCGAGAAGAGGTCGAACAGCGAGACCTCCAGTCACAGCGACGGAGGTTCCGTAGTCAGCAATGACAGCAAACAACCCGTTGAAATACAGATAACATCCAACTCCTGGGAGGACGGTAACAGTGACCAACGCCAGCGGACCCGCCGCTGGCTGGGTCACCACCACTCAGACTCCGCGAGGGACCTTCTGACCCACGGGCCGCGGGTGGCCTGCGTCTGTGGGGCCTGCGAGTGTCCGCACTGCAGAAGTTACTATGATGTGATATCGTCTTATGTTCTGCTCACGTCTTCAGAGGGCGCAGAAGAAAACACGCGTGTCCGACGAAACAGGACTCTGGCATCGTTTGTTCTGACGATTGTCCTGATTGCACCGACTCAGAACATGCGGGTCCTAACGGTGACGGCGCTAGGATGTCCGGGAGTCTGGACAGCGACGATCAGGCGTATTATTGCAGGTATTAAAAGAACTCCATCTGGATGTTTCCAGCACCTGGTCCACGTTGTAACCGGTCATCCTTATATTTCCAGATGCATCGATCGCAAGGACAAGCCGAAGAGTATGTGCATAGGTGGCAATGAATTTGAGGATAAGACGGATCTATCAGGTCCGGAGCTGGTGGCCTTCATCAAAGAAACCCTGAACAAGAACCCAAGAGACCGCGCCACTCTGTTGAGGATTGAAAAGGAACTGCATGGTCTTGTAACAGACAACAGTGACCGAGTCACGGCGGCGTCTGTCCTCACGTGCCCTGGTCACCAGTCCATCACTAACCATCATCATCTCATCATCCTTATTATGACTACTAGCGCCCTCCCCAGTCGTTGCATCGTCCGCTTCCCCGTGATGACGTCATACGGCCGTATGCTGGTCCACCGCTGCGCAGCTCTGTTCCAACTGGCGCACCACCTCGACCACTCGAACAAGAACTCCGTGCTGGTGTCCAAAAGCGGCTCTTATCACACTGTGACAGGCACGTGCGGTGGCCGCCTGCCCTGTACCTCCTTCCGTGAGTGGTGCACCACCGTGTTCCCGAGGTCACCCACACACGAGGACACGCTCGCCAAGTCCATTCTAAAGCGTTGTTCGGGACCACCTGGTACAGCTAGCTCGGCAGCTGGCAGGAGCAAGTCGTTGGAACAACGAGAGAGGGAATACGAGAGAGTCAGGAGAAGAATTTTCAGCACGGATAACTGCACCCAGGACGAGACGCAATGGCCCTGGCTGACTTCCGGACCCGTTAAGCTGCTGACACCGGACACTGGCAGGAACAAGTTATTGAAGGTGCACTCCCTGGAGGCGAAGTCCCCGGGCCGGGGGGTGGTGTCGAAGAGTCACAGCTTCGGGGGATACACGGACCCCCAGCAGAGAGTGCTCAGCAGACAGGGTGACCTGGCGTCATCCAGCTGGCGTCTCTCTCCGTCCAGCTCCGGGTACAAGACCCTCAGTTTGCGGAGCACGGATTCAGTCACACCATCACCCACAGGCGGTGCGAGTCCTGAGCCGGGGCCCCCTTCCCTGTGCGTGCCGGGGACCTCGGGGGCCCTCGTGTGGGCTGTGACCGACATGGCCGCGGTCCCGCCCGGGGCACTAGTCATACATCCGCAGACAGGCCGGCCGCTCACCAACCCGGACGGCAGCCTGTACCACTTCGACCCCGAGAACCCGCCGCGCCTGTACGCGGACCGGGGGGAGGTAACCTGCTCGCCCCAGCTACACCACGCGAGGGTCGACGGCAGCGCGGAGAAGAGACGCGGGAAACTGGAAAAACAGAACTCCTTCATAGATAACGAATGCGACTTCGATTCCAAGCGGGACAAGCGCTGTGACTGCGCTCCAGACAACGACGGAGGCCAGCGGAAACCGAAGACGCCGGCAGCGGCGAGCCCGAACAACACGCGGACCGCGCACGACGAGCAGGCGGCGCCGGCCGCGCCCGCGCCCAACGGAGACGTGGACCAAAGCGAAGTCGCTGAAATAAAACAGGCTCTCGAGAATATTAAAATAACACAGAAATCACCGGTCAAAGAAAAGAAAGACGTCCAAATCGAACCCGTCAATCAGATTCAGTCTCCGAGGTACGATGCGGCCAATCAGGTCGCGTCTTCGCCGAGGTTCGAGTCGCCGGCCAGTCAGACGGCCTCGAACCAGCCGCAGAGGTTCGAAACGGCCAATCAGATGCAGCAGATTCAGAGATTCGATTCACCGGCCAATCACGTGCAGGCTGTCCAGAGATTCGATTCCCCCGCGAATAACAGACAGTACGACAGATATGACGTCCCCAGTAAGGCTTTGGAGAATAGGAATTTTGACAATCAGAGGAAGTTTCTAGAAGAGGCTTATCACGAGAGCTACGTCCCGTATAAGAGTGAGGAGGTGAGCTCGTGTGCGCTCTAA

Protein sequence:

>DPOGS210192-PA
MVGRNMLLCIYLREKRKIYYECNIQREKGPPYIRTLPPIKVQSGDSLKLRCPFYGFPISKLEWEHRGKKIISTMLPQHARYKRTENRFSDKHNIIERRERQVIETSEDGLLNIQRVVKEENGEMYTCIVYSPSGEMARRSFEIQVVEAPELDELRVGSGLKEGQIVQITCNIIGGDPPIFFSWLKDGMKIPASLKISTGMEQPEVEKGCGSSEYGAQLTRNRSFKSKQLVRSQAIREATSPPRTASPLASDKPNVTGNAVEKRSNSETSSHSDGGSVVSNDSKQPVEIQITSNSWEDGNSDQRQRTRRWLGHHHSDSARDLLTHGPRVACVCGACECPHCRSYYDVISSYVLLTSSEGAEENTRVRRNRTLASFVLTIVLIAPTQNMRVLTVTALGCPGVWTATIRRIIAGIKRTPSGCFQHLVHVVTGHPYISRCIDRKDKPKSMCIGGNEFEDKTDLSGPELVAFIKETLNKNPRDRATLLRIEKELHGLVTDNSDRVTAASVLTCPGHQSITNHHHLIILIMTTSALPSRCIVRFPVMTSYGRMLVHRCAALFQLAHHLDHSNKNSVLVSKSGSYHTVTGTCGGRLPCTSFREWCTTVFPRSPTHEDTLAKSILKRCSGPPGTASSAAGRSKSLEQREREYERVRRRIFSTDNCTQDETQWPWLTSGPVKLLTPDTGRNKLLKVHSLEAKSPGRGVVSKSHSFGGYTDPQQRVLSRQGDLASSSWRLSPSSSGYKTLSLRSTDSVTPSPTGGASPEPGPPSLCVPGTSGALVWAVTDMAAVPPGALVIHPQTGRPLTNPDGSLYHFDPENPPRLYADRGEVTCSPQLHHARVDGSAEKRRGKLEKQNSFIDNECDFDSKRDKRCDCAPDNDGGQRKPKTPAAASPNNTRTAHDEQAAPAAPAPNGDVDQSEVAEIKQALENIKITQKSPVKEKKDVQIEPVNQIQSPRYDAANQVASSPRFESPASQTASNQPQRFETANQMQQIQRFDSPANHVQAVQRFDSPANNRQYDRYDVPSKALENRNFDNQRKFLEEAYHESYVPYKSEEVSSCAL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: