MonarchBase - Protein-coding gene

DPOGS203296
Transcript	DPOGS203296-TA	3282 bp
Protein	DPOGS203296-PA	1093 aa
Genomic position	DPSCF300003 - 1289947-1356539
RNAseq coverage	120x (Rank: top 58%)

Annotation
*Heliconius*	HMEL006377	72.80%
*Bombyx*	BGIBMGA012247-TA	74.26%
*Drosophila*	CG32809-PD	46.84%
EBI UniRef50	UniRef50_D6WJQ1	49.19%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6WJQ1_TRICA
NCBI RefSeq	XP_001966421.1	46.86%	GF22008 [Drosophila ananassae]
NCBI nr blastp	gi\|270006665	49.19%	hypothetical protein TcasGA2_TC013023 [Tribolium castaneum]
NCBI nr blastx	gi\|270006665	45.92%	hypothetical protein TcasGA2_TC013023 [Tribolium castaneum]

Group
KEGG pathway
InterPro domain	[181-260] IPR022782	1.4e-10	Actin interacting protein 3, C-terminal domain
Orthology group	MCL14110		Insect specific

Nucleotide sequence:

>DPOGS203296-TA
ATGTTAAGTAGGTGGAAAAGTAAAGACAAGTCAGAGAAATCTGGCAAGTCTTCAGGTTCGAGTAGCAAGAAGAAAAGAAAAGGTCGCGACAATGAAGAGGACTGGCAAAGCGATCCTAGACTTGACGGTGGTCAGTCTGACACAGAGGCAGGACGGGGGCCGCCGCGGGGTCGGCGTAACCGACGAGATGATCCCCGACGACACACACTTGCTGGCAACCATTTGTATACACAGCAAAGCGCGATTACTGGACTCGATGAGGAGAGATATCGTGTTGCGAACGTGAACATTCCAGAATACGCTGTTCCTGATAAAAATCGCATTATGAAGCCTTATCCACAAATATATCCTAGAATGAAAAAGCCGCCACTACCTCGGTATCTGCCGGCTCCCAGCAACATGTTGTTTGAGGACGATCCGGGCGTAATGTCCGAGGTTGAAACCTCATCCACTGGATTTAGACGCGGAGGGAAACAACGGTCTTCACTACCCGTTGTTCGTACCCCTAGCAAAACACTGGAGCGCCCCCTGGGTTTGGTTTTTCTACAATATCGTAGTGAGACCAAACGGGCGCTCCTACCAAATGAAGTCACCTCTATCGATACTGTAAAAGCACTTTTTGTAAGAAGTTTTCAAAAACAATTAACTATGCAATACATGGATAGCGATCACGTGAAGATATACATACACGACACATCGAAAGATATGTTCTACGAACTTGAAGACGACAGGGCACATCTACGGGATATTCGTGATCGCTCTGTACTACGACTATTTGAGGCAACAGACGTGGGCGGAGGAGTTTTTCCCGGTTCAGTCGGGGCAAGCTCCGTGGCCATGCCTTCAACTTCGTCCTGGGATCAGGACCAGAATTACTTCAGCGAACCTGAGATCGACTCGGACTACCATCACCAACATGTCCATAACAAGAGCAAAGTAAAGGCTCCTGCTTACTACATGGGCACCCCTGCTCCTAGTACCCTTCCGCGTGGAGGGTCTCTTCTTCGTGCTTTTTCTCCCGCTGCTCCCCCTGTTCCAGCTGATCGAGTCAAAGCTTTGCCACCAGGTCCTACAGCGCCCAGCAAACCGGTCCGCTCGTACATCCCGGGAAGCGGATCGGAGCGGTGTTTCCCCTTTGCCTCAGCTGAATGCCCTCGCGGTACCGACCAACTATACTCTATCCCTGCTCATTCTGGCGATGGATATATGTCGTCTCCCGAACGCAGCGCGCCACGGCCTTATGAAGACCCTTACTACACTCAATTCCTTGGCCCATCTGCAGGAAGGACTGGAATCGCTCCAGTTATTGACGAAGAAGCCAATGACTCGGTGATAATAGATGATGCATACCAAATGTATGGCGTAAATGCAATAACAACAGCACCTCGGCCCATGCCGCGGCCGGGCCCATTCGAAAGGCTTGGCGCGCCACTCGAAGATATGCAGCGTCTCCGTGTAGAGAAGATGGAACGTCAGCTCGCAAACCTTACGGGACTCGTACAGAAAGCGCTGCAAGTCCCAGCGGTGGTGCCCGCACCTCCTGCTGTAGCTCCTAGACAGGAGTATCAACCCTACGCTGCAAGACCAGCTACGCAAGATGCAGCACGATTTGCCAGCACCGAGAGACCTCCAAAATTAGGCAAAGACAGATTTCAAAAATCTGTCTCTTTTGAGAAATCGGTATCCTTTAGCGATGACCCACCAGATATGAATTCTCCCAAACAGCATTCGCCTCAACACTCAGAACGTGATCGCTTGAAGCCTGCCCCGCCGCCCAAGCCAGTTGGACTCGTGGGCCAGCAGCTTCCCTTGCCACCTCAGAAGACCTGCACTCTTAACGTCAATCCAGATTTCTTTAATCAACTACGGTCTCTACAGAAGCAAAGCCGTGATCTTCGTATTGAGACTCGCAATCTTCGTCGGTCTACTTTAAATCAATCCATGCAGATGAGGCAATTGATGGCCGACACCATTACAAAAATAGGTGCCATCGCTGCGAGCTTTTGTCAGGAAGATCCAGACTCGCAACTAACTCGCGAAGAAGAGATCTATCGCCAGGATATGCTGCTATTGGAGAACGATTTGTATGAATTGGAAGCCACAGTTGAACGTCTGCGTGGCCAAGCGGCAAATAGGGAAACCCGCGTCAATATGGCGGACATCGAGCGCATTGCAATGGTGCTTTCAAAGAGCAGCAAAACCGTAGCCGACTGGAAACTGAAATTCCCGATTCTTCAAGAAACAATGAAGACTAAGCTTGCTGGTGAAATGGAAAAGGTGGTCCGTAAGGAGAAAATGCTGGAAGATGAACCAGAGCGTTTGGAGCTTGCTTTGCGTCGCTGCAAAAAATTGACAGGCACGCTTGTGACTTTGAAGAGGTTGGCTTGCGTCCAAGAACAGCGCCTGCCGGTCGGCGACGGCCGCGTGTCTCCGAGCTCATCCCAGAGCTCCATCACTGTGGGCCCCTCATCTGAGGAATATACTTCCGAAACCGCATGTGCAAGTGCGCCCACCAACAAGGCCGCCAGCGGCGGGCGAGGTGCTGCGCCCCGGGGAACAACGGAGCTGCGGCCAGAGAACGCCCTCGATGCGTTACTAGACGAACTGCAAACTTTCGCCAAACCGGCGGAACGCGGCGGGCGCGGCGACCCCCGAGACCCTCCTCTGCGCCGCCTTCACTCTTACCCCAGCGGCAGCGATACGGATGCTTCGCCCCCGGTACGTGCTCGCGGCCAACACCCTCCAAAGCCTCCAGTACCGGAGCGACATCCTGAACTTCTAGCAATGGCCGTCCGTCGCGCCCCGCCGCCGCCGCCGCCCCGCACCACCTCCCGCTCCCCGCTGGCCTCACCAACCTCACCACCCTCGCCCCCTTCGCCGCACTCCCCCCGCTCACCCTCTTGCCTAACTCACACCGCTGAAATCAACGATGACAAAAACGCCTCGCGTCAAGCTCTCCTAGAACAGCGCCACCAAGAGCTCCTTAAAAAACAAAAGGCACTACAAGAACAATACGCTAGACTGCAAATGATCCAACGCAGTGGGCCCACATTACCGATTAACGCCCAACCTGATCTTAAAAAAACTGGTAGCGAATCTAATCTCCTCACAAAATTAAATCTTAATCTAGCACCAGCTAATATGTCCGGCAGTATGACACATTTAGCAGGAGAAAGTAAAAAAAAACAAAACGATTTAACTTCAGAGCAACAAAATCCTAAGGAGACAGTGCCTGACGCGATGGCCACTACTAATAAGGTTTACGAGACTGACATACTGTGA

Protein sequence:

>DPOGS203296-PA
MLSRWKSKDKSEKSGKSSGSSSKKKRKGRDNEEDWQSDPRLDGGQSDTEAGRGPPRGRRNRRDDPRRHTLAGNHLYTQQSAITGLDEERYRVANVNIPEYAVPDKNRIMKPYPQIYPRMKKPPLPRYLPAPSNMLFEDDPGVMSEVETSSTGFRRGGKQRSSLPVVRTPSKTLERPLGLVFLQYRSETKRALLPNEVTSIDTVKALFVRSFQKQLTMQYMDSDHVKIYIHDTSKDMFYELEDDRAHLRDIRDRSVLRLFEATDVGGGVFPGSVGASSVAMPSTSSWDQDQNYFSEPEIDSDYHHQHVHNKSKVKAPAYYMGTPAPSTLPRGGSLLRAFSPAAPPVPADRVKALPPGPTAPSKPVRSYIPGSGSERCFPFASAECPRGTDQLYSIPAHSGDGYMSSPERSAPRPYEDPYYTQFLGPSAGRTGIAPVIDEEANDSVIIDDAYQMYGVNAITTAPRPMPRPGPFERLGAPLEDMQRLRVEKMERQLANLTGLVQKALQVPAVVPAPPAVAPRQEYQPYAARPATQDAARFASTERPPKLGKDRFQKSVSFEKSVSFSDDPPDMNSPKQHSPQHSERDRLKPAPPPKPVGLVGQQLPLPPQKTCTLNVNPDFFNQLRSLQKQSRDLRIETRNLRRSTLNQSMQMRQLMADTITKIGAIAASFCQEDPDSQLTREEEIYRQDMLLLENDLYELEATVERLRGQAANRETRVNMADIERIAMVLSKSSKTVADWKLKFPILQETMKTKLAGEMEKVVRKEKMLEDEPERLELALRRCKKLTGTLVTLKRLACVQEQRLPVGDGRVSPSSSQSSITVGPSSEEYTSETACASAPTNKAASGGRGAAPRGTTELRPENALDALLDELQTFAKPAERGGRGDPRDPPLRRLHSYPSGSDTDASPPVRARGQHPPKPPVPERHPELLAMAVRRAPPPPPPRTTSRSPLASPTSPPSPPSPHSPRSPSCLTHTAEINDDKNASRQALLEQRHQELLKKQKALQEQYARLQMIQRSGPTLPINAQPDLKKTGSESNLLTKLNLNLAPANMSGSMTHLAGESKKKQNDLTSEQQNPKETVPDAMATTNKVYETDIL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: