MonarchBase - Protein-coding gene

DPOGS207937
Transcript	DPOGS207937-TA	2577 bp
Protein	DPOGS207937-PA	858 aa
Genomic position	DPSCF300090 - 406586-433743
RNAseq coverage	55x (Rank: top 69%)

Annotation
*Heliconius*	HMEL021520	2e-116	77.33%
*Bombyx*	BGIBMGA000378-TA	0.0	74.37%
*Drosophila*			%
EBI UniRef50	UniRef50_B4QRN0	0.0	55.20%	GD13896 n=10 Tax=Neoptera RepID=B4QRN0_DROSI
NCBI RefSeq	XP_001815363.1	0.0	60.82%	PREDICTED: similar to AGAP006590-PD [Tribolium castaneum]
NCBI nr blastp	gi\|189237416	0.0	60.82%	PREDICTED: similar to AGAP006590-PD [Tribolium castaneum]
NCBI nr blastx	gi\|158296113	0.0	59.82%	AGAP006590-PB [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0005515	1.9e-38	protein binding
KEGG pathway
InterPro domain	[37-142] IPR000697	1.9e-38	EVH1
	[44-143] IPR011993	3.7e-18	Pleckstrin homology-type
Orthology group	MCL18469		Insect specific

Nucleotide sequence:

>DPOGS207937-TA
ATGGGCAACAAACTATCGTCTTGCTCGTGCGCGCCCATCCTCCGCAAGGCGTACCGCTATGAAGATAGCCCGTGGCAGAACTCCCGACGACGTGATGGACATCTATTAAGGCTGTGGGCGGAGGTATTCCACGTGTCAGCCAGTGGAGCTGGTACAGTTAAATGGCAGCAAGTATCCGAGGACCTGGTGCCAGTCAACATCACCTGCATCCAGGACTCACCGGAATGTGTGTTCCACATCACCGCGTATAACTCACAGGTCGACAAAATTTTAGACGTCAGACTACTCCAGCCTGGCACTCGTATCGGTCAGGCCTCCGAATGCTTCGTGTACTGGAAGGATCCTATGACTAACGACACCTGGGGCCTCAACTTCACTTCGCCCATCGATGCAAAACAATTTAGGGAATGCTGCTCACCATCATTCAAATTCTCACGTAAGGCATCTTCGAGCTACAGCCTGAAACTCGAGCCACCGGGCAGCAAGCAGAAGATGAAAACTAAGAGGAAACCAGTATCTACACCAGCCAGCCCTAACCGATCGAGTCTGACATATGGCCGCGAACCACAGTGCACTTGCATGACTCAAGAACAATATTCCAGGCTACGAGCTCAAGACCCTCGCTATCGCTCGTCAACTTTGCCGCGAACAGCTACTCGTGCTATTGAGACGGACGCAGCCGCTGGTGCAGGTCGCTCCGACAAAGTCGCCGCTGCAACATCTTCCACATCGCTTTACGACAATGTCACCAATACACAGCCGCAAAACCAGGCGCCACCTAAACCTGCAACCCGCCAGAGTGAGAGTCAAGCTCCATCGCGTCCTCCAAAATCTCAAGAGACCTCCACCATGACTACAAACACTTCAACTGCTCCGAAAACGGTGACAGCATCGGTTGGAACACATGGCACTAGTACCAGCGAGGAATCACAAACCTCTACGGGCACTACAGTTCAGCATGCTCAAGACCTGAAGTCTGAAGGGGTACAGGCTGGCGGAACGCTTACCTCCAAATCTTCCTCAACATCCACTCGATCAAAGGACCACCTGCAGCACATGCCTAAAAGTGTGGACTACGGAGATGGAAATGAATCTTCTCGTGAATCTGACAGACACTCTATGCACAACCACAACGTAATCAATAACAACACATCTGGGTCACGACGTACAAAGTCAAAAAGCACAGAAGATATGAATATGGACTCGAGCACTCTCAAGCGTATGCTCAAGCCGATGCCATCTACTGAGAGCCCAGTAACGTCACCGGAAATGGGGCGCCGGCGGTACGGCGGTGCCTGCCCACCGACCTGCGGACCCCACGGACATCGCCACCAACCACACGGTCATGGACATTACGCCCATATCGTCAACAATAACAGCAGACAGGGATCTCAAAGATACTCATCATGCCGTGGCGTTGGTGTGGGTGCAGCACCAAGTGGCTACCCCGGCCGTGGCTTATATTTGGAGCTAGGAGGTGGTGAAAGGGATTTATCCCCTCCGTCTGATAATGTGATGTTCGATAATCAGTGCTATGCCACGACTCCGTCATCATCCAACGGCAACTCTGATCAGGAACCCTGTCGCCGCGACCGGGAACAAGCAATGCATCAGAGGCAGCATCATCACGGTCAGAAACCCTGCCTGTCTCGGCAGGCATCTCAGTCTAGTGCGACACCAGCCCCAGGCTCCCCTACATCTCGTTTGCTGTTAGAATATGAAATGCATCTCCGGAATACTCTCGCTAAGGGCATGGACGCTGAGAGCTACAGCCTGCATACATTTGAGGCCCTGTTGAGTCAGAGTATGGAAGACTTAGAATACAACGACAGCATGCCGCCTTCAAATCAGCGCAGTCCATATCCGTCTCGTAGAAGACCAGCATCTCAATGTTCCGGCGGTGGCAGCCGCTCCTCCACTTTGCCCTTGCCACATCGCCTCGGTGTTGAGAGACAGCACAGCGCACGCTCTGACCGCGATGGCTATTACAGTTTTGTAAGTGCGTCTCGTTGCGCTTCTTGCATCGGCGAGTCAGCTCGGTCGGCATGGTACCGTCATTCTGATGGATGGCGAGGCGCTCCACCACCAGGCCCTCGTCGTTCACCCTGGGACTCCTTACCAAGTCTACGACATGAAGGCAGCCTTAACGACTCTGGTTACAGAAGCAATCGAGCTGATAGCTTTGAACAACGTTTTGTAAGTGCGTCTCGTTGCGCTTCTTGCATCGGCGAGTCAGCTCGGTCGGCATGGTACCGTCATTCTGATGGGTGGCGAGGCGCTCCACCACCAGGCCCTCGTCGTTCACCCTGGGACTCCTTACCAAGTCTACGTCATGAAGGCAGCCTTAACGACTCCGGTTACAGAAGCAATCGAGCTGATAGCTTTGAACAACGTGGTGTGTTCGACCGTCAAGACAGCGTGCGCTCAGAGTACACAAGTGACCGGGAATCCTCACGTTATGGCATCGTACAGCAAGCCTCTATAGATAGCACTGACTCCAGAATTTGTTACCTGACTTCTAGCGAGGCCCTATTCGTCGTTTACATTAACAGGTATAATAGAATAGCAGATGACTAA

Protein sequence:

>DPOGS207937-PA
MGNKLSSCSCAPILRKAYRYEDSPWQNSRRRDGHLLRLWAEVFHVSASGAGTVKWQQVSEDLVPVNITCIQDSPECVFHITAYNSQVDKILDVRLLQPGTRIGQASECFVYWKDPMTNDTWGLNFTSPIDAKQFRECCSPSFKFSRKASSSYSLKLEPPGSKQKMKTKRKPVSTPASPNRSSLTYGREPQCTCMTQEQYSRLRAQDPRYRSSTLPRTATRAIETDAAAGAGRSDKVAAATSSTSLYDNVTNTQPQNQAPPKPATRQSESQAPSRPPKSQETSTMTTNTSTAPKTVTASVGTHGTSTSEESQTSTGTTVQHAQDLKSEGVQAGGTLTSKSSSTSTRSKDHLQHMPKSVDYGDGNESSRESDRHSMHNHNVINNNTSGSRRTKSKSTEDMNMDSSTLKRMLKPMPSTESPVTSPEMGRRRYGGACPPTCGPHGHRHQPHGHGHYAHIVNNNSRQGSQRYSSCRGVGVGAAPSGYPGRGLYLELGGGERDLSPPSDNVMFDNQCYATTPSSSNGNSDQEPCRRDREQAMHQRQHHHGQKPCLSRQASQSSATPAPGSPTSRLLLEYEMHLRNTLAKGMDAESYSLHTFEALLSQSMEDLEYNDSMPPSNQRSPYPSRRRPASQCSGGGSRSSTLPLPHRLGVERQHSARSDRDGYYSFVSASRCASCIGESARSAWYRHSDGWRGAPPPGPRRSPWDSLPSLRHEGSLNDSGYRSNRADSFEQRFVSASRCASCIGESARSAWYRHSDGWRGAPPPGPRRSPWDSLPSLRHEGSLNDSGYRSNRADSFEQRGVFDRQDSVRSEYTSDRESSRYGIVQQASIDSTDSRICYLTSSEALFVVYINRYNRIADD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: