MonarchBase - Protein-coding gene

DPOGS206459
Transcript	DPOGS206459-TA	3525 bp
Protein	DPOGS206459-PA	1174 aa
Genomic position	DPSCF300070 - 41999-45523
RNAseq coverage	526x (Rank: top 24%)

Annotation
*Heliconius*	HMEL012934	0.0	75.95%
*Bombyx*	BGIBMGA005470-TA	0.0	64.85%
*Drosophila*	su(s)-PA	2e-42	37.45%
EBI UniRef50	UniRef50_UPI0002246FC7	9e-71	40.35%	UPI0002246FC7 related cluster n=1 Tax=unknown RepID=UPI0002246FC7
NCBI RefSeq	XP_001660611.1	2e-58	43.32%	hypothetical protein AaeL_AAEL010074 [Aedes aegypti]
NCBI nr blastp	gi\|340726374	7e-73	37.80%	PREDICTED: hypothetical protein LOC100649901 [Bombus terrestris]
NCBI nr blastx	gi\|322784362	3e-127	31.02%	hypothetical protein SINV_01065 [Solenopsis invicta]

Group
KEGG pathway
Orthology group	MCL18837		Insect specific

Nucleotide sequence:

>DPOGS206459-TA
ATGGCAGATCCAGCTACAGTTACAGAAGATTTAGAAGATGGTGAGATTGAAAGCGATGGGGAAGAAACAAATGAAACACAAAATGAAGAAAAGCCGGAGGAAGCAGCTGCAGTTGTTGAAGAAAATAAAGCAAAAGTAGATAGTCAAAGTTTTTATTATTCTAAGTCAGGTAAGAAGAAGAAGTCAAAATCAAATAAGAGCGAGCAGAAGGTTAAAGATAAAAGTAAAAAGAGTCGGAAGTATGCGGAAACGATTGAGGATGACTTTGCCGGTGGGATAGAAAAAGCAATAAGAAAGGCTATGAACAAAAACGATGGCAACAATTTTCAAGGTGAAGCTGAAGGCGAAGAACGTAGGAAATATAAAAAGAGAAAGAAATACGATGGAAAGGAGGGGTCGAGTAAGAAGCGCAAAAAACAGGAGTATTCCGATGAAATGGATGAAGCGGAAATGATGTGCGTTCGCGGAGCTTCGCCGGTACAGAAACAGTCTCAGGATGAAAGCTATCAGGAACAAGACTCGTACGAATCTGATAGCAGCCAAGATTCACGAGGACACCAGCAGCATCGCCAGCAGAGGCATCGACCACCACAGCGGGAGAGAAATAAAAATAATAAAAATGATAGGAGGAGGGGGGGAACACATCCCATGCAAGATCCCGATGGTGTTTGTCTGTATTACATGCAAGGAAAATGTCACAAAGGGGACGATTGTGTGTACTCTCACGACGCACAGCCGCCGAGGAAAATGGAACTATGCAAATTTTATTTAATGGAATGTTGCGCCAAAAGAGATAAGTGTCTGTACATGCACGCTGACTTCCCTTGCAAATACTATCACACTGGGCTTCCATGTATTTATAAAGACGAATGTAAATTTGCGCACGGTAAACCTTTAAGCGATGCACTCAAAAATATTTTATTGAAACACATCGAATCAGCTCCTAAGGAAATATTAGGTGACTTCCCAAGACTCAATAGAGATGGAGCGTTAAAAATGTTACAAAATACACAACTCAAACTAATGCAACAATATTCAGAGAGCACGGACGCTGAAATAAAGAATATTCCGTCACTCTTCGATATTAACATACCTAATCCTCAACTAAATGTAGATTCGTCTCAGAATAGTTCTTTTAACAACGAAAGGCAGAGCAAGGTATCACCTAAAGTAAGGCAGTCGAGGTGGCAAAATGACGAGTCGAATCAAAATCAATGTCATTCACCAAACAGCAATGCAAGTTCAAATGTTCTAAGTATTAAAAACTTAACCGGTGTATTATCGCCTCGACAAATTTATGAACTCACAAAGATAGGTATCGAAAACTTAGATCAATTGAGTCAGTTAACAGTATTACAGTTGAATAACATCGGTATATCCTTAAAACAAATCTCTGACATACAACTGAACACAATGAGCATCCAGAAATTAGGTTTAATTAGCAATACTGAACAACAATCCCCACATCATCAATTCGTTAGTACTAATGTTCCTGCAAAGGATTTAGATTTAAGAGTACCGCCCGCAGCACTGCCTTCGTCGAATAGTTTAGCTATAGCATCCGAATTACCCGGTCAAGACGTTGATATGCGTTTTCAGCCGAACACACAATCACTTAGTATCAAAGAAGAGTCGAGCAATAAAACATCTAAAAGAGAAACAAGCAATAAAGACATGATTGATATAGATCAGTACACAAAAGATGCGTTAAAATTTGCATCAAAAGATAAAGAAAACATAGACATTTCAAACGAGACTGTAGACACTGAAAAGAATAGTACTTCAAATGAAATAAAAGATGTAGATCACAGGGTCATTCCATTTTCTGATGGCGGGTCGAGTAGTCATAATGCTAATATAGAAGAGAATACTCTGCGTTCGGAGGCGGATACGGACATACGGTTTCTGCAACCGGATCCTATATTTAAAAATGCTGAGAAGAAACATCGTCGTTCGACTACGGACGACGATGAAGATAACAATTTACTGATCGACGAGAAATGGTATTCAAGTGACGAAGAAAAGGGAAATAAAAAGAAATCACCCATATCCTCACCTCAGAAGTCGTTGATGTCACCGCCGCCGGTGGTTCCGCCTGTTATAGAACCTTCGTCGGTTTTGAGTAAACTTGGTGATCTATCAAAAATAGATATCAGCGAAGAAGTTACAAAGCTGCTCAATACTATGAAACATAATTTACACGAAACTCCAAGTCAAGAAACTCAAGAGCCGACGATATCAAGAGATCCTCGTTCTAGAAGATCCCCTCCGACGTCTGTGGACACCAGTGTAGAAACAAGTAAAACGACGAGTAAGAAGACCAATCGAGTGTCTATATACGAATGTGTTGACGGTGAACCCACGGATGGGCGTCGAAGAACGGACGTGGATCTCCGGACGACGGATTTCAAAGGCCCCAGCTACGGTGACACAGACTTGAGACAAAACACCAGCGGTGACATAGATTTACGTCTAGGCTTACCGTTCAAACCGATACCTAACTACACGCCAGCCTCAGAAATAAACGGTTCAATTAACAGTCATCCGCCGATACATTACAAACTAGTTGCCATACACATACCGCGTCCTGATTACACGGATATCAAAAATAGCACAGCGAAATCACAAGCACTGACGGATCCTAGGTTAAGGAAAGTATTCAGATTGTCCGTAGAAGAAACTAATAGTGACAGTGAAAAACCAGCGAAAGTTGTAAATACAGGGCCCCGAGTGGACCCCAGACGGAAACCTAAAGATCAAATCGATACCACTAGTCAAGAACAAAAATCTAACTCATTAGAATTACAGACGATATTACAAAATTCAAATTGGTACAAAGATTTGAGTTCCACACAGAAGATATTCGTGAATCAGAATCTAGCACCGGTGACGCAGATGATAAAACAACACCATCAGGAAAAGCAAATGGGTAAGAAATTTGATATAGGTTCAATACAAAACAATAACGTTCTGTGTAGCATATTCACTAATCTAGGCGTGACTCTTGGAGAAAACGGTGAGTTCTCGTATTTACCTAAACCGAAGGAGGCTCTGCTGAAGACTCCGATAGGCTTTAGTCAGAATTCAAATCCTTTCGGCATGAACAACATGTCCGGAGGCCATGGGCCTATGGAGGGTAATATTAATATGATCAATATGCCGCCAATGGGCATGGCTGGTGTAGGAAACATGTCTAATATGAATTCATTGCACGGCTTCAACCAGCCTATGTCGGACCCCAGAGGTGGGCCGACTCCGGGCCTGCTGGGCATCGCGCCGAACATACCTCATAACTTTAACAACAACAAATTCGGTGGTCCACATAATTTCGGTAACATGGGATTCAACGGTCCGCCTAACGATTTTAATTTTATGGAGGGAGATCAGAACTTCCAAAGATTTCCCAACAGAGGAGGTCTCCGCGGCAGAGGGAACAATGATCGCTGGAACAGAGGTGGAAATAGGGGGCATAGGGACAGGAAAAATTTCAACGAGCGAGGTAATTGGAAAAACGACAGGCATTAG

Protein sequence:

>DPOGS206459-PA
MADPATVTEDLEDGEIESDGEETNETQNEEKPEEAAAVVEENKAKVDSQSFYYSKSGKKKKSKSNKSEQKVKDKSKKSRKYAETIEDDFAGGIEKAIRKAMNKNDGNNFQGEAEGEERRKYKKRKKYDGKEGSSKKRKKQEYSDEMDEAEMMCVRGASPVQKQSQDESYQEQDSYESDSSQDSRGHQQHRQQRHRPPQRERNKNNKNDRRRGGTHPMQDPDGVCLYYMQGKCHKGDDCVYSHDAQPPRKMELCKFYLMECCAKRDKCLYMHADFPCKYYHTGLPCIYKDECKFAHGKPLSDALKNILLKHIESAPKEILGDFPRLNRDGALKMLQNTQLKLMQQYSESTDAEIKNIPSLFDINIPNPQLNVDSSQNSSFNNERQSKVSPKVRQSRWQNDESNQNQCHSPNSNASSNVLSIKNLTGVLSPRQIYELTKIGIENLDQLSQLTVLQLNNIGISLKQISDIQLNTMSIQKLGLISNTEQQSPHHQFVSTNVPAKDLDLRVPPAALPSSNSLAIASELPGQDVDMRFQPNTQSLSIKEESSNKTSKRETSNKDMIDIDQYTKDALKFASKDKENIDISNETVDTEKNSTSNEIKDVDHRVIPFSDGGSSSHNANIEENTLRSEADTDIRFLQPDPIFKNAEKKHRRSTTDDDEDNNLLIDEKWYSSDEEKGNKKKSPISSPQKSLMSPPPVVPPVIEPSSVLSKLGDLSKIDISEEVTKLLNTMKHNLHETPSQETQEPTISRDPRSRRSPPTSVDTSVETSKTTSKKTNRVSIYECVDGEPTDGRRRTDVDLRTTDFKGPSYGDTDLRQNTSGDIDLRLGLPFKPIPNYTPASEINGSINSHPPIHYKLVAIHIPRPDYTDIKNSTAKSQALTDPRLRKVFRLSVEETNSDSEKPAKVVNTGPRVDPRRKPKDQIDTTSQEQKSNSLELQTILQNSNWYKDLSSTQKIFVNQNLAPVTQMIKQHHQEKQMGKKFDIGSIQNNNVLCSIFTNLGVTLGENGEFSYLPKPKEALLKTPIGFSQNSNPFGMNNMSGGHGPMEGNINMINMPPMGMAGVGNMSNMNSLHGFNQPMSDPRGGPTPGLLGIAPNIPHNFNNNKFGGPHNFGNMGFNGPPNDFNFMEGDQNFQRFPNRGGLRGRGNNDRWNRGGNRGHRDRKNFNERGNWKNDRH-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: