MonarchBase - Protein-coding gene

DPOGS213498
Transcript	DPOGS213498-TA	5226 bp
Protein	DPOGS213498-PA	1741 aa
Genomic position	DPSCF300100 + 434310-451600
RNAseq coverage	119x (Rank: top 58%)

Annotation
*Heliconius*	HMEL016828	87.15%
*Bombyx*	BGIBMGA004379-TA	82.65%
*Drosophila*	pds5-PB	49.74%
EBI UniRef50	UniRef50_A1Z8S6	49.74%	Pds5 n=36 Tax=Pancrustacea RepID=A1Z8S6_DROME
NCBI RefSeq	XP_623860.1	64.30%	PREDICTED: similar to CG17509-PA [Apis mellifera]
NCBI nr blastp	gi\|307173484	64.67%	Androgen-induced proliferation inhibitor [Camponotus floridanus]
NCBI nr blastx	gi\|307173484	64.67%	Androgen-induced proliferation inhibitor [Camponotus floridanus]

Group
Gene Ontology	GO:0005488	8e-33	binding
KEGG pathway
InterPro domain	[641-1544] IPR016024	8e-33	Armadillo-type fold
	[1478-1552] IPR011989	1.3e-12	Armadillo-like helical
Orthology group	MCL11375		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS213498-TA
ATGGCGGAAATAGTGTACCCGCAAGGCTGCCGTCCTATTACCGATGACCTAGGACCAGACGAGCTTGTGAGAAGGCTTAAGGCTCTAGCGCATACCCTTCAAGGTCTCGGCCAAGATGAGGGCATGTACCAGCAGTACATACCTCTGGCCCTGCACCTCGCGGACGAGTTCTTCCTCACTCATCCGTCCCGTGACGTCCAACTCCTTATAGCCTGCTGTATAGCTGATGTTCTCAGGGTATATGCGCCGGAGGCTCCATACAAAGACCAGGAACAGGTGAAAACCATATTCCTGTTCCTAATAAACCAGCTGCAGGGTCTCCGTGACCCCAAGGACCCGGCTTTCAAACGTTACTTCTACCTGCTGGAGAATCTGGCTTACGTGAAATCATTCAACATGTGCTTTGAACTTGAAGACTGCCAGGAAATATTCTGCGCTTTGTTCTCACTTATGTTTAAAATTGTCAATACGGAACACTCTTCGAAAGTGAAATCCTTCATGCTTGACGTCCTCTGCCCTCTAATCACCGAGTCCGACGTGGTCTCCAACGAACTGCTCAACGTGATACTATTGAATCTGGTGGAGCCAAACAAAAGGGAACACAAGCACGCTTACACGCTAGCCAAGGAACTCATTATTAAGACAAGCGAGACCTTGGAGCCGTATATACAAGCATTCTTTAACCACGTCCTGATTTTGGGCAAAGAAGAGAAAAATCTTCTCATATTTTCCAAAGTGTACGAATTAATATACGAGTTAAATCAGTGTTGCCCGTCTGTTTTGCTCTCAGTGTTGCCACAGTTGGAATGTAAATTAAAATCAGCACAATTTCACGAGCGTTTATCGGCCGTGGCTCTGCTCGCTAGAATGTTTTCCGAGCCGGGTTCGGAGCTCGCCAAGCAATATCCGGCTTTATGGCGAGCATTTTTAGGTAGATTCAACGATATATCAGATCAGATAAGGATAAAATGCGTCCAGTACTGCATGCATTTCCTGGTGCACCATCCGGACCTGAGGAAAGACATAACGGACACATTGAAGATGAGACAGCACGATGCACAGGAGCAGGTCCGCTATGAGGTCGTCATGGCTATCATAGCGACAGCTCAGAGAGATTTCAAAGCGGTCGCAGCATCCGAAGATCTGCTGCATTTCGTCCGCGAGAGGACCTTAGATAAGAAGTTCAAGATCCGCAAAGAAGCTATGTCCGGCCTGGCCATGATATACAAGAAGTTTTTAACAGAGGAATCTGTGCCGCCCGCCACCGAGAAAGCTGTGCAGTGGATTAAGGATAAAATATTACACGGATACTACATGACAGCTCTAGAAGACAGGTTGCTAGTTGAGAGATTACTGAACACCTCACTCGTCCCATACACCTTGCCGCCGACGGTCAGAATGAAGAAATTATACTATCTGATGTCGAACGTGGACGACAACGCCACCAAGGCGTTCATAGAGCTACAGAAACATCAGCTCGCTGTGAGGCGCACGGTGGCCGAGTGGGTGGACTTACACAGGAAGCCGCCCACACCGGCGGTACAGAAGGAAATGATCTCTAAAGTGTTACACATAAGCTCCAAATTCCTGCCAGAGTCCGTCAAGGCTCAGGAGTTCTTGAATAAATTCTCGAATCATATGAAAAAAGCGCCGGAGTTACTGCAAGGGATGGAGACGATATTAAATCCTAATGTCAGTTGCGAAGTTTGTGTTCGCACCACTTCGAGTGTCCTAAAGAAGTTGGGTCAGCCGGTGATGACCAACCTTTACTATAACACGGTCAAAATGTTGCTGGAGCGAGTTAGCTCAGTGATGGTGGACCACGAGTCCCTGCTCATACTGGTTGGCTACGTAGAGGGCGCCGTGAGGGGCAACGACCCCTCCATAGCGGAGGAGTGCGGTCTCGGCCAAGATGAGGGCATGTACCAGCAGTACATACCTCTGGCCCTGCACCTCGCGGACGAGTTCTTCCTCACTCATCCGTCCCGTGACGTCCAACTCCTTATAGCCTGCTGTATAGCTGATGTTCTCAGGGTATATGCGCCGGAGGCTCCATACAAAGACCAGGAACAGGTGAAAACCATATTCCTGTTCCTAATAAACCAGCTGCAGGGTCTCCGTGACCCCAAGGACCCGGCTTTCAAACGTTACTTCTACCTGCTGGAGAATCTGGCTTACGTGAAATCATTCAACATGTGCTTTGAACTTGAAGACTGCCAGGAAATATTCTGCGCTTTGTTCTCACTTATGTTTAAAATTGTCAATACGGAACATTCTTCGAAAGTGAAATCCTTCATGCTTGACGTCCTCTGCCCTCTAATCACCGAGTCCGACGTGGTCTCCAACGAACTGCTCAACGTGATACTATTGAATCTGGTGGAGCCAAACAAAAGGGAACACAAGCACGCTTACACGCTAGCTAAGGAACTCATTATTAAGACAAGCGAGACCCTGGAGCCGTATATACAAGCATTCTTTAACCACGTCCTGATTTTGGGCAAAGAAGAGAAAAATCTTCTCATATTTTCCAAAGTGTACGAATTAATATACGAGTTAAATCAGTGTTGCCCGTCTGTTTTGCTCTCAGTGTTGCCACAGTTGGAATGTAAATTAAAATCAGCACAATTTCACGAGCGTTTATCGGCCGTGGCTCTGCTCGCTAGAATGTTTTCCGAGCCGGGTTCGGAGCTCGCCAAGCAATATCCGGCTTTATGGCGAGCATTTTTAGGTAGATTCAACGATATATCAGATCAGATAAGGATAAAATGTGTCCAGTACTGCATGCATTTCCTGGTGCACCATCCGGACCTGAGGAAAGACATAACGGACACATTGAAGATGAGACAGCACGATGCACAGGAGCAGGTCCGCTATGAGGTCGTCATGGCTATCATAGCGACAGCTCAGAGAGATTTCAAAGCGGTCGCAGCATCCGAAGATCTGCTGCATTTCGTCCGCGAGAGGACCTTAGATAAGAAGTTCAAGATCCGCAAAGAAGCTATGTCCGGCCTGGCCATGATATACAAGAAGTTTTTAACAGAGGAATCTGTGCCGCCCGCCACCGAGAAGGCTGTGCAGTGGATTAAGGATAAAATATTACACGGTTACTACATGACAGCTCTAGAAGACAGGTTGCTAGTTGAGAGATTACTGAACACCTCACTCGTCCCATACACCTTGCCGCCGACGGTCAGAATGAAGAAATTATACTATCTGATGTCGAACGTGGACGACAACGCCACCAAGGCGTTCATAGAGCTACAGAAACATCAGCTCGCTGTGAGGCGCACGGTGGCCGAGTGGGTGGACTTACACAGGAAGCCGCCCACACCGGCGGTACAGAAGGAAATGATCTCTAAAGTGTTACACATAAGCTCCAAATTCCTGCCAGAGTCCGTCAAGGCTCAGGAGTTCTTGAATAAATTCTCGAATCATATGAAAAAAGCGCCGGAGTTACTGCAAGGGATGGAGACGATATTAAATCCTAATGTCAGTTGCGAAGTTTGTGCACCACTAATTATACCCAAAAAATACTACAAAATACAATATTCATCGAGTGTCCTAAAGAAGTTGGGTCAGCCGGTGATGACCAACCTTTACTATAACACGGTCAAAATGTTGCTGGAACGAGTTAGCTCAGTGATGGTGGACCACGAGTCCCTGCTCATACTAGTTGGCTACGTAGAGGGCGCCGTGAGGGGCAACGACCCCTCTATAGCGGAGGAGTGCGGTATCGATTTAAAGAAAGCGGCCGAGCGCGGTCTGAAGCTGCTGGTGATGTTGTCGTTCATGTTCCCCGCTCACTTCCTGCACGAGGACGTGCTGCATCGGCTGACGGGGCTGCTCGAGCTGGACGAGGAGAACGTGGCGCCGCATGTGCTCGCCGCGCTCACCTTCCTCGGCAAATATAGACCCTTGAGTGAGGCGTGTCCAGCGTTGTTCCCGAAACTTATAACACTATGCAAAGCCTATGCGGAGGTCGGTACGCCGAAACAAGCCAAAAATGCAGTGAGATGCCTTTTCGTCAACGTCCCCGATCAGAGATCCCAAATTTTCACGGATATACTGGAAACATTGAAAACTACTTTAAGTCCCCATTCGGAACATTACCGCACGGCCATCGTTACACTCGGACACATAGCGCACAACTTACCTGATAACTTCCCTGTGCTTATTAAAAATATTGTATCTAGGAAGATAGTAAAAGAGCTGTTAGTGCGGGAAGGTGGCGGTGGACCCAACGCTCCTGAAGGGGACTGGTGTCCCGAAGAAGATCTGCCAGAGGAAACTCGCTGCAAGCTGGAGGGTCTGAAGTGTATGGCGCGCTGGCTGCTGGGTCTGAAGAGGGACGAGCTGTCGGCGCAGAAGACGTTCAGGATGCTGAACGCCTTCATAGTACATAAGGGAGATTTGTTACAGCAGAAGCAGTTGTCCGGAGCTGAGATGGCTCACCTAAGGCTGGCGGCCGGTGCTGCCATGTTAAAGATATGCGAACAGAAGGGGGTCGGAGACCAGTTTACTGCGGACCAGTTCTATAACCTGTCACATCTCATGGTGGATAGCGTACCACAAGTCAGAGAAGCATTTGCAGCTAAACTTCACAAAGGATTGTCGAAACCGGACCGCCGGGTGCGCGGGCTGGTGAGGCAGTACATGCTGGCGGACGTGGTGAGACGCAGAGAGTACGTCAGGAACATCACCGTCGGGACCAAGGGAGAAAGGAGTGAGACGAGCGTTATTGTTTGTAGCGTTTATCCCGTTGGAAAAACGTCCGCGAAACGCCGCTGGGAATGCGAGGAGGCTCTGACAGTGGTGAAGCAATGCCTGTGGTTCATACTGGAACCTCTCATAACACGCAATGACTTCTACTGCTACGGATTCTACAAGAGCCTGGTGGAAAGGATGAAGAGTCACAAGGACGCTCTCAACGAGACCGATGACTCGGTTAACTATAAACTGTGGGCCACGTGTGACCTGGCCATGTCCGTAATCTGGGCGCGGTCGAGTAGTTTCGAGTTGCGGGACTTCCCCTCCGACGCTCGCATACCGACCATGTACTTCGCCCCGCAACCTGATTTCTTCGTCAACACCAGGGTCTTCCTACCGCCGGAGCTACAGTTCCAACCGAAACGCCAGGGTACAACGGAAACAAATACAAAGGCAAAGAAACGTCCCAGACAAGACAAGGATTCGGAGAATACTAATGATGTAGAGGTGACTATATAG

Protein sequence:

>DPOGS213498-PA
MAEIVYPQGCRPITDDLGPDELVRRLKALAHTLQGLGQDEGMYQQYIPLALHLADEFFLTHPSRDVQLLIACCIADVLRVYAPEAPYKDQEQVKTIFLFLINQLQGLRDPKDPAFKRYFYLLENLAYVKSFNMCFELEDCQEIFCALFSLMFKIVNTEHSSKVKSFMLDVLCPLITESDVVSNELLNVILLNLVEPNKREHKHAYTLAKELIIKTSETLEPYIQAFFNHVLILGKEEKNLLIFSKVYELIYELNQCCPSVLLSVLPQLECKLKSAQFHERLSAVALLARMFSEPGSELAKQYPALWRAFLGRFNDISDQIRIKCVQYCMHFLVHHPDLRKDITDTLKMRQHDAQEQVRYEVVMAIIATAQRDFKAVAASEDLLHFVRERTLDKKFKIRKEAMSGLAMIYKKFLTEESVPPATEKAVQWIKDKILHGYYMTALEDRLLVERLLNTSLVPYTLPPTVRMKKLYYLMSNVDDNATKAFIELQKHQLAVRRTVAEWVDLHRKPPTPAVQKEMISKVLHISSKFLPESVKAQEFLNKFSNHMKKAPELLQGMETILNPNVSCEVCVRTTSSVLKKLGQPVMTNLYYNTVKMLLERVSSVMVDHESLLILVGYVEGAVRGNDPSIAEECGLGQDEGMYQQYIPLALHLADEFFLTHPSRDVQLLIACCIADVLRVYAPEAPYKDQEQVKTIFLFLINQLQGLRDPKDPAFKRYFYLLENLAYVKSFNMCFELEDCQEIFCALFSLMFKIVNTEHSSKVKSFMLDVLCPLITESDVVSNELLNVILLNLVEPNKREHKHAYTLAKELIIKTSETLEPYIQAFFNHVLILGKEEKNLLIFSKVYELIYELNQCCPSVLLSVLPQLECKLKSAQFHERLSAVALLARMFSEPGSELAKQYPALWRAFLGRFNDISDQIRIKCVQYCMHFLVHHPDLRKDITDTLKMRQHDAQEQVRYEVVMAIIATAQRDFKAVAASEDLLHFVRERTLDKKFKIRKEAMSGLAMIYKKFLTEESVPPATEKAVQWIKDKILHGYYMTALEDRLLVERLLNTSLVPYTLPPTVRMKKLYYLMSNVDDNATKAFIELQKHQLAVRRTVAEWVDLHRKPPTPAVQKEMISKVLHISSKFLPESVKAQEFLNKFSNHMKKAPELLQGMETILNPNVSCEVCAPLIIPKKYYKIQYSSSVLKKLGQPVMTNLYYNTVKMLLERVSSVMVDHESLLILVGYVEGAVRGNDPSIAEECGIDLKKAAERGLKLLVMLSFMFPAHFLHEDVLHRLTGLLELDEENVAPHVLAALTFLGKYRPLSEACPALFPKLITLCKAYAEVGTPKQAKNAVRCLFVNVPDQRSQIFTDILETLKTTLSPHSEHYRTAIVTLGHIAHNLPDNFPVLIKNIVSRKIVKELLVREGGGGPNAPEGDWCPEEDLPEETRCKLEGLKCMARWLLGLKRDELSAQKTFRMLNAFIVHKGDLLQQKQLSGAEMAHLRLAAGAAMLKICEQKGVGDQFTADQFYNLSHLMVDSVPQVREAFAAKLHKGLSKPDRRVRGLVRQYMLADVVRRREYVRNITVGTKGERSETSVIVCSVYPVGKTSAKRRWECEEALTVVKQCLWFILEPLITRNDFYCYGFYKSLVERMKSHKDALNETDDSVNYKLWATCDLAMSVIWARSSSFELRDFPSDARIPTMYFAPQPDFFVNTRVFLPPELQFQPKRQGTTETNTKAKKRPRQDKDSENTNDVEVTI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: