MonarchBase - Protein-coding gene

DPOGS208462
Transcript	DPOGS208462-TA	3066 bp
Protein	DPOGS208462-PA	1021 aa
Genomic position	DPSCF300064 - 1631155-1641308
RNAseq coverage	534x (Rank: top 24%)

Annotation
*Heliconius*	HMEL008054	3e-161	57.00%
*Bombyx*	BGIBMGA010644-TA	0.0	69.17%
*Drosophila*	aub-PA	1e-123	36.94%
EBI UniRef50	UniRef50_A8D8P8	0.0	69.17%	PIWI n=2 Tax=Bombyx mori RepID=A8D8P8_BOMMO
NCBI RefSeq	NP_001098066.2	0.0	69.17%	aubergine protein [Bombyx mori]
NCBI nr blastp	gi\|166706856	0.0	69.17%	aubergine protein [Bombyx mori]
NCBI nr blastx	gi\|166706856	0.0	69.58%	aubergine protein [Bombyx mori]

Group
Gene Ontology	GO:0003676	9e-116	nucleic acid binding
	GO:0005515	5.4e-110	protein binding
KEGG pathway	nvi:100118414	9e-155
	K02156 (AUB, PIWI)	maps->	Dorso-ventral axis formation
InterPro domain	[691-1021] IPR012337	9e-116	Ribonuclease H-like
	[716-1007] IPR003165	5.4e-110	Stem cell self-renewal protein Piwi
	[147-465] IPR003100	8.4e-68	Argonaute/Dicer protein, PAZ
Orthology group	MCL10228		Insect specific

Nucleotide sequence:

>DPOGS208462-TA
ATGTCTGAGAGGGGTCGCGGACGCGCTAGAGGCCGGGCAGGTCGTGGTGGAGATGGAGCTATGCAGCCGCCTCGGAGGCCCGGAGAGCAACCTCCTCAACAAGCTGGGGCTCCCAGACCTCGGCCTCAACCGCCGTTGGCTTGGGGTCCTCCATCCGTAGTCCCGCCAGTCAGGGCTGGTATGCCCACACAGTCCGTAGGCCGAGCATCGCATCGTACCACTCCATCCACTCACGATCACCCAGGAGATGTTGATATACAACAACGAATGCAATCAGTTGCATTAGGTAGTCCATCACAGTCATCTGGTGGTGGTGATGTTGGGACTGTGGTAGGACGTGGTTCCCGTCGAGGCGGAGGAAGAGTTCTGCCTGAACAAATGACCATTGTTCGGACACGTCCAGAGACTGTGACCTCCAAGAAAGGAAGCACTGGAGCTCCGTTAGACCTCTGTGCTAACTATTTCACCATTCAGACAACTCCTCAGTGGTCACTCTATCAGTACCATGTGGATGTTGACCCCGAAGAGGACAATACTGCTGTGAGAAAAGGTCTCCTACGCATTCACGCTAAAACTTTGGGAGGGTACCTATTTGATGGAACTAACTTATACACTGTCAAAAAACTGCACCCAGACCCAATGGAACTATACTCACAGAGAACAACCGATGGTGAAAATATGAGATTGCTAATTAAGCTCACAGGTCAAGTGAGTCCTGGTGATTATCACTATATACAGATATTCAACATCATGATAAGGAAATGTTTCCGTATTCTGGATTTAAAACTCATGGGTAGAGATTTCTTTGATCCAATAGCTAAGATTGACATTCCGGAACATCGTTTACAAGTGTGGCCCGGATACAAGACTAGTATTAATCAGTACGAAGATCGTATCCTCATGGTCACTGAGATCACTCACAAAGTCCTACGTTTAGATACGGTTCTTGAAATGCTCAAGGAGTACACGTATCAGTATAAAGGTGACACATATAGGAAAATGTTCTTGGAAGATATTGTCGGCAAGATTGTTATGACGGATTACAACAAAAAGACATATAGAGTTGATGATGTTGCTTGGTCTGAGACACCGAAGTCTACTTTCAGGATGAAAGATCAAGATGTATCGTACTTGGACTACTATAATTTGAAATATAAAATCAGGATCCAAGATCCCGGCCAGCCTTTGTTGATCTCTCGTTCCAAGGAGCGTGATATAAAGCGTGGTATGCCTGAACTGGTTTACCTCGTGCCGGAGCTGTGTCGCCAAACGGGTCTCACTGATCAGATGCGAGCTAACTTTCAATTGATGCGAGCTCTGTCTACACACACCAAGATCGGTCCGGACATGCGTATACAGAAGCTACTTAATTTCAACCGCAGATTTACTCAGACTAAGGAAGTTGTTGAGGAACTGGGGACTTGGTCATTAAAACTATCGAATGACTTGGTGAGGTTCAAAGGTCGTCAATTACCAGCCGAACAAATCATCCAAGGAGGCAACATGAAGTACCCAGCTGGTGATACAAACGACGGCTGGACTAGAGATATGAGGTCTAAGAATCTGTTCTCGGTCGCTAATATGCCGTCCTGGGTAGTCATAACGCCTTCGCGCCAACAGAACGATTCACAAAAATTCGTAGATTTGATCATGAAGACCGCTTCCGGTTGCGGATTTAGAATGCCCAGACCGGAAATCGTGACCATACAACAGGACAGCCAATCCGCATACGCCAATATGTGCGAAAACGTCATAGCTAGAAAAAATCCAGCTATGATATTGTGTGTATTGGCTAGGAATTACTCGGACAGGTACATTTCAACAATAAATAATCTCGGCGGCGCTCCATGGACGGTGGAAATCCCCTTGCCTACACTGATGGTGATCGGATACGACGTGTGTCACGACACGCGTTCTAAGGAGAAGAGTTTCGGAGCTTTGGTCGCTACGTTGGACAGACAAATGACTCAGTACTACTCTTGTGTTAACGCGCACACCTCGGGAGAAGAACTCAGTTCACATATCGCCTTCAACGTAGCGTCGGCTGTACGGAAATATAGAGAGAGAAATGTGACCATACAACAGGACAGCCAGTCCGCATACGCCAATATGTGCGAAAACGTCATAGCTAGAAAAAATCCAGCTATGATATTGTGTGTATTGGCTAGGAATTACTCGGACAGATATGAAGCGATCAAGAAGAAATGCACTATCGACCGCGCGGTGCCCACGCAAGTCGTCTGCGCTAGGAACATGACAAGCAAATCGGCCATGTCCATCGCTACCAAAGTGGCCATACAAATCAACTGCAAGCTCGGCGGCGCTCCATGGACGGTGGAAATCCCCTTGCCTACACTGATGGTGATCGGATACGACGTGTGTCACGACACGCGTTCTAAGGAGAAGAGTTTCGGAGCTTTGGTCGCTACGTTGGACAGACAAATGACTCAGTACTACTCGTGTGTTAACGCGCACACCTCGGGAGAAGAACTCAGTTCACATATCGCCTTCAACGTAGCGTCGGCTGTACGGAAATATAGAGAGAGAAATGGCTTCCTGCCCGGACGTATCTTTATATACCGAGACGGCGTAGGCGACGGACAAATCGCATATGTGAAAAGCCATGAAGTAGCGGAAGTGAAAGCTAAGCTGGCTGAGATATACGGCGGCGGGGATATCAAAATGGCGTTTATCATTGTGTCTAAGCGTATCAACACGCGAGTGTTCGTGGACTGCGGCCGTAGTGGAGAGAACCCTCGCCCCGGGACCGTGGTCGATGATGTGGTCACACTACCTGAGAGATACGACTTCTATCTAGTCTCCCAAAACGTCAGAGAGGGAACGATAGCTCCGACATCATACAACATTATAGAGGACACTTCCTGCTTAGATCCGGATCGAATCCAACGCCTCACCTACAAGCTGACCCACATGTATTTCAACTGCTCGACACAAATCCGCGTGCCGTCTGTGTGTCAATACGCCCACAAGCTGGCCTTCCTAGCGGCCAACAGCCTCCACAACGCGCCCCATCACTCGTTGGCCGACACTCTGTACTTCCTATAA

Protein sequence:

>DPOGS208462-PA
MSERGRGRARGRAGRGGDGAMQPPRRPGEQPPQQAGAPRPRPQPPLAWGPPSVVPPVRAGMPTQSVGRASHRTTPSTHDHPGDVDIQQRMQSVALGSPSQSSGGGDVGTVVGRGSRRGGGRVLPEQMTIVRTRPETVTSKKGSTGAPLDLCANYFTIQTTPQWSLYQYHVDVDPEEDNTAVRKGLLRIHAKTLGGYLFDGTNLYTVKKLHPDPMELYSQRTTDGENMRLLIKLTGQVSPGDYHYIQIFNIMIRKCFRILDLKLMGRDFFDPIAKIDIPEHRLQVWPGYKTSINQYEDRILMVTEITHKVLRLDTVLEMLKEYTYQYKGDTYRKMFLEDIVGKIVMTDYNKKTYRVDDVAWSETPKSTFRMKDQDVSYLDYYNLKYKIRIQDPGQPLLISRSKERDIKRGMPELVYLVPELCRQTGLTDQMRANFQLMRALSTHTKIGPDMRIQKLLNFNRRFTQTKEVVEELGTWSLKLSNDLVRFKGRQLPAEQIIQGGNMKYPAGDTNDGWTRDMRSKNLFSVANMPSWVVITPSRQQNDSQKFVDLIMKTASGCGFRMPRPEIVTIQQDSQSAYANMCENVIARKNPAMILCVLARNYSDRYISTINNLGGAPWTVEIPLPTLMVIGYDVCHDTRSKEKSFGALVATLDRQMTQYYSCVNAHTSGEELSSHIAFNVASAVRKYRERNVTIQQDSQSAYANMCENVIARKNPAMILCVLARNYSDRYEAIKKKCTIDRAVPTQVVCARNMTSKSAMSIATKVAIQINCKLGGAPWTVEIPLPTLMVIGYDVCHDTRSKEKSFGALVATLDRQMTQYYSCVNAHTSGEELSSHIAFNVASAVRKYRERNGFLPGRIFIYRDGVGDGQIAYVKSHEVAEVKAKLAEIYGGGDIKMAFIIVSKRINTRVFVDCGRSGENPRPGTVVDDVVTLPERYDFYLVSQNVREGTIAPTSYNIIEDTSCLDPDRIQRLTYKLTHMYFNCSTQIRVPSVCQYAHKLAFLAANSLHNAPHHSLADTLYFL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: