MonarchBase - Protein-coding gene

DPOGS204963
Transcript	DPOGS204963-TA	4617 bp
Protein	DPOGS204963-PA	1538 aa
Genomic position	DPSCF300160 + 610938-630364
RNAseq coverage	220x (Rank: top 45%)

Annotation
*Heliconius*	HMEL003742	3e-117	74.44%
*Bombyx*	BGIBMGA011132-TA	2e-168	48.25%
*Drosophila*	CG10011-PA	1e-119	34.10%
EBI UniRef50	UniRef50_E2AFW2	1e-133	38.16%	Ankyrin repeat domain-containing protein 50 n=3 Tax=Formicidae RepID=E2AFW2_CAMFO
NCBI RefSeq	XP_001607344.1	5e-138	40.65%	PREDICTED: similar to ankyrin repeat domain 50 [Nasonia vitripennis]
NCBI nr blastp	gi\|270008619	4e-137	38.02%	hypothetical protein TcasGA2_TC015164 [Tribolium castaneum]
NCBI nr blastx	gi\|270008619	8e-136	37.71%	hypothetical protein TcasGA2_TC015164 [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	5.8e-07	protein binding
KEGG pathway
InterPro domain	[995-1301] IPR020683	4.8e-74	Ankyrin repeat-containing domain
	[1071-1100] IPR002110	5.8e-07	Ankyrin repeat
Orthology group	MCL14010		Single-copy universal gene

Nucleotide sequence:

>DPOGS204963-TA
ATGTCGAACATGCCGATATACAGTCAGGTGGCGCCCAAGTATAGGGCAAAAAACGCTAAAGGCAACTCCACGCGGGAGAATAGGGGTAATCCGAGAGAATTCGACCCCCTGAATTACAACCACGGGGGCAATATACAGCTTCTGAACGCGCCGATGGAGAGTAGAATTGAGAAACTAGAAAAGAGGGAATCGAGACGCAAAGAAGAGACCAGAGTAAGAAGAACACAGAACAGAAGTGACGCCAACGAGGGGAAGGTCGAAGCGTATTTGAGGCAGAACCAGGTCAGCATAAGGCAGCAGCAGAACAGACATTCCGCTGTCAGACACGCCGAACACCGGGTTAATTTACGGTCACTCCCCCTGAACGAGATAACATCAAGGCAGGAGCGTACTCCGACCGGCCACCGGGTATTCCCCGAGAGAGAGGTCTCCAGGGACAGTAGACGACAGAGAGACAGGGAAAGGGACTTCGATTTTGATGGATCCCCGCTGAGTCCAATAGCTCGTGACAAGGACAGAGTGAAGAAGTCTTCAACACGGGTGTCGGATGTTAGTGACAAGAGGAGGTTCTTCTGTAGGGAGTGGGTGTTCCAGAAGATAGCGCACTGCTTAGAACAACGAGCGGTCAGCAAAACTGCTGGAACCCTTATATTGGGTGACGCTGGCAGTGGGAAGACTGCCTTATGTCAAGAGCTGAGCGCCCCGGGCACAGGTCCTCAGGCTAGACAACAGCGAGCGTTGAACAGGCGAATGCTCGCCAGACACTTCTTGCAGGGTCCAGGAGACTGCAGCCAAAGACCTGGAGAATTCGTCCGTTCACTGGCGATGCAGATCCTTTCACATTCTGAACATGCAAAACCTGATGACAGATCAGATAGAAATTCCTTGGAAGAGAATTTTGTTCAGCGGTTCCGTGATATGGGTGAGGATTGTGAGGAGAGCTCCAAACCACTGCTGGCTGATAGTGAAGATCAACGCACAGACGAGGAGGAGACGAGCTCTAGACAGAGAACAGCGGACAGATTACACGAGAGAGAAGAGTATACAGATTGTATTAATGACGCCGAGCTCAGTGGACATATGCTACCGGAAATACTGCCGAAGGCGGATGTGAAGCCAACGAATCCGTTCGTCAGCGACCAGAATGACCTCCGTCTATACGAGAACCACGAAAACTTGTTCCTCCGCAACATATCACAGCGACAGTCCAAAGAACTGCGGAATTCAAGACTTCTACGTCAAAGTTCTGAACCGCTTCAGGAGAAGAGACCTTCCGTGCTCCAGAAGAGTCTGTCGAACGATCAAGAAGAGAAGAAAGAGATGAACAGCCCGCCAAAATCAAGAATACCAGTCGCCAACTTCCGGTATCCGAATAAAAGTGGTCTACGTCCTGATAGTTCCCCGAAAAAGGATCCCAAAGAACTTCCCGAGTACCAGAACATAGTCCACGACGTTAAAGACGATCCGCAGACTGAGATGGAGCTACTTCTGGAGAAGAAGCGATCAGCGTCTGAAGAGGAACCGCCTCCGATCCCCAGCCTGCCCGTCAATCCCAGGACCTTGATAGCCAACGCCTACTACGAGAAGCTGCTATCGGAAACGGAAATCCAGCAGGCCTTGCTGCCCCAGAACCTGGACAAGAATCCCGATGAGTGCTTCAAGAAGGCCATACTGTTTCCGTTACTGGAGATAGATCCACCTAAGCAGTGCTTGTTTTTACTTATTGACGCTATTGATGAGGGCGCCACTAACGACGGCGATGGCAGCGAGGGCAGCGTGGCCGGGGTGGTCGGCCGTCACCAGCACCTGCTACCGCACTGGCTGCTGCTGGTGGCCACTGCGAGGAGACACTCCCGCCTGGCTAGGGTGTTCACCGGTTTCCGTAAGATAACCTTGGATGAGCTGTGTCGAGCCCATGTGGCCGCGGACGTCCAGCGCTACGTGTTGGCTCGCCTGGACAACGAACCTAGACTAAGGGCGCGCGTGTCCAGCGACGCGGCGGCGGCGGCCTCGGCGGCGGCCGCCCTCGATCATCTCCGCATCAAGAGCGATGGATGCTTACTGTACCTCGAGAAGGTGCTGGACGGTGTAGCCGACGGTTTTATAGCTCTGCGTGAAATAAGAGAGATCCCAGGTACACTCAACGGTCTGTACTTGTGGCTCGCGCAGAGGCTGTTCCACGGACGCAGATTCAATAAGGTCCGGCTGGTGTTGGACGTGCTGCTGGCCGCTCGCTGCGGTGTGACTGAGGACATGCTGTACAAGTGTCTCCTCACTAAGGAGTACAGCGTCACCAGGGAGGACTTTAACCGACGGATGCATCTGTTGAGGAGGATAGTGTCCGTGGACCGCTCGACGGGCTTCGTGGCGATCTTCCACCGCTCCTTCTCCTCGTGGCTGGTGGACGTGAAGCACTGCACCCGGCGCTACTTGTGCGACGTCTCCGCGGGTCACGCCGCCCTCGCCATGCATTACACTCTAGAAGCCAGAAGACTGTCAGCTCTCGAGATCCATCACTACGTGTATCACATGACGCAGCTGGAGCAACACCTGGCCTCGCTCAAGAAGGGGAAGCTCGGCTGTGAGCCCGTGGAGCTTCATACTCTGGTGCTGCTCTGGGTGTTGGACTCCGGCTGCCAGGTGGAGGCGGCGCTCCAACATGACAGAGGACAGATCGAGGAGAAAATCGAAGATAAAGATCAAGATCCGGAGTCTGAGGGAAAGGAGTCGACTTCCTGTAAATCATTGGAACAGTCCGCTCTGGAGAACATAATGCCGGAGCTGGTGAACGGCAGCACTCCCAGGTGGCCGAGGGACAGGAGGGTGATGCGGGCCCTCATGGAGCTCAGCAGGACGGATTCGGTCCCCACGGAACCCGAGGAAGACGTCAATGATCTGCTGTCCACTGAGAAGGCGCTGGAGAGTGAAGAGAACGCGACCGGGGACGAGCACGATGAGGCGCTACTCCTGGATCCGGGGACTGTTCATGAGTTAGCAGCGAGAGGAGATGAAGACGCGTTATCAGTTTTATTGAAGCGTCGTCCTGAGCTGGCTCAGTCGGTGGACGCGGCGGGGGCCACGGCCTTGCACGCCGCGAGAGCTGCGGCCTGGGCTGGACACGTGGAGGTGTTTATTTTTACTTGTTTAAGTAACGTGGAGGTTGTCCGCCAGCTGCTAGACCGGGGGCTAGACGAACACCACCGGGACAACTCCGGCTGGACGCCGCTACACTACGCCGCCTTCGAAGGTCATATAGAGGTCTGCGAAGCGCTTCTGGAAGCGGGGGCGAAGGTCGACGAGGCCGACAACGACGGCAAGGGACCTCTCATGCTGGCGGCGCAGGAGGGACACACCAGGCTCCTGGAACTGCTCGTAGACACCTGGGCCGCCCCGGTCGACCAACGCGCGCACGACGGCAAGACGGCGCTGCGCCTGGCGGCGCTGGAGGGGCACTTCGAGGCAGTAGCCGCGCTGCACTGCCGCGGGGCGGACGTGGACGCGCTGGACGCGGACCGGCGGAGCACGCTATATGTACTGGCCTTGGACAACAGACTGGCGATGGCCAGGCAGCTGCTGGCGTGCGGGGCCAGCGTACACTCCAGTGACACTGAGGGTCGGACTCCTCTCCACGTGTCCGCCTGGCAGGGGCACACTGAGATGGTCAATCTGTTGATAAAAGTCGGCGGGGCGTCCGTGGACGGCCGGGATCGCTGCTCACGCACGGCGTTGCACGCGGCGGCTTGGCGCGGCCGGGCCGGGGTGTTGCGGACCCTGCTGGAACACGGAGCGGACCCCGCGGCCGTGTGCACCCAGGGAGCTACGCCGTTGGGTCGTACGCCTGCTAAAGTAGCCTGGAGAGCTGGACATGCGAACATCTGCCGGCTTCTGGAGCGCTGGACCGCGCCCTCCGCACCTCCAGCACCTCCCGTCACACATCACGAGGACAAGCGACCAGCCTCCCCGGAGTACAAACGCCGTAGTATCCACAGCTCCAACTCCACAAAATCATCGTCCAACATGACCGGCGGCTCCAACAGGTCACACGACGAGGACGATAAGGGTTCCCTCTCTTTCGCCCAGCAGGTGGCGCGCTGTGGACGAGCGAGACGGGAGATAGAGAGAGACGAACCGATACCAGAGCACCAAGTGCTGGAACAGGACTCCAAGCTCAGGAGTTATATAGCGAATGAGAGGGACAGCGAGCTACATGGATATGCGAGGGAGAGAGACAGGAGACGGGAACAGAGACACGGCACCACCAGCCCGCTGTACGCCTCGCCGCCCAGGAGCCCCAGCGAACCACGGAGCCCCGACCCGCCTGCTGGTTCCCAGCCAGCCAGTCTAACGAGCGCCCCGGCACTGACGGACAACCACTTCAACAGAGACACGCACATGAGGATCATCCTGGGCAGAGACAAGCACGCGGAGAAACATGACGGTAAAAATAAGAGGAATGGCATCGTCACCAACCCGGCGATGCGTCTGGTCGCTAACGTTAGGAACGGTCTGGCAGCTAACATTCGCCGGACGGGGGTCGCGTTAGCAGCCAGCGCCAGTTCCTCCAACCCAGCAGTCAAGACCAACGCGTTCCAGTGGAGGAAGGAGACTCCGCTCTAG

Protein sequence:

>DPOGS204963-PA
MSNMPIYSQVAPKYRAKNAKGNSTRENRGNPREFDPLNYNHGGNIQLLNAPMESRIEKLEKRESRRKEETRVRRTQNRSDANEGKVEAYLRQNQVSIRQQQNRHSAVRHAEHRVNLRSLPLNEITSRQERTPTGHRVFPEREVSRDSRRQRDRERDFDFDGSPLSPIARDKDRVKKSSTRVSDVSDKRRFFCREWVFQKIAHCLEQRAVSKTAGTLILGDAGSGKTALCQELSAPGTGPQARQQRALNRRMLARHFLQGPGDCSQRPGEFVRSLAMQILSHSEHAKPDDRSDRNSLEENFVQRFRDMGEDCEESSKPLLADSEDQRTDEEETSSRQRTADRLHEREEYTDCINDAELSGHMLPEILPKADVKPTNPFVSDQNDLRLYENHENLFLRNISQRQSKELRNSRLLRQSSEPLQEKRPSVLQKSLSNDQEEKKEMNSPPKSRIPVANFRYPNKSGLRPDSSPKKDPKELPEYQNIVHDVKDDPQTEMELLLEKKRSASEEEPPPIPSLPVNPRTLIANAYYEKLLSETEIQQALLPQNLDKNPDECFKKAILFPLLEIDPPKQCLFLLIDAIDEGATNDGDGSEGSVAGVVGRHQHLLPHWLLLVATARRHSRLARVFTGFRKITLDELCRAHVAADVQRYVLARLDNEPRLRARVSSDAAAAASAAAALDHLRIKSDGCLLYLEKVLDGVADGFIALREIREIPGTLNGLYLWLAQRLFHGRRFNKVRLVLDVLLAARCGVTEDMLYKCLLTKEYSVTREDFNRRMHLLRRIVSVDRSTGFVAIFHRSFSSWLVDVKHCTRRYLCDVSAGHAALAMHYTLEARRLSALEIHHYVYHMTQLEQHLASLKKGKLGCEPVELHTLVLLWVLDSGCQVEAALQHDRGQIEEKIEDKDQDPESEGKESTSCKSLEQSALENIMPELVNGSTPRWPRDRRVMRALMELSRTDSVPTEPEEDVNDLLSTEKALESEENATGDEHDEALLLDPGTVHELAARGDEDALSVLLKRRPELAQSVDAAGATALHAARAAAWAGHVEVFIFTCLSNVEVVRQLLDRGLDEHHRDNSGWTPLHYAAFEGHIEVCEALLEAGAKVDEADNDGKGPLMLAAQEGHTRLLELLVDTWAAPVDQRAHDGKTALRLAALEGHFEAVAALHCRGADVDALDADRRSTLYVLALDNRLAMARQLLACGASVHSSDTEGRTPLHVSAWQGHTEMVNLLIKVGGASVDGRDRCSRTALHAAAWRGRAGVLRTLLEHGADPAAVCTQGATPLGRTPAKVAWRAGHANICRLLERWTAPSAPPAPPVTHHEDKRPASPEYKRRSIHSSNSTKSSSNMTGGSNRSHDEDDKGSLSFAQQVARCGRARREIERDEPIPEHQVLEQDSKLRSYIANERDSELHGYARERDRRREQRHGTTSPLYASPPRSPSEPRSPDPPAGSQPASLTSAPALTDNHFNRDTHMRIILGRDKHAEKHDGKNKRNGIVTNPAMRLVANVRNGLAANIRRTGVALAASASSSNPAVKTNAFQWRKETPL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: