MonarchBase - Protein-coding gene

DPOGS213810
Transcript	DPOGS213810-TA	5463 bp
Protein	DPOGS213810-PA	1820 aa
Genomic position	DPSCF300106 + 149794-170456
RNAseq coverage	619x (Rank: top 21%)

Annotation
*Heliconius*	HMEL016156	77.35%
*Bombyx*	BGIBMGA006551-TA	68.60%
*Drosophila*	CG42672-PH	45.66%
EBI UniRef50	UniRef50_E2AU14	47.24%	Ankyrin repeat-rich membrane spanning protein n=4 Tax=Formicidae RepID=E2AU14_CAMFO
NCBI RefSeq	XP_001811729.1	51.41%	PREDICTED: similar to CG30387 CG30387-PB [Tribolium castaneum]
NCBI nr blastp	gi\|383854925	47.58%	PREDICTED: kinase D-interacting substrate of 220 kDa-like [Megachile rotundata]
NCBI nr blastx	gi\|340725021	47.07%	PREDICTED: kinase D-interacting substrate of 220 kDa-like [Bombus terrestris]

Group
Gene Ontology	GO:0005515	4.8e-07	protein binding
KEGG pathway	tca:100141654	0.0
	K12460 (KIDINS220, ARMS)	maps->	Neurotrophin signaling pathway
InterPro domain	[200-587] IPR020683	1.4e-81	Ankyrin repeat-containing domain
	[614-1150] IPR011646	1.1e-80	KAP P-loop
	[277-306] IPR002110	4.8e-07	Ankyrin repeat
Orthology group	MCL13649		Single-copy universal gene

Nucleotide sequence:

>DPOGS213810-TA
ATGTCCCAATCACCCGAACTGCCTAAAACAACTAACGGCGAAAATGAATACGTTCACATACGCTGTCTCATCGCCAATATACACAAACCGAGAAATGTGTCGAGGCCCCCGGTGTCAGAGTCGCCACTGGAGGTAGTTAAAGAGTCACCGACGTCTTCTGATGCAGATCCCAGCTGTTCCGAGTCCGATATCTCCGAAAAGTCGGAGATATCAAATGCGAACGATACAAAAAACACTGAAGAAGCTCCTCCAAGACGAGCTAAGAGCAACAGTTTCGCTGGTGCTATGCTCGCTCCTCCAATGTTCAACAAGCGACGGAGGCCCTCCTTCCTTCATCTCGCCGTCGGTGGTGGGAACGAGCACTCCGGGCCTTTGTCAGCAGGGTCACACTTCAACGTGCCACGCTTCACTGTCACAGCACCACCTGGGGAGCATCGCCGTTTCAGTCATGGCTTCCCGTTCCATGGCTTTGCTCTTCGACGTCATTCCAATACGAGCCTTCACCGCACCGAGTCGATGGTGTCCCTGGCTTGTTTCAAGACGCTCTCACAGCTGGTCAACACTGATGGGAACGAGTTGCAGAACTTCCTCTCGTCTAACAGAAATATCAACGTCGACGACAAAGACGATAATGGTACCACCGCGCTCATGGTTGCGAGTGAGAGCGGGCGGTTGTCGGCGGTGCGGTTGTTATTGGGCGCGGGTTCGGACGCGTGTGCCGCGGATGGTGATGGATGGACCAGCCTCGCGTTCGCAGCCAGGGGAGGACACCTAGCTGTCGTACAGGAACTTATTGACGCCGGCGTCGTTATCGACAGCAGGGATTGTGGCGGATGGACGCCTCTCATGTGGGCTTCATACAAAGGTCACGAAGACATCGTCGTCTTGCTCTTGGAGAAAGGCGCCGACGTACACGCACATGGCAACTACAACATAAATTCCTTAGTATGGGCCGCTGGTCGACGTCATAGTGGTGTGGTGTCGCGCCTGTTGTCTGCGGGTGCTCGTCCAAATTCTTGCGACAAGTACGCCACTTCGGCCCTCACGTGGGCGTCCCGGGCTGGAGACACGGCTTCATGCGCCGCGCTCCTACGAGCTGGAGCCGATCCTAACACAGCTGGCATGTACTGCTGGACACCTTTGCTGCAAGCTACTCACGGTAACCACTTCGAAATAGTCCAAATGTTGCTGGAACACAAACCCAACGTGAACGCTTTAGATAAAGATGGTTGTACAGCGCTAGCTATAGCTTGCAAAGAGGGATATTATGATATCTCATTGGCCTTAATAAACTCTGGGGCGTATATTAACGTGCAGGATCACTCAAAGGACACGCCCCTGATATACGCTGTGAAGGGTGGATACAAGAACATAGTGGAGGCTTTATTGAAGAAGCATGTGGATGTAGACCTGCCAGGGAAGGAAAAGAAGACGCCGGTTTATACGGCAGTGGAGAAAGGTCACGTCGCCATATTGAAGCTTCTGTTGGCTTCAAATCCTGATTTGGAACATTGCACTACCAGCGGTGACACGGCCCTCCTGCGTGCTGTGCGGTCCCGGAACGCAGAAATGGTGGCCTTGTTACTGGAGAGACGAGCTCGTGTCGCAGCTGCTGATAACAGGGGAGACACCGCGTTGCACGTTGCTATGAGGGCGCGGTCTAAGCAAATTGTTGAAATCCTCTTGCGGAACCCAAAGAACAGCCAGCTCTTATACAAACCGAATAAGATGAACGAAACTCCATACAACATAGATATGAGTTACAACAAGACGATATTGGGACAAATATTCGGAGCTCGTAAGCTAAACACCAACGAGGACAATGAGAATATGCTCGGATACGAACTGTATAGCGCGGCGTTGGCTGACATGCTCTCAGAACCGAGTCTCTCGGTACCGATCACTGTGGGGCTTTACGCTAGATGGGGTTCAGGGAAATCATTTCTGCTTAATAAACTTAAAGAGGAGATGAAGAACTTCGCTCGTCAGTGGAGCGAGACCGGGTGGTCGTGGTCGTGGGCGGTGTGGTGGGGCGCGTGGCACGCCTCACTGGCGGTGGCGGCGTGTTCCTCTATGGCGGGCGCTCCCTCGCACGTGGCGCTCGCGCTGCTGTTCGTGCTTTTCGCTGCCATGTACCTCGGTTTCTACCTGCTGTGGTATTTAGGGAACAGATATGAGTGGTGGTGGGCGGGCGGTATGGTTGCTGCGTTAGGACGGCGATTCAGCTCTTTATTGTTGCTCCTACAAGTTGTTTTCTGTCACCCGCCAGGCCCAAATGACCCTCGTGCTTTACCCGCAACGCCTATTAGATTTCACTTTACAGAGGGTATGAAGAGTGGCCCGGGACAGGAGGGTGAGGCTATGGTGGTGCAAATGTTAGGAAGTCTCGCTGAGGCTCTGGAGTGTCAGTACGGCAGAGTCTGTACAAGACTGGCGAGAGCGTTCAGACCAAGGCCGTTGTCATCGACATCAGGGTGGAAATGGAGGAAGGCGTGTTGCATTCCACATATAATAACATTCGAGCTGAGCTTCATATGTGTGCTGCTCGGTGTCTGTGTGCTGGTGTTGTATCTCACCGACCCTGAGGAAGATCCAAGTCGTCGCGACGTCCGTCAGGGGGTGATGGTAGGGGCGTGCGCGGCTGCTGGTGCCGTGCTCCTCGCTAACCTGTACGCTGGAGCACGTGCTCTAGCCGCGCTTGCTCTGCCGCCGCGAGCACGTCTCGCACGTGCTCTGAAAAGGGATCACGCTCACACCGTCGCGTTAAGGCCGGAGGTTCAGGCACTCACTCACACCGTGTCGTGTTTGGACGCGTTCACTGGCCAGCAGACACGGCTAGTAGTTGTCGTGGACGCTCTGGACAGTTGTGAGCAGGAGAAGGTTCTGGCGCTGCTGAACGCTGTTCACGCGCTATGTTCTGACCCCCGGAGCCCCTTTATACTGCTCCTGGCAATCGACCCGCACATCATCAGCAAGGCTGTAGAAATAAACAGTCGTCGAGCGTTCTCTGAGAGTAACATCGGAGGTTGGGACTACCTTCGTAACATGGTACAACTGCCTTTCTACCTGCAAAACTCAGCGCTGAGGAGGGTGAAGGTCGCTCAGCAGACTGCCGCTAGACGGATGCAGGCGCTAGCCGTCGACGACTTCAGTACATCGCTACAGAGATCCGTATCAGCCCGTCGGTTGTCGTCTACGTCAGAGTTGATGTCCAGTCAAGAGCGGATCAAGGGTCGCGGGGAGGTGAGGGGTGAGGGTGGTCGCGGTCGCCTCCGTCCGTCAGAGTCCGTGGCGTCCTCGGTGGCGTCGGGTCTGCACCGCCCCGCGCCGGCCCCCGCGGGTGCCGCGGATCTCGGCCGGGTGCTCCTCACTGACGATTACTTCAGTGACGTCAACCCCAGGAGTATGAGGCGGCTCATGAACGTGCTCTACGTCACTGGTCGTCTCCTGAAAGCTTTCCAAATAGAGTTCAACTGGTACCAGCTCGCGTCGTGGGTGAACCTCACGGAACAATGGCCTTTCCGGACCTCCTGGATCATCTATCACCATGAAACATACGAAGAACACATCGAGGACTCCACTTCACTCAAACACATCTATGACAAAGTTAAGCCTTCAATGGGCGGTCTCCGTGAGGCCAGCACACTGATCGAGTTGGATCGCGACGAGCGTAAACTGGAAGTATTCCTGAGCTTCCACCGGTCCACACTCACCGCCGCTGATCTCAAGATATTTCTGCCGTTTACTATAAACTTAGATCCCTATATCAAGAAAGTCATTAAAGAGGAGCACGCGCAGGCGGGTGTCGAGGAAGACCTCGGAGCTAGCGGGGCCGCCTCCATGTACGCGAGCAACAGAACACAGCAGGCTAAACCCTTCCACAAGAAACAGAAAATCGTGGCACAGTCTGTCGTGTCCGGTACACAGCAGTGGTCGAGCTGGCACCACTCCGTGCCGCCGCAGACCTACGTCCAGGAAGCATCACAGTCACAGCCGATGGCGGTCAACCCCGTCGTGCTACTCAAAACTGCTTTCCCTGGATTAGGCGACGTGTCAACACTACGTCTATCCACAATGAGCACGGAGCGTGTGTGCGGGTTGTGTCGCGTGGCGCTGGGTGGGGTGGTGGGAGGAGGGGGAGGGGGCAACACAGCCGCTGCAGCGCTCATGAAGCACAGGGTGTGCGGGCTGGTGCTGACCGTGTGCCGGCTGGATGACCTCAAACCGTTACTAGACTTACCGTTCGGTGATTGGGAGCTTTTCAAAATGCTCATATTGAATCTGCGAGATCTCGAAGCCAGTATGCCGACTAACACGCCGGCCGTCACCGTCATACAAGAGAAACCCGTTGATGCGGAAATAGACGTGAAACAACGACCGTCCCTCGAGCACCAAAGAAGTCGCCCCACCAACGTCGAGAAACAGGTAACACTGGAGGAACAGATGATATGTGGAGCGCTGCAGACCCTGAACGAGGAGGCCATGGAAGACCTGCTGCAGTCGGAGCCCACAGGTGAGGCTCCATCCTTGTCCCGCTCCCCCTCTCCCTCCCGCAGCCCCTCCCCCTCCCCCTCGGAGGCCGAGCCCCGCGCACCCCACGTGGTCGTCAATCTGTCCGACGATGTCTTCCTAGGGGTCGCGGCCGCCTCGACCGGAGCTCATGACGGTGTTGTTACAGCCGGGGCTCCAGCGACCGCGGACCGCACGCCCGCCGTCAGCTTCCGTGTGGAGAGTGACGACGACGGACACGTTTCGTTCACGTGTCGTCCGCGGTCCCGCCGGCCGCCGCGTGCCCGGCCCTCCTCGCTGCGCCTCTCCGACGAGCCCACGCCGCGCCTGGCTGCAAGATCCCTCTCCGTGGAGGACTCGCGCTCCGCCCCCACTTCCAATGTCGCCTCGCGGACGGCGGATTCCCTGCGTCACGTAAGCTCAGCTGAACGCCTCACTCGTCTCAAGGACGAGATCATGTCCCGCGACAGGAGCCCTCCTCTAGTCGATGGACCCGCGAGCGACGACGAGTCAGCGCCGCTGGTGTCCTCGCCCCCGTCCACGCCGGCGGCTCCCTCGACCGCATCCCCACCAGCCGGCTCACCATCACCGTCACGGACAGAACCCGTGGGCGCTCGGTCCTTGAATGTGGATTGCGTGGACCGCAGTTCGCAGGAGATGACGGCCAGTACGGACTTCTCGCCCCGGTCGGACCTCACCGAGGCGGAGTCGTTGCGGGGCAGTGCGGGTGACTTGGAGTTACTGCCGGGCGGGAGGAGTGTGAACGGCTCGTCTCGCCGCGGACTGACACGAAGCGGGAGTGACGCGTCTCTGTCACTGTCTGTGGAACCCTATAACATGCGGGTATTGTCGCGCGGCGTGACTGACGGCTCCCGGGGTCTATGGCGGCAGGACGCGTTAGATTCCATAGAAAGCGCGCCGCCGTGGCCTCTTGAACCCGACTCCGCGGTATGA

Protein sequence:

>DPOGS213810-PA
MSQSPELPKTTNGENEYVHIRCLIANIHKPRNVSRPPVSESPLEVVKESPTSSDADPSCSESDISEKSEISNANDTKNTEEAPPRRAKSNSFAGAMLAPPMFNKRRRPSFLHLAVGGGNEHSGPLSAGSHFNVPRFTVTAPPGEHRRFSHGFPFHGFALRRHSNTSLHRTESMVSLACFKTLSQLVNTDGNELQNFLSSNRNINVDDKDDNGTTALMVASESGRLSAVRLLLGAGSDACAADGDGWTSLAFAARGGHLAVVQELIDAGVVIDSRDCGGWTPLMWASYKGHEDIVVLLLEKGADVHAHGNYNINSLVWAAGRRHSGVVSRLLSAGARPNSCDKYATSALTWASRAGDTASCAALLRAGADPNTAGMYCWTPLLQATHGNHFEIVQMLLEHKPNVNALDKDGCTALAIACKEGYYDISLALINSGAYINVQDHSKDTPLIYAVKGGYKNIVEALLKKHVDVDLPGKEKKTPVYTAVEKGHVAILKLLLASNPDLEHCTTSGDTALLRAVRSRNAEMVALLLERRARVAAADNRGDTALHVAMRARSKQIVEILLRNPKNSQLLYKPNKMNETPYNIDMSYNKTILGQIFGARKLNTNEDNENMLGYELYSAALADMLSEPSLSVPITVGLYARWGSGKSFLLNKLKEEMKNFARQWSETGWSWSWAVWWGAWHASLAVAACSSMAGAPSHVALALLFVLFAAMYLGFYLLWYLGNRYEWWWAGGMVAALGRRFSSLLLLLQVVFCHPPGPNDPRALPATPIRFHFTEGMKSGPGQEGEAMVVQMLGSLAEALECQYGRVCTRLARAFRPRPLSSTSGWKWRKACCIPHIITFELSFICVLLGVCVLVLYLTDPEEDPSRRDVRQGVMVGACAAAGAVLLANLYAGARALAALALPPRARLARALKRDHAHTVALRPEVQALTHTVSCLDAFTGQQTRLVVVVDALDSCEQEKVLALLNAVHALCSDPRSPFILLLAIDPHIISKAVEINSRRAFSESNIGGWDYLRNMVQLPFYLQNSALRRVKVAQQTAARRMQALAVDDFSTSLQRSVSARRLSSTSELMSSQERIKGRGEVRGEGGRGRLRPSESVASSVASGLHRPAPAPAGAADLGRVLLTDDYFSDVNPRSMRRLMNVLYVTGRLLKAFQIEFNWYQLASWVNLTEQWPFRTSWIIYHHETYEEHIEDSTSLKHIYDKVKPSMGGLREASTLIELDRDERKLEVFLSFHRSTLTAADLKIFLPFTINLDPYIKKVIKEEHAQAGVEEDLGASGAASMYASNRTQQAKPFHKKQKIVAQSVVSGTQQWSSWHHSVPPQTYVQEASQSQPMAVNPVVLLKTAFPGLGDVSTLRLSTMSTERVCGLCRVALGGVVGGGGGGNTAAAALMKHRVCGLVLTVCRLDDLKPLLDLPFGDWELFKMLILNLRDLEASMPTNTPAVTVIQEKPVDAEIDVKQRPSLEHQRSRPTNVEKQVTLEEQMICGALQTLNEEAMEDLLQSEPTGEAPSLSRSPSPSRSPSPSPSEAEPRAPHVVVNLSDDVFLGVAAASTGAHDGVVTAGAPATADRTPAVSFRVESDDDGHVSFTCRPRSRRPPRARPSSLRLSDEPTPRLAARSLSVEDSRSAPTSNVASRTADSLRHVSSAERLTRLKDEIMSRDRSPPLVDGPASDDESAPLVSSPPSTPAAPSTASPPAGSPSPSRTEPVGARSLNVDCVDRSSQEMTASTDFSPRSDLTEAESLRGSAGDLELLPGGRSVNGSSRRGLTRSGSDASLSLSVEPYNMRVLSRGVTDGSRGLWRQDALDSIESAPPWPLEPDSAV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: