MonarchBase - Protein-coding gene

DPOGS212022
Transcript	DPOGS212022-TA	4020 bp
Protein	DPOGS212022-PA	1339 aa
Genomic position	DPSCF300054 - 681393-704228
RNAseq coverage	946x (Rank: top 14%)

Annotation
*Heliconius*	HMEL013606	0.0	69.33%
*Bombyx*	BGIBMGA010176-TA	0.0	73.62%
*Drosophila*	klar-PA	8e-34	30.54%
EBI UniRef50	UniRef50_D7EIJ7	2e-39	34.80%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D7EIJ7_TRICA
NCBI RefSeq	XP_001122432.1	6e-52	29.83%	PREDICTED: similar to klarsicht CG17046-PA [Apis mellifera]
NCBI nr blastp	gi\|350424308	8e-62	30.60%	PREDICTED: hypothetical protein LOC100747581 [Bombus impatiens]
NCBI nr blastx	gi\|383851548	6e-76	30.65%	PREDICTED: uncharacterized protein LOC100880783 [Megachile rotundata]

Group
Gene Ontology	GO:0003779	4.8e-16	actin binding
	GO:0016021	4.8e-16	integral to membrane
KEGG pathway
InterPro domain	[1284-1339] IPR012315	4.8e-16	Klarsicht/ANC-1/syne-1 homology
Orthology group	MCL25707		Lepidoptera specific

Nucleotide sequence:

>DPOGS212022-TA
ATGGGACGCCCCGATGGGAACGAGCCTATCACACTTCAATCAAACGCCGATAAAGATGTATTACAAAGGGACGTGGAATGCCACCGTCGTATTGTCAGCTCGGTGGTGAGGCTCTGCGGTGGAGCGGACGTGGCTCGAGCTCTAGAACGTCGCTGGCATCTGCTGTATCTGCGGGCCATCGAGTGGCTCTGTCACCTGGAGGCCTGCATCGCTAAGAGTGATAATCAGAACTGCGCTTCAATAGAAGTAGCGAGTGATAGTGACGACGAGCCGGCTCTGAAGCAACCGCGGCTTACAAGACGTGGCTCACCAAGACGACAGAGGACACCTATTAATGTTATACGGAGGAGCAGCTCTGAAGATAGCCGGCAGTCTGCTTCCGAGGAGGAACAGGAGTATGCAGTGACTTACACCTGGCGCGGCTTCGGATCGGACTGTGAGACCGAGCTGGTGAGGGACAGAGACTGCGAAATGGACGAGAGACGTGTTCCGACCGTGGACGAGGGAGAAGACAGACAGACGGATCAAACAGTTCCCGGCGGAGATAATGTTGATGGTATCAGTGTACGCGAAACGGGGAGATTAGAAGATATACCAAGAGAAATGAACACTCCACCTACAGTTGTCAAGAGAAAAAAACCAGTGAACACATCGAAATTCAATCAATCTGATAGAAAATCTAAAAATTGTGCCACCTTCTACTTCAGACATCACGACACGGATTCTGATCGACAGGTCGTTGAGACTGACGAGAAGTCGCAAGAGGAATCGTCGGAAGAGGAATGGACTTACGTGGACGGTCCCAAAATAGCGAACGAAGATTCTACAGACTTAATGACGTCATCCATTGAAATACAATGTGACTTACCAGTGGATGATAAGAAAGAAAAACTTCTATCCCCGAAGAAATTGGAGTCCACAACGCCAGATCTTATAAGAGTCGATCAGAATTCAAGATGTAAAGATTTAGAACGATTGGTCCTACAGGCTGAGGAATTGGTTCAGAAACAGGCACAGCAACAGATGGCTAAGAAGAAGAATACACGAAACTTGAAACCATTATCATTTGACGAGGAAGGCAAGTCCAGCAGGGAGAAAATGTCAAGAATCAAGGAATGGTTGAATCAAAGTCCAGAAGACAAAAACGATAGCAATCAGTGCACTGAAAGCTACGATGCGTCCGGGGAATACACTACAGAGAGCGAGGTCGATACATCACTGACGTCAGAAGAAAGAAACATTCATTCATCAATGGACATGAGCACATCAACTTGTACTGTGACCCCGACGCATCACGCCAAGGTGACGCTGCGCAAGAAGAGGAATGCCACGCGGCCGTGGTCTGTGTCGTGTCTGTCTCAGCTCAGTGCTGGCATTATAGCCACGCCCACTGATGACGTCATTAACATGTCCATATCAGAGTCCGCACTGAACACACTGGCATCGCCTAGAAGAGTCACACCTGGGAATTCCAGCTCTAAATTAAGAGGAAGCTCAACTACTGTACAGGGTCACATATCAAGCACAAATACTATGACAGAGGCTTGTACGTCGTGTGTGGAGGCTAACGATAAACAATGTTGGTTGAGAAGGAAAAGGTTGAAACTGAAACGACAGAACAACACTAGAAGAGAGAGATTGGTTAAGAGTCTGTCGTTTTGTGGAAGGTTGAGTCCAGAAATTGAAGACAAAAACGAAAGAAGTGCGGCCAGTGACCCCGCCACTAGTAGGAAGAATAGATTCGATACAACATCAACTTCGGACAATGACAGCGACGCGGATCTTATCAAACAGCAGTTGGCAACCATAGCAAATCTGAGGAAAAGCATCGAGAAAACACACATCTCAAGCAAAGAACAAGACAGTGCCATCCCTGAGCAAAACGAAACAGAATTAGTCGGACCTAGCTTTAAACTGGGCCCCGAAGGTGGAACCGTACGACCTAGGATGACCAAAAGTATGGAGAGAGAGAGAACGTTTTTGGCACTTAGTCTAGGAGATCCCAGTCAAATGTGGGACCTCAGTGTTGATAAAGACTCTGAGAGCATAACTGCTGGTACCGAAGGCCATAGTTCTTTTTCAGAACAGGCTTGGGATTTCTATCAGGAGAAATACAACTCGGAACCGTATTCTGAAGCTCCGGATTCAGATGCAGCGAGACGGCTGTTGGAATTTGGGGATGACTATAGAGCATTCTTGGATTCCCAGTCTGATTGTTGTTCTAGTCTGTCCGCACATCCCGACGACACGAGTCCGACAACGAGACGACGACGACCGCCATCCGACACACGGGAAAGAAGCCTGCCGAGATATAAACGTCCAACTAGAACATCCCCCGTAGAAACACCATCACGCAAACCCAAGAAGTCCATGTCCAGCGCTGAACGGAAGAAAACACTATTGGACAGTCTGGAAAGATCCAGAAATAACACTAGCATTGAAAGCAACGAAGGGGTGCGACGAAGAAAACAGTCTGAGAACGAACGTAAGAACAGCAAACGCTCGCCCGACTTCGACCTCCTCAACGTCCAAGCTCTAAGCCGCAGACGCCACAGCTCAAACTTAACTAGCGACGAAATTAATAGTTCCCTGGAGTACACTGAGGTGAACAATCGACCGGATATCTTGGACTCGTTGAATAGACGTCGCAAGGAAAAAGAAGGAGGCACAGAGTTACAAAAGATCGCTCTGTCTGAACTACGACGACGGTCGACCGGCAGCGCTGATTCCGAGGGCGAATCCTCTTCACCCAAACACAGCCGAAAAAATTGGGGTGATTCTGATTCAGAGGCCGATGAGGTCAAATCTCTCGTCCGACGTTCGAGCACGCAGTTGGAGGTGACGGAGGCTTTACTGGCGCGACACGATTCATCGCCGGATATCCTGCGGGCCTTCGACTATACGGAGGTGGTAACTCGTTGCCGCGACAACATCAACCTTTTGGAGGTAGCTCTGTCTGAGGCGTCATTATCCCCAACCTTACAGAAAGAAATAAGAGCGGTGTCGGCAAGATGGTCGGCTCTAAGGGCTGCTGCGATACGTCGCGGAGGCGCTCGCCGCTTACGTCGCGAGATTGGAGCCCTAAAAGAGACTTTGGACGACATATGCGAGCCGGGAGACTATGCCCCCCAACCGCATACACGCGCACAACTACATAAGAGAATTGAGGAATTGAAGGAACGTCTATCGCGTCTGCTAGAATGTAAAGTCTCCATGTTGAAGCTGACAGTGTCAGTCAGGAGAGCTCTTGGTGAGATGGAGACAGATGATAGCGGATTGACGACTGAATTGACTTCCTTGATAGCTGCATGGGATGACGCCCATCAACGAACTTCAACGGAGTTACTGTCATTGGAGAAGGCGGTGTCAGCTTGGGCTGAATGGGAGCGTGCGCTGCGCGAACTGCAGGCAGCACTGCGTGGAGACCTGGCAGCTTTAGAAGCGCTGCGTGATCGACCCGATTGTGATGAACTCGCCTCCCACGTTAGACATCTAGCCGCTGCACTGTTTGATAAGAAAAAGGGCGGTTCCACGTGTGACTCTCTATCGGACTCGGGTATATCTGATGGCGACAGTGAAGGTGCCGGACGTGCGCGTCGTCTGACCGCTCTGAGGGAATTGGCGCGACGTCTACAAGCAGTGCTCGCTCCAAACTCACCCGCACATAGAGCTATAGCTAAGCGCATGGAACAAACAGAAAATGAAGTTAAAATTTTGCAAGAATCCTGCCGCGCCTTGGTCGAACAGAGTATACCAGATCTAAAAATTGACGAAGTGACGCGTGATCACACCATCGCTGTTTCAAGTAAGAAGACGGGTGCTGGCGATCCCGATTACAATCCACGCAGCGGCTGGGTGTGGCGTGTACTTCGTTCTTCTATCCCTATACAATTGTGTCTGGTTGCATTACTCCTAGCTGCGTGGCTGGTCGAGCGACCGCGGTGCTGCGATGCCTTGAATTCGCTCGCTCAAACCCTAACGCCACAGTTACGTTACGTCCGTGGCCCGCCCCCAGTGTGA

Protein sequence:

>DPOGS212022-PA
MGRPDGNEPITLQSNADKDVLQRDVECHRRIVSSVVRLCGGADVARALERRWHLLYLRAIEWLCHLEACIAKSDNQNCASIEVASDSDDEPALKQPRLTRRGSPRRQRTPINVIRRSSSEDSRQSASEEEQEYAVTYTWRGFGSDCETELVRDRDCEMDERRVPTVDEGEDRQTDQTVPGGDNVDGISVRETGRLEDIPREMNTPPTVVKRKKPVNTSKFNQSDRKSKNCATFYFRHHDTDSDRQVVETDEKSQEESSEEEWTYVDGPKIANEDSTDLMTSSIEIQCDLPVDDKKEKLLSPKKLESTTPDLIRVDQNSRCKDLERLVLQAEELVQKQAQQQMAKKKNTRNLKPLSFDEEGKSSREKMSRIKEWLNQSPEDKNDSNQCTESYDASGEYTTESEVDTSLTSEERNIHSSMDMSTSTCTVTPTHHAKVTLRKKRNATRPWSVSCLSQLSAGIIATPTDDVINMSISESALNTLASPRRVTPGNSSSKLRGSSTTVQGHISSTNTMTEACTSCVEANDKQCWLRRKRLKLKRQNNTRRERLVKSLSFCGRLSPEIEDKNERSAASDPATSRKNRFDTTSTSDNDSDADLIKQQLATIANLRKSIEKTHISSKEQDSAIPEQNETELVGPSFKLGPEGGTVRPRMTKSMERERTFLALSLGDPSQMWDLSVDKDSESITAGTEGHSSFSEQAWDFYQEKYNSEPYSEAPDSDAARRLLEFGDDYRAFLDSQSDCCSSLSAHPDDTSPTTRRRRPPSDTRERSLPRYKRPTRTSPVETPSRKPKKSMSSAERKKTLLDSLERSRNNTSIESNEGVRRRKQSENERKNSKRSPDFDLLNVQALSRRRHSSNLTSDEINSSLEYTEVNNRPDILDSLNRRRKEKEGGTELQKIALSELRRRSTGSADSEGESSSPKHSRKNWGDSDSEADEVKSLVRRSSTQLEVTEALLARHDSSPDILRAFDYTEVVTRCRDNINLLEVALSEASLSPTLQKEIRAVSARWSALRAAAIRRGGARRLRREIGALKETLDDICEPGDYAPQPHTRAQLHKRIEELKERLSRLLECKVSMLKLTVSVRRALGEMETDDSGLTTELTSLIAAWDDAHQRTSTELLSLEKAVSAWAEWERALRELQAALRGDLAALEALRDRPDCDELASHVRHLAAALFDKKKGGSTCDSLSDSGISDGDSEGAGRARRLTALRELARRLQAVLAPNSPAHRAIAKRMEQTENEVKILQESCRALVEQSIPDLKIDEVTRDHTIAVSSKKTGAGDPDYNPRSGWVWRVLRSSIPIQLCLVALLLAAWLVERPRCCDALNSLAQTLTPQLRYVRGPPPV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: