MonarchBase - Protein-coding gene

DPOGS208217
Transcript	DPOGS208217-TA	2442 bp
Protein	DPOGS208217-PA	813 aa
Genomic position	DPSCF300179 + 308301-319494
RNAseq coverage	1674x (Rank: top 8%)

Annotation
*Heliconius*	HMEL008685	0.0	74.14%
*Bombyx*	BGIBMGA002264-TA	6e-78	75.90%
*Drosophila*	Unc-115a-PB	0.0	54.00%
EBI UniRef50	UniRef50_Q7Q796	0.0	56.32%	AGAP005425-PA n=4 Tax=Endopterygota RepID=Q7Q796_ANOGA
NCBI RefSeq	XP_315432.4	0.0	56.32%	AGAP005425-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|270013886	0.0	56.96%	hypothetical protein TcasGA2_TC012552 [Tribolium castaneum]
NCBI nr blastx	gi\|158294174	0.0	56.07%	AGAP005425-PA [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0003779	7.6e-23	actin binding
	GO:0007010	7.6e-23	cytoskeleton organization
	GO:0008270	3.4e-18	zinc ion binding
KEGG pathway	aga:AgaP_AGAP005425	0.0
	K07520 (ABLIM)	maps->	Axon guidance
InterPro domain	[735-813] IPR003128	7.6e-23	Villin headpiece
	[212-276] IPR001781	3.4e-18	Zinc finger, LIM-type
Orthology group	MCL10433		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS208217-TA
ATGTACTTATCTGTAAACCGGCACGGGAACAGGCGCAGGACAAAAAGAAGAGCCGCCGTAGATTCAGACGGAATGTTCCTAATATACCGGCGCAGTTGGAGCGACGCCAACTGCGAGAAGTGTGGCGTGTGGAGTGTGGAGTGTGGAGCAGGTAAGGTCGTGTGCGGCGCGTGCGGCGGCAAGTGTAGCGGGGAGGTGCTCCGGGTCACCGACAAGTACTTCCACATGGCCTGCTTCACGTGTAGAACCTGCTCCGCCTCGCTCGCTCGGGGTGGGTTCTTCTGCAAGGACGGACATTACTACTGCCCCCAGGACTACCAGCGAGCCTTCGGCACGAGATGCGCCGCCTGCAACCAGTACGTGGAGGGCGAGGTGGTCTCCGCTCTCGGGAACACATACCATCAGAAGTGTTTCACTTGCGCCAGATGCAAACGAGCATTCCCGTCCGGCGAGAAGGTGACGTACACGGGCAGTGAGGTGGTCTGCGCGTCCTGCTCCGCAGGCCCACAGAAGGCGACGGCACGCGCAGCTCGCTCCCCACCCTCCCCGGCCTCCCCAGCCTCCCCGGCCTCTCCCGTCACCCCGTCTTCGCCGGTCAACAACCACGTTAGGGGCAGAGAACCAGACCCCAATGAATGCGCGGGATGTGGCCAGGAGCTAAGCGAGGGTCAAGCGCTGGCCGCTTTGGACCGTCAATGGCACCCGGCGTGTTTCGCGTGCGGGGAGTGTGGCGCCGCCCTGCCCGGGGAGTACATGGGCAGAGACGGCGTGCCCTACTGCGAGAGGGACTACCAGCGCCTGTACGGAGTCAGGTGCGCCTACTGCAGACGGTACATCGCGGGGAAGGTGCTACAGGCCGGCGAAAACCATCACTTCCACCCCACCTGCGCACGCTGCACCAAGTGCGGAGACCCCTTTGGCGATGGCGAGGAGATGTTTCTGCAGGGCGCCGCCATCTGGCACCCGCGCTGTGGACCCGCGCCGCACCAGCCGCACCAGCCCCTCACGCCCGCCGAGCTGGAGCGGGCCTCCTCTGAGCTGCAGTTCAGTCTCCGCTCGCGCACTCCCAGCGTCAACGGCTCCTACTGCAGTCCCTACAGTAGCTTGACCAGAAAGTACGGCTACCGCGCGGTATCCCCGGGTCTGACCTTGCGCGAGTACCGCTCCTCCGAGGGCTCCCCTCACCGCATCACCACCTACTCGTACCTGGCGTCCGAGCCGTCCACCCTCCGCCGCTGCGTGCAACCCTCGGACCGCCCCCCGGCGTCTCCTCACTTCCACCGCCCGCCCTCAGCAGGCGGCACGCGGTCGTCGTCGCGGGCGGCCTCCAAGGCTTCATCCCGCCCCGGGATGCGCGCGCTCGTGGACTCCATCCGCAGCGAGACTCCTCGCCCTCGCTCGCCTCATCTCAACAACGACGAGCCCATCGAGCTGGCATCCTACCCTGCGGCTTACAAGCCGCCGCCCGGCACCTTGCCCAAAATAGAGCGGGATGACTTCCCCGCGCCGCCCTACCCGTATACCGATCCGGAGCGCCGTCGCCGCTGGTCAGACACGTACAAGGGCGTCCCGGACAGTGACGACGAGACGGACCGCGTCAACGGCCACGACGACCGCCTCAGGAAGGAGGAACAGGAACTGGCCAAGATCGACACCGGGATAGCACAGGTGTTCCTGAAGGAGGTGAAGGAACGAGAGAAACTGCAGCAGTGGAAGAAACAGAATCTGGACCCGAGAAACGCCAGCAGGACGCCCAGCGCCGCGCGCGAGGCCGGAGCTCGTCTGCGGTACTCTTCCCCGCTGGGAGCGTCGCCCTCACGCTCCCTGGACCGCTCCCGACACGAGCCCGACCCGCCGCATGCTCTGCCATCCTACAACGGTAACGAACACACACACATACACACACACACAACACACACACACACGTACACACACACACGTACACACACACGTACACACACACACGTACACACACACGTACACACACACACACATACACACACACACACACACGGTGACTTCACATTCAGCGGACTCGGAGACAAGACTCACAGCACGGACTTCAGTAGCGGCAAGTCAGACATTTCGGCCGGATCGATCACCGACGTCGATAGGAGTGCTGTGTGTGTCGCGTCCCGGGCGGCGTGGCTCGTGCGGGCGGACCCGGGCGGCGTGGCGCGTGCGGGCGGCGTTCCGGGCGTGCGCCGCTCGCTCCCCAACATGGCGACCTCTCACCTGCTGCACGAGCCGGCCAAGCTGTACCCCTACCACCTGCTGCTCATCACTAACTACCGCCTGCCGCCCGACGTCGACCGCCTCAACCTGGAGCGCCACCTGTCGGACGCGGAGTTCGAGGCCATCCTGCAGGCGCCGCGGCCGGAGTTTTACCGCCTACCGCAGTGGCGCCGCAACGAGCTCAAGAGACGGGCGAGGCTGTTCTGA

Protein sequence:

>DPOGS208217-PA
MYLSVNRHGNRRRTKRRAAVDSDGMFLIYRRSWSDANCEKCGVWSVECGAGKVVCGACGGKCSGEVLRVTDKYFHMACFTCRTCSASLARGGFFCKDGHYYCPQDYQRAFGTRCAACNQYVEGEVVSALGNTYHQKCFTCARCKRAFPSGEKVTYTGSEVVCASCSAGPQKATARAARSPPSPASPASPASPVTPSSPVNNHVRGREPDPNECAGCGQELSEGQALAALDRQWHPACFACGECGAALPGEYMGRDGVPYCERDYQRLYGVRCAYCRRYIAGKVLQAGENHHFHPTCARCTKCGDPFGDGEEMFLQGAAIWHPRCGPAPHQPHQPLTPAELERASSELQFSLRSRTPSVNGSYCSPYSSLTRKYGYRAVSPGLTLREYRSSEGSPHRITTYSYLASEPSTLRRCVQPSDRPPASPHFHRPPSAGGTRSSSRAASKASSRPGMRALVDSIRSETPRPRSPHLNNDEPIELASYPAAYKPPPGTLPKIERDDFPAPPYPYTDPERRRRWSDTYKGVPDSDDETDRVNGHDDRLRKEEQELAKIDTGIAQVFLKEVKEREKLQQWKKQNLDPRNASRTPSAAREAGARLRYSSPLGASPSRSLDRSRHEPDPPHALPSYNGNEHTHIHTHTTHTHTYTHTRTHTRTHTHVHTHVHTHTHTHTHTHGDFTFSGLGDKTHSTDFSSGKSDISAGSITDVDRSAVCVASRAAWLVRADPGGVARAGGVPGVRRSLPNMATSHLLHEPAKLYPYHLLLITNYRLPPDVDRLNLERHLSDAEFEAILQAPRPEFYRLPQWRRNELKRRARLF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: