MonarchBase - Protein-coding gene

DPOGS210801
Transcript	DPOGS210801-TA	3147 bp
Protein	DPOGS210801-PA	1048 aa
Genomic position	DPSCF300027 - 876607-891499
RNAseq coverage	173x (Rank: top 50%)

Annotation
*Heliconius*	HMEL005656	0.0	81.88%
*Bombyx*	BGIBMGA007117-TA	0.0	74.84%
*Drosophila*	CG6954-PA	4e-157	51.57%
EBI UniRef50	UniRef50_D6WUP7	5e-167	57.17%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6WUP7_TRICA
NCBI RefSeq	XP_972600.2	1e-167	57.17%	PREDICTED: similar to CG6954 CG6954-PA [Tribolium castaneum]
NCBI nr blastp	gi\|270011370	2e-166	57.17%	hypothetical protein TcasGA2_TC005383 [Tribolium castaneum]
NCBI nr blastx	gi\|270011370	5e-168	45.65%	hypothetical protein TcasGA2_TC005383 [Tribolium castaneum]

Group
Gene Ontology	GO:0007165	3.1e-07	signal transduction
KEGG pathway
InterPro domain	[215-276] IPR020683	8.5e-10	Ankyrin repeat-containing domain
	[356-464] IPR008957	4.3e-09	Fibronectin type III domain
	[932-1033] IPR000159	3.1e-07	Ras-association
Orthology group	MCL13392		Single-copy universal gene

Nucleotide sequence:

>DPOGS210801-TA
ATGGAGACCCTCCTCGATAAATTCAAGAGGGACCAAGGAGGATTACGGAGGTCCAGATCCGTCCGCGCTTCCCTACGACTGATAGGTAACCGTTGGCGATCAACCAAGGACGAAGAAACGTCTGAGAACATTGACACCATCAAAGACGGAAACGTAGTACTGACGCAGATCTTTAACGGTGATAAAGATTACAACGTAGCGTACACGGGCATTGACGGTACTTACAAAGCAAAGACACCGAACATGGCCAAGAGGAAGCAGGAGCCGGTGAAGCCGAGGAAGAAGAGCGGAGACATCGATCTCACACTGAAGCCACAGCGGCATAGGAAAGTAGATAAGGCGAAAATAAGTGATTTATTCAATAAGAAACAGAAGAGTGTGTCCGCGAAAGAATTGCTCGTGCCGGAGAAGATACCACCGAAAGCGGCGGCCATATTACACATAAATTCACCGGATACCAAACTTAAGATTAAATTAAAATCGGTCGGCAAATCCGAGAGTGCTAAATCGGTGACCGATATAAAACATCGTCGCACGCGCAGGGGCTCCGAGAGCGATATGTGTGGGAGCCAGCCACGTGGGTTTGTCAACCAAGCCTTCGTATACAGCACACCGCCAAAGGAACGCAAGCTAAACCTATCACCATCAAGCTATTTGACTCTCTTCGCTGCCGTTGAACATGGCTACCTCGATAAGGCGAGAAACATCCTGGAGTCTACTGATGTCGATGTTAACAGCCTCAACCCAGACGGCCTGTCTCCGCTGGACGTGGCGGTGTTGGCCAACAACCGCCATCTGGTTAGAATGCTCATGGAGTTTGGAGCCAAGGAAGGCAGTCAATTCAAGAGCCCAGAAGCCCTCGGGAACCATCTCCGCAGACTGTCTCGCGAGGCGGAAGCCAGACTCCACGAGGTCACGGGGTACATACCTGAGGCTTGTAGAGAGGAAATGTGCAGATCATCGGGTGGCAACCAGGCCGGTACGATGGGTTGCGCTGGAGGTACCGGCTCGGAGAAGGACAAACAAACACAACACTGGGAGAGGCGGCTTAGAACATTGAAACGATTGGTGCAAGGTTGGCAGCAAGCTCGTGTCCCTCCAGCCTTGCCCTCACCCTCGTTGGAGGTCTGCGGACCGCACTCCGTCACCGTGTGGCTAGCGACACGGACCCAGGCACGCGACCCGCCGCTCGTTACCAAATACAAAGTGGAGTGGTCGTCTCGTGCGGATTTCTCAAATGTGTGCGGAAGTCGCGAGGTGGTGGCGTCCTGTGCTCGCGTGTCCGTGACGGGTCTGACCCGCGGCAGGCGGTACTTCTTCAGGGCTGCGGCCGGGAACGTGAAGGGCTGGGGCACTTACAGTGTGTCAGTACCTAGGAGCGTTGTACCCAGCAGCTGGAGTGATATATCAGTTCGTTCGTCTCGCGGGGAGGCTGGTGGCGCTGCGGCAGCGCTGGAAGCGCTCGCTGCGGCCACCGCAAGCACTCGAACCAGAACAGTCACAAGACTTCCTAGGAAGAAGACGGCCACTATACGACAACTGTTCACAGCGGCCAGCAAGTTCCAGAAGAACTTGAGGAGAGGCGTGTACTTAACTTGCATCATCTACCACGAGGACCGCGTCTTGGTCACCGGCGAGGAGTTCCTTCCGGTCGTTGAAGTGGATGAGACATACCCGGCCTGCATCTACACGGACTTCCACTGGCTGATGAAGGTGTCCTGTTCCTGGGAAGAAGTGAAGTCTCTGAGATCTGATATGGAGAAACACACGTCGTCGTCAATACACTTCAGACTGAAACTCCTCACAGCCGTCGCTCAGATGCAATCCGCGCTGGGGATACAAGACCTTGGCCAACTCTACCACAAACCGTTACGAGATTCTCACGGCACTGTCGTCCTCTCCTGTATAACCTCCGTGAAGTCACCCAAGGCCGTGTCGGCTTTGAACTCCCGCTGGCTGCCCGTCAACAAGCTGAGGCGACGCGTGCTCAGCGACGACAACACCATGGGAGAACTGCTCATGGCATCAGTTCACGAACAGATTGCCTACCATCAGGTGTCACGTGACCTGCTGCCGCGTGGTCTGTATCTCGGGTATTTGAAGTTGCAATCGTCGGTGGAGGTGGTCCGCATAGTGGCGCCATCTCGCACACCGAATGTACCACCACACACACGAGTCAGAGATAATCCTCATGTTTCCGCTGAGGAATGGGAGTACCTCAAGTCACAATCCGGCCGTTCTAACAACTACATGGGCAGCAACTCCCAGTTCGATATCAAATCTAACGGATCCCACGCTTCGATATCCAGCAACCGTCTGCCGCCATCGCGCAGCGAAGACACGCTGGTGCTACAAAACGAGAACATAGAACCCAAGCCAAGGCCGCACAGCATCAACACGAGTGTCTCAACCAGCTCCAGTCCGCTACTGACAGTGAAAGGCTTCTATCCCGGGAGCATGATCAGTGTGAAAACAAACAAGACGAACGTGTCGGAGTCCGCTCAGAGTCTGTCCAGCGATTCAGAAAGTCAAAGCTGTCCGCTCACAACGACAGTTCCTCTAAAAATCCGTCCGCAACTCACGCACGCAAACGTGACAGCTTCAAAAAGTATGACCAACGTGAAGTCGACGGACGTCGAATTCACTGACACGGGACAGGGGAGTAAGGGTCACAGTGTCAAACGTCAGCCACTGTTGGAGACACAGGAAGAAGAATATAATAATAAGGTCCAGAAGACTGACCAGAGACACAGTGACGATGACAGGAAACTACCTCCAGAACAACGAATTGATCAAGCTGGAATTTTACAGGTGTTCGCAGCCTACGAGACGGGCTTGGCTGTGGGTACATCACTCAAGTTGCACGTCACTCCACGAACATCAGCACGAGAGGTCATTGACCTCGTCGTCAAACAACTCAACATGGCCGCCGTTTTAAAAGGAAAATCCGGACCTGTCTACGGTCCGGAAAAGCTTCAAGATTTTTGCCTCGTAGCAGTTATAGGAGCCAGAGAGAGATGTCTACGAGACGACTTCAGACCTCTACAATTGCAGAACCCTTGGAGGAAAGGAAGATTATACGTCAGATTGAAACACGACGTGCTGGCTGCATTACAACATTCAGCCAAACAGCCCGCTTATATATAA

Protein sequence:

>DPOGS210801-PA
METLLDKFKRDQGGLRRSRSVRASLRLIGNRWRSTKDEETSENIDTIKDGNVVLTQIFNGDKDYNVAYTGIDGTYKAKTPNMAKRKQEPVKPRKKSGDIDLTLKPQRHRKVDKAKISDLFNKKQKSVSAKELLVPEKIPPKAAAILHINSPDTKLKIKLKSVGKSESAKSVTDIKHRRTRRGSESDMCGSQPRGFVNQAFVYSTPPKERKLNLSPSSYLTLFAAVEHGYLDKARNILESTDVDVNSLNPDGLSPLDVAVLANNRHLVRMLMEFGAKEGSQFKSPEALGNHLRRLSREAEARLHEVTGYIPEACREEMCRSSGGNQAGTMGCAGGTGSEKDKQTQHWERRLRTLKRLVQGWQQARVPPALPSPSLEVCGPHSVTVWLATRTQARDPPLVTKYKVEWSSRADFSNVCGSREVVASCARVSVTGLTRGRRYFFRAAAGNVKGWGTYSVSVPRSVVPSSWSDISVRSSRGEAGGAAAALEALAAATASTRTRTVTRLPRKKTATIRQLFTAASKFQKNLRRGVYLTCIIYHEDRVLVTGEEFLPVVEVDETYPACIYTDFHWLMKVSCSWEEVKSLRSDMEKHTSSSIHFRLKLLTAVAQMQSALGIQDLGQLYHKPLRDSHGTVVLSCITSVKSPKAVSALNSRWLPVNKLRRRVLSDDNTMGELLMASVHEQIAYHQVSRDLLPRGLYLGYLKLQSSVEVVRIVAPSRTPNVPPHTRVRDNPHVSAEEWEYLKSQSGRSNNYMGSNSQFDIKSNGSHASISSNRLPPSRSEDTLVLQNENIEPKPRPHSINTSVSTSSSPLLTVKGFYPGSMISVKTNKTNVSESAQSLSSDSESQSCPLTTTVPLKIRPQLTHANVTASKSMTNVKSTDVEFTDTGQGSKGHSVKRQPLLETQEEEYNNKVQKTDQRHSDDDRKLPPEQRIDQAGILQVFAAYETGLAVGTSLKLHVTPRTSAREVIDLVVKQLNMAAVLKGKSGPVYGPEKLQDFCLVAVIGARERCLRDDFRPLQLQNPWRKGRLYVRLKHDVLAALQHSAKQPAYI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: