MonarchBase - Protein-coding gene

DPOGS209158
Transcript	DPOGS209158-TA	1767 bp
Protein	DPOGS209158-PA	588 aa
Genomic position	DPSCF300061 - 233613-241705
RNAseq coverage	827x (Rank: top 16%)

Annotation
*Heliconius*	HMEL009757	4e-131	61.19%
*Bombyx*	BGIBMGA011476-TA	3e-120	54.15%
*Drosophila*	CG17168-PA	9e-80	54.58%
EBI UniRef50	UniRef50_Q9W5Q1	1e-77	54.58%	CG17168 n=9 Tax=Eukaryota RepID=Q9W5Q1_DROME
NCBI RefSeq	NP_001015254.1	3e-78	54.58%	CG17168 [Drosophila melanogaster]
NCBI nr blastp	gi\|62862214	5e-77	54.58%	CG17168 [Drosophila melanogaster]
NCBI nr blastx	gi\|195396337	4e-88	38.21%	GJ16691 [Drosophila virilis]

Group
Gene Ontology	GO:0005515	4.2e-30	protein binding
KEGG pathway
InterPro domain	[427-552] IPR000253	4.2e-30	Forkhead-associated (FHA) domain
	[425-555] IPR008984	7.7e-29	SMAD/FHA domain
Orthology group	MCL12652		Single-copy universal gene

Nucleotide sequence:

>DPOGS209158-TA
ATGAAATCCAAAAAGCGTCACCACAATTCATCTGACGAGTCCGAAGAGTCTGACGGAAGTGTACAATCGAGTAGTTCATCAGATAGTGATAGTGATGATTCTTCGGTGTCGGAAACCCGCTATAAGAAAAAGCGAAAACGTGCCAACAACTCTTCCGAATCCGAAAGTAATTCTGATGACCAAAAGCGATCCAAAAAACGTAAGCATAAGAAGAAGAAGAAGAAACATAGCAAGAAGAAGAGGCGGTCGGATTCGTTAGAAGATGTTACCGACGATAATATTTCTATAAGCGAGGGTGAAATATCTGTGAAGAAAAAGCGGAAGCATAAACATAAGCACTCGAAACGGTCACAGACTTCTGGAAGCGAAGATGAGTTGGAACGGCATAATGAACGCCGGCTAATGAGTGTTGTTAAGGAAAGACGCGGATCTTCAGACGAGGGCAGCCAGCCTTCCCGCACTTACTATCAGAAAGAATATCACGGTTCAATGCATCCCAGAGATTATGATATTGATCAAAATTCTCAAAAGTATTACAAGGAACCAATGAGGGAACACGGCTATCAGGATTACCAGGACTATAGGGAAAGGGATGACAGATATCAAGATGAGAATCGTCAAAGGGAGAAATATGGTCACAGTTCACACAACGCTGATTACGGTGGTCAGAGAGAATACAATGTCTATAAAAGATCATCGAAATATGAGTCTAGACCGGATGAAGTCTACAGAAAAGAAAGGGACGATCCCTATGGTCCCAGAGAAGATATGAGAGGCCATCCGAAATATCCTCAGAGGTTTGATGAGAGACCTCCAAAGAGGTTTGATGACAACCGTGATTACCGTGACAGACGTGTACAGGAAGCTGAACGCTACAGAGAGAAGGCCTATGAAAAGAGAGAAAAATATGGAGGAGATGGAAATTCAGTGGAAAGAGAGGAATCAAGATCAAGAAGTCCGGATGAGCGCTACAGGGAAAAGAACAGAGATAGAAATGATCGTTACAGGGGGGAGGACACAAGGAGGGGAGAGGAGAGAGGGGAGGGGAGGAGGGTTGAGGAGAGGGGAGAGGGGCGGCGGGTTTATTATAATCTGTGTTGTAACGTTTATTTTACTGACAACGCTAATGATAATAAAGAATACACCTGGGGGAAGACGGAGGTGAAGAAGGAAGGGGCCAAGAATCCAGCTGATAAAGAGAAGCCTAACTTTGGATTATCAGGGAAGTTGACAGCAGACGCTAACACAGTGAATGGAGTGGTCATCAAATACACTGAGCCTGATGATGCAAAGCAACCCAAGAGACGCTGGAGGTTCTATCCGTTCAAAGGCGACAAGGCTCTCCCGATCCTGTACATCCATCGCCAATCCTGCTTCCTCATCGGCAGAGATAAAAAGGTCGTCGACATAGCCCTCGAACACCCATCCATAAGCAAGCAACACGCGGCGTTGCAGTACAGAGCGACTGCCTTCACCAGGGACGATGGCACTCAGGGGAGACGTGTCAGGCCTTATATCATAGATTTAGAATCGGCGAACGGCACGTTCGTGAACAACAAGAAGATAGAGGCCCGCCGCTACGTGGAACTGCTCGAACGAGACGTCGTCAAGTTCGGCTTTTCGGCGCGGGAGTACGTGTTGCTGCACGAGAACAGCAAGGACGAGGGCCAGGACGACGACCAGGAACCCGCCCCCGCCCTCACCACCGTCGACCAGCTGAAGAGGGAGAAGCACGCCAAGGAGGCGGCGGCCGCGGACGGGGAGTAA

Protein sequence:

>DPOGS209158-PA
MKSKKRHHNSSDESEESDGSVQSSSSSDSDSDDSSVSETRYKKKRKRANNSSESESNSDDQKRSKKRKHKKKKKKHSKKKRRSDSLEDVTDDNISISEGEISVKKKRKHKHKHSKRSQTSGSEDELERHNERRLMSVVKERRGSSDEGSQPSRTYYQKEYHGSMHPRDYDIDQNSQKYYKEPMREHGYQDYQDYRERDDRYQDENRQREKYGHSSHNADYGGQREYNVYKRSSKYESRPDEVYRKERDDPYGPREDMRGHPKYPQRFDERPPKRFDDNRDYRDRRVQEAERYREKAYEKREKYGGDGNSVEREESRSRSPDERYREKNRDRNDRYRGEDTRRGEERGEGRRVEERGEGRRVYYNLCCNVYFTDNANDNKEYTWGKTEVKKEGAKNPADKEKPNFGLSGKLTADANTVNGVVIKYTEPDDAKQPKRRWRFYPFKGDKALPILYIHRQSCFLIGRDKKVVDIALEHPSISKQHAALQYRATAFTRDDGTQGRRVRPYIIDLESANGTFVNNKKIEARRYVELLERDVVKFGFSAREYVLLHENSKDEGQDDDQEPAPALTTVDQLKREKHAKEAAAADGE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: