MonarchBase - Protein-coding gene

DPOGS209892
Transcript	DPOGS209892-TA	2109 bp
Protein	DPOGS209892-PA	702 aa
Genomic position	DPSCF300049 - 396935-401449
RNAseq coverage	580x (Rank: top 22%)

Annotation
*Heliconius*	HMEL006752	0.0	71.29%
*Bombyx*			%
*Drosophila*	cactin-PA	0.0	55.43%
EBI UniRef50	UniRef50_Q9VR99	0.0	55.43%	Cactin n=12 Tax=Drosophila RepID=Q9VR99_DROME
NCBI RefSeq	XP_975642.1	0.0	57.91%	PREDICTED: similar to cactin CG1676-PA [Tribolium castaneum]
NCBI nr blastp	gi\|91087375	0.0	57.91%	PREDICTED: similar to cactin CG1676-PA [Tribolium castaneum]
NCBI nr blastx	gi\|383849449	0.0	57.18%	PREDICTED: uncharacterized protein C19orf29-like [Megachile rotundata]

Group
KEGG pathway
InterPro domain	[578-702] IPR019134	1.4e-57	Cactin protein, cactus-binding domain, C-terminal
	[240-421] IPR018816	2e-53	Cactin, domain
Orthology group	MCL15295		Single-copy universal gene

Nucleotide sequence:

>DPOGS209892-TA
ATGTCGTCACGACATATAAGTAAACACAGAGATATCTCTCGCGGTCGTTCAGTTGAGCATCATCGAGATTGTGGAGGACGAAGTGAAGACAAAATCTCTGAAAAAAGGTCAAGATCACCTAACAGAAAACGGAAGTCCGCCAGCAAAGATAGACGTAAGTCACCACAAAAAAAACACACGTCTTCTAGTAGTGAAAGAAAGAAAGAATCAAAGAAGAAGAAAAGTAAAAAGAAAAAAAAGTCACGTAATTCATCAAGTAGCAGCAGCAGCAGCAGCAGTAGCAGTAGTGACAGTGACGAGGAAGAGTTAAAACTACTACAGAGACTTGAAGCAGAGAGGTTGAGGCTGAAAGAAGAAAAAAGAAAGCAGAAAGAAATGATAAAAGCAAATGAAACACCCGAGGAGAAAAGAGCTCGACGTCTAAAAGAAAAGCAAGAAAAGGAAAGGAAGAGACGTGAGCGTATGGGGTGGGACAACGAGTATCAGTGTTACACCGATCAAGATAACCCCTTCGGAGACTCTGCTCTCACTGACACATTTGTATGGACAAAGAAACTGGCTAAGGAAGGTGTTAAGAATGTCTCTCACAACGAACTGGAGGCATTGAACAGGCAGAAACAATTAGAAAATAAAATTGAATTGGAGAAGGTGAAGCAGCGTCGACTGGAGCGCGAGGCTGAGCGTGCGGCACGCGAGGCCGAGGCGGCGGCGGCGGCCCGGGCCCGGGAGGCCGCGCAGTTCAGCAGCTGGGCTCGACACGAAGACGAGTTCCATCTGCAGCAGGCCCGGCTGCGCTCGCAGATACGGATACGAGACGGAAGAGCTAAGCCGATAGACCTCCTCGCGTGGTACGTGAGTTCCGAGCAGTGTGTCGATGCGCTCGAAATGCACGAGCCGTACACGTACCTGAACGGCCTGCACGCACAGGACCTGGAGGACTTACTGGAGGATATCAAGGTGTACAAGGAGCTGGAGCAGGACGTGAACCAATCGTACTGGGAGGACGTGCAGACTATCGTGTCGTCGGAGCTGGCGAAGCTGCGGCGCCTGGCTCCGGGCCGGGACGGGGTGCACGCCGCCGTGGCCGAAGACGTGGCCGGCGTGTTCCGCGGGAAGAGCACGGCCGCCCTGCTTCAGTTGCAGGACGCCATCGAACACAAGATGGCCGCCAGGACCGCCGGGATCGACGTGCACTACTGGGAGAGTCTGCTCAGCCAGCTCAAAGCTCACATGGCACGAGCTCGTCTCCGAGACCGGCACCAGAACAACCTCCGCCGCAAGCTGCAGCTGCTGAAGAGGGAACAAGGAGTCGCCGCGGACGAGCACGCGGAACACGAGGACAAACACACACACGGAGAGGGCGCTGGTCCGGAGCAGAAGTCGCCTCGGACGGAGAGCGAGGCGGAGGAGGCGGAGGCGGAGGGCGAGTCGTGGTGCGGAAGTTACTCCCCGCGGTACCTGGCGCCCGCCTCGCTGGAGCCCGCCACGCTGCTGCTGGAGCCCCACGAGGACCGCCAGCGCCTCGCCTTCCTCCGAGCCAGGCTGCATGCCGCCGCCGCCGCCGACCAGCACAAGGCCACGCTCGCTAAGCTTCCGGAGGCAGCTGATGCAGTGCCGGGCACCAGCACGGGCGCTCTGGAGGCGGCCGCGAGGCGCTCCATGGAGGGAGGCAGTGAGGGCGGCGCCGCACAGTTCAGTGTGGAGCACGTGCTGCCCGACCAGCCTTGCTTGTGGGCGGACAAGTACAGACCCAGGAAACCAAGATACTTCAACAGAGTCCACACCGGCTTCGAGTGGAACAAATACAACCAGACTCATTACGACATGGACAACCCTCCGCCGAAGATCGTTCAAGGATACAAGTTCAACATCTTCTACCCGGACCTCATCGACAAGAGCGCCACCCCTGAGTTCTCACTTAAGCCGTGTGCTGACAACCCTGAGTTTGCTGTGCTTCGTTTCCATGCGGGCCCACCCTATGAAGACATCGCCTTCAAGATAGTGAACCGTGAGTGGGAGTACTCCTACAAGAGAGGCTTCCGCTGTCACTTCCACAACAACATCTTCCAGTTGTGGTTCCACTTCAAGAGATACAGATACAGGCGTTGA

Protein sequence:

>DPOGS209892-PA
MSSRHISKHRDISRGRSVEHHRDCGGRSEDKISEKRSRSPNRKRKSASKDRRKSPQKKHTSSSSERKKESKKKKSKKKKKSRNSSSSSSSSSSSSSDSDEEELKLLQRLEAERLRLKEEKRKQKEMIKANETPEEKRARRLKEKQEKERKRRERMGWDNEYQCYTDQDNPFGDSALTDTFVWTKKLAKEGVKNVSHNELEALNRQKQLENKIELEKVKQRRLEREAERAAREAEAAAAARAREAAQFSSWARHEDEFHLQQARLRSQIRIRDGRAKPIDLLAWYVSSEQCVDALEMHEPYTYLNGLHAQDLEDLLEDIKVYKELEQDVNQSYWEDVQTIVSSELAKLRRLAPGRDGVHAAVAEDVAGVFRGKSTAALLQLQDAIEHKMAARTAGIDVHYWESLLSQLKAHMARARLRDRHQNNLRRKLQLLKREQGVAADEHAEHEDKHTHGEGAGPEQKSPRTESEAEEAEAEGESWCGSYSPRYLAPASLEPATLLLEPHEDRQRLAFLRARLHAAAAADQHKATLAKLPEAADAVPGTSTGALEAAARRSMEGGSEGGAAQFSVEHVLPDQPCLWADKYRPRKPRYFNRVHTGFEWNKYNQTHYDMDNPPPKIVQGYKFNIFYPDLIDKSATPEFSLKPCADNPEFAVLRFHAGPPYEDIAFKIVNREWEYSYKRGFRCHFHNNIFQLWFHFKRYRYRR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: