MonarchBase - Protein-coding gene

DPOGS203969
Transcript	DPOGS203969-TA	1809 bp
Protein	DPOGS203969-PA	602 aa
Genomic position	DPSCF300005 + 674059-689141
RNAseq coverage	252x (Rank: top 41%)

Annotation
*Heliconius*	HMEL010369	2e-153	81.31%
*Bombyx*	BGIBMGA000730-TA	2e-12	82.50%
*Drosophila*	magu-PC	7e-89	32.64%
EBI UniRef50	UniRef50_UPI000224627F	5e-109	40.42%	UPI000224627F related cluster n=1 Tax=unknown RepID=UPI000224627F
NCBI RefSeq	XP_001687912.1	6e-117	40.34%	AGAP007489-PB [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|340716913	7e-123	41.69%	PREDICTED: LOW QUALITY PROTEIN: SPARC-related modular calcium-binding protein 1-like [Bombus terrestris]
NCBI nr blastx	gi\|350420596	8e-125	43.40%	PREDICTED: SPARC-related modular calcium-binding protein 1-like [Bombus impatiens]

Group
Gene Ontology	GO:0005509	4.2e-34	calcium ion binding
	GO:0007165	1.3e-11	signal transduction
	GO:0005578	1.3e-11	proteinaceous extracellular matrix
	GO:0005515	7.5e-09	protein binding
KEGG pathway
InterPro domain	[405-571] IPR011992	4.2e-34	EF-hand-like domain
	[381-450] IPR000716	3.6e-18	Thyroglobulin type-1
	[501-565] IPR019577	1.3e-11	SPARC/Testican, calcium-binding domain
	[34-85] IPR002350	7.5e-09	Proteinase inhibitor I1, Kazal
	[51-85] IPR011497	4.6e-08	Protease inhibitor, Kazal-type
Orthology group	MCL12606		Single-copy universal gene

Nucleotide sequence:

>DPOGS203969-TA
ATGATTATGAATGACTTAGTGTTCCTCATTTTTTGTTTAAATTATATTTGTTACGTTAGTGGTGCTGATTCTGGCGAGAAGCCCAATGCGCAAAGCGAGACCTGTTACCATCGCGTGGCGGCGTGTGAAGCAAACACGGGTGCCGTGAATCGTCCAGTCTGCGGTTCCGACGGACATAACTACCCTTCAAAATGTCACTTAATGAAGGCACAGTGCTCAGGAGAACCTATTGTAATGGCCCACAGAGGGCCCTGTACAGACAGTCAAACTTCATGTATGGCGGTGCTGCGTTATGCATTGAAGCAAGGCGGTCGTCGTGCCACATTTGTGCCAAGGTGCCGCGCGGACGGCACTTATGCCGCCGTGCAATGTGCCGCTGCAGGTGCCGCAGCTGGCTGTTGGTGTGTCACCGCCGACGGGAAACCTCTGCCCGATACAGCTGTGAGGAATGGAAGGCCAGATTGTACGAGAACTGGCATTGATGTCTGTTTTATATGGCGACGAAATGTTATAAGGATAGAATTCATGACTAGTTTGAAGAACTGCGGGATGGCCGTCCCTTACAAGGTAGCCCAACCCCACGTCTGGTTCTTCTGTAAATCTCAAACAAAGCGGCGCTCTTCCGTTCGAGGTCAACGTAATAAGAAAAGTTGTACCAGAGTAGACAGAGCACAGTTCAATGGAAATCTTATCAAAATATTCAGTGGAGAATACGACCGAGCCCGAGCTGATGATGGAGGGGCCTCGGATCCTCGAGGAGTCGCTGATTGGAAATTCAGGGAACTGGATCGTGATAGAAGTGGGACGCTGCAGAAGTCTGAGTATCGCGGCTTGCGGCGGCTCATCAAAAAGGTGGTGAAACCAAAACGATGCGCTCGCGCATGGGCCCGCGGTTGTGACGGCGACGGGGACGGGGAGATCGCGCGCTCGGAGTGGGCCGCATGTCTCTTGGCCAGCCCGGACCCACCCGCTCCGGACTTCTCTCTCCGTTTCTTCATGTCGTTGAATGCAGACGACGATAGTGTTCCAGAGCCCGAACCGGACTACGAAGAGGAACCACCTCCAGACCCCAGTTCAGTATTGCCTGGCATAATGCGGAATTCCTTCGCTCCAGACGGTTCTGTCGTTAGAGAAGATGAAACAAACGACTGTCTCACAGACCGACAGGCCGTGCTAGATGAACAGAAAGCTGGCAGTGCTGTTTTATACGTGCCAGAGTGTACTGGTGACGGTCGGTATGCGCGCGCGCAGTGTTACCGCTCCACCGGCTACTGCTGGTGCGTCCATCAAGACACTGGCAAACCGATACCGGGATCGTCGGTCAAAGACGCTAAGCCGGACTGCGACGCCGCTCCACAACACGCCAGCCCAATGAGAGGTTGCCCAGAACCAATGAAGAGTCATTTTCTCCATGACCTGATAAGTTTCTTCATATCAAAGATGACTACTTCTATCAACGGCACGGGTCCAGGAGATGTGGTGAAATGGGGGGCGTCGAAGGAGGAGCAGGCAGCTACTTGGACCTATGTTATGTTAGATAAAGACAAAAACAAAGCCTTGGAAAGACGGGAGTGGAAAGCTTTCCACCAGCTGATATCAAACATGGAGCCATTGAGAAGATGTGGAAGAAAACTCCCTCGTTACTGTGACGTAAACCATGATTCCAAGATTAGTATTACAGAATGGATGGCCTGCTTGGAGGTCACACAGGCAGCGCACGGGCATACCACTGAAACAACAAAAGTTCCATCTAATCCAAGAAGAAAAGGACCCAATCCTCTCGAATCGATTCTAAAGGCCGACGACTAG

Protein sequence:

>DPOGS203969-PA
MIMNDLVFLIFCLNYICYVSGADSGEKPNAQSETCYHRVAACEANTGAVNRPVCGSDGHNYPSKCHLMKAQCSGEPIVMAHRGPCTDSQTSCMAVLRYALKQGGRRATFVPRCRADGTYAAVQCAAAGAAAGCWCVTADGKPLPDTAVRNGRPDCTRTGIDVCFIWRRNVIRIEFMTSLKNCGMAVPYKVAQPHVWFFCKSQTKRRSSVRGQRNKKSCTRVDRAQFNGNLIKIFSGEYDRARADDGGASDPRGVADWKFRELDRDRSGTLQKSEYRGLRRLIKKVVKPKRCARAWARGCDGDGDGEIARSEWAACLLASPDPPAPDFSLRFFMSLNADDDSVPEPEPDYEEEPPPDPSSVLPGIMRNSFAPDGSVVREDETNDCLTDRQAVLDEQKAGSAVLYVPECTGDGRYARAQCYRSTGYCWCVHQDTGKPIPGSSVKDAKPDCDAAPQHASPMRGCPEPMKSHFLHDLISFFISKMTTSINGTGPGDVVKWGASKEEQAATWTYVMLDKDKNKALERREWKAFHQLISNMEPLRRCGRKLPRYCDVNHDSKISITEWMACLEVTQAAHGHTTETTKVPSNPRRKGPNPLESILKADD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: