MonarchBase - Protein-coding gene

DPOGS210902
Transcript	DPOGS210902-TA	1788 bp
Protein	DPOGS210902-PA	595 aa
Genomic position	DPSCF300045 - 253507-255309
RNAseq coverage	332x (Rank: top 35%)

Annotation
*Heliconius*	HMEL015826	0.0	86.46%
*Bombyx*	BGIBMGA003086-TA	0.0	82.24%
*Drosophila*	trn-PA	5e-103	44.92%
EBI UniRef50	UniRef50_D6WNE7	9e-140	58.73%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6WNE7_TRICA
NCBI RefSeq	XP_972275.1	6e-148	56.06%	PREDICTED: similar to leucine-rich repeat-containing protein 4B [Tribolium castaneum]
NCBI nr blastp	gi\|91083775	1e-146	56.06%	PREDICTED: similar to leucine-rich repeat-containing protein 4B [Tribolium castaneum]
NCBI nr blastx	gi\|91083775	1e-146	56.06%	PREDICTED: similar to leucine-rich repeat-containing protein 4B [Tribolium castaneum]

Group
KEGG pathway	dre:100148153	4e-34
	K06260 (GP5)	maps->	Hematopoietic cell lineage
			ECM-receptor interaction
InterPro domain	[304-352] IPR000483	3.9e-08	Cysteine-rich flanking region, C-terminal domain
Orthology group	MCL12681		Insect specific

Nucleotide sequence:

>DPOGS210902-TA
ATGCAGTTTTACACGGAACTTCAACACTTGGACCTGTCTCAGAATCATCTCGTCAGCATACCAATGAAAAACTTTGCATATCAACGAAAGTTACAAGAACTCCATCTTAACCATAACAAAATATCTTCAGTCACAAACACGACATTCCAAGGACTCAATTCATTGACCGTTCTCAACCTGAAACGTAACTTTTTGGAAGAACTTACAAATGGTGTATTTTCTACACTGCCGAGACTAGAAGAATTGAACTTAGGACAAAATAGAATATCAAAAATAGAGCCGAGAGCATTCGCTGGATTGTCTGCTTTGAGAATTCTTTATTTGGATGACAACGAGTTGAGTTCGGTCCCAACAACATCCTTTAGTCTTCTAGGCAGTCTCGCCGAGTTACACGTTGGCCTTAACGCTTTTTCTTTTTTACCTGATGATGCTTTCGCGGGTCTCAATAGGCTGGCAGTATTGGACCTTAATGGAGCTGGACTCTTTAATATAAGCGACTTTGCATTTAGGGGTCTCCCAGGATTAAGAAGCCTAAACCTTTTTGGGAACCGATTGAGTGTGGTTCCTACGCAACAGCTTTCTAGCTTGACGAGACTCGAAGAGTTATATATAGGCCAAAACGACTTTATCGTTTTAGAAAGTCACTCATTTAAAGGATTAAAAAATCTTAAACTTATAGACATAACGGGAGCGACTCAACTTAAACGAATAGAAAAAGGCGCTTTCGAAGATAATATCAACTTGGAATCTATTGTATTAACAAATAATAAAGAATTGTCCACCATAGAAGATTGTACTCTTCTAGGCTTGCCTAAATTACGACATGTATCATTGAGAGATAATGCCATAAAAGTGCTCAGTGAGAGCGTATTTGTAGGAAAAGAATTGAAGCAACTCGATTTAACAGACAATCCAATCATTTGCAACTGCAAAATTCTATGGTTACAGCAATTATTAAATGAGAAGAGCAATTTTTCTCAAGTGCAATGTGCCAGTCCAGAAAATTTAAAAGACAAATATTTAAAAACATTGACCGCCGAGGACTTGGAATGTGTTTTATACGATAGTCGACGGCAAACAATTATATGTATTGTAGGATTCGCGTGTCTCGCTGTTGTTGCAACACTGTTACTAATATTATACAGATATCGGAAGAGCATGCAGGAGAAACTCAAGGATTATAAGTGGAATAAGGGTCGTAAGAATTTAGAATACCACAAACCCATTTCCACGGAGGAGGACTGCATCGTTCGGGGCATCCACCCATCCCAGTACCCGGCGCCGCCGCACGCGCCCGGCCTCAGGCCTATCCCGCTAGAGCTTTACGCCTCCCCGAGCGTTTTCTTCATGTCAGGCGGCCAGGGCTCCGCGCGGCGGCCGCAGCGCTCGGGAGGCGGCGGCACTATGCCCGCCAACGGTTTCACGTACATCGGAGGCGATGGACGCCACCATCAACCACAAACCCTCAACAACGGTGCACCAGCGCACCACCTCAACAACGGCTCATTGCGTTCCTTGCCAGACAAAAAGAACCGCAATGGCGTCGTCTGTCACCCTGAAAACTTCCAACGTAATCTCGACACCCGATATTCGAGGAAACAGGAGAATGGTTACATACGTAACTCGGAAACCATAATAGGTTTTCCTCGGGACCGGGAGAGGGAGCATGACTACGAGCGGGATGTCCCCGACTACAGCGAGCCAGAGTACTCCATCATCCCTGAGAGCTACGGCCGACCGGAGGACTTCCCTCGCTCGTGCAGCCGCTCCAACACCTTCAACTGTTGA

Protein sequence:

>DPOGS210902-PA
MQFYTELQHLDLSQNHLVSIPMKNFAYQRKLQELHLNHNKISSVTNTTFQGLNSLTVLNLKRNFLEELTNGVFSTLPRLEELNLGQNRISKIEPRAFAGLSALRILYLDDNELSSVPTTSFSLLGSLAELHVGLNAFSFLPDDAFAGLNRLAVLDLNGAGLFNISDFAFRGLPGLRSLNLFGNRLSVVPTQQLSSLTRLEELYIGQNDFIVLESHSFKGLKNLKLIDITGATQLKRIEKGAFEDNINLESIVLTNNKELSTIEDCTLLGLPKLRHVSLRDNAIKVLSESVFVGKELKQLDLTDNPIICNCKILWLQQLLNEKSNFSQVQCASPENLKDKYLKTLTAEDLECVLYDSRRQTIICIVGFACLAVVATLLLILYRYRKSMQEKLKDYKWNKGRKNLEYHKPISTEEDCIVRGIHPSQYPAPPHAPGLRPIPLELYASPSVFFMSGGQGSARRPQRSGGGGTMPANGFTYIGGDGRHHQPQTLNNGAPAHHLNNGSLRSLPDKKNRNGVVCHPENFQRNLDTRYSRKQENGYIRNSETIIGFPRDREREHDYERDVPDYSEPEYSIIPESYGRPEDFPRSCSRSNTFNC-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: