MonarchBase - Protein-coding gene

DPOGS210507
Transcript	DPOGS210507-TA	1674 bp
Protein	DPOGS210507-PA	557 aa
Genomic position	DPSCF300186 - 1136-5406
RNAseq coverage	2118x (Rank: top 6%)

Annotation
*Heliconius*			%
*Bombyx*	BGIBMGA012593-TA	9e-19	56.63%
*Drosophila*	Bsg-PG	9e-31	39.73%
EBI UniRef50	UniRef50_UPI0000D566B5	3e-31	35.22%	UPI0000D566B5 related cluster n=1 Tax=unknown RepID=UPI0000D566B5
NCBI RefSeq	XP_966740.1	6e-32	35.22%	PREDICTED: similar to AGAP008408-PA [Tribolium castaneum]
NCBI nr blastp	gi\|91085555	1e-30	35.22%	PREDICTED: similar to AGAP008408-PA [Tribolium castaneum]
NCBI nr blastx	gi\|195472907	2e-33	40.00%	GE18733 [Drosophila yakuba]

Group
KEGG pathway
InterPro domain	[410-508] IPR013783	2.1e-08	Immunoglobulin-like fold
	[414-509] IPR003599	5.9e-08	Immunoglobulin subtype
	[413-508] IPR013098	6.7e-07	Immunoglobulin I-set
Orthology group	MCL16576		Insect specific

Nucleotide sequence:

>DPOGS210507-TA
ATGGCACCGTGCGCAGAGAACGAGGCGGCGGCGGGGGAGGAGAGCCGAGTGACTGTGACGGCCGGGGCTCCGCTGACGGTGGAGTGTCGCCTGCGGCCCGAGCAGCGCGCCGAGTGGCGTAGGGACGGGGCCACGCCGCCGCCCGACTTGCGTGCGGCCCCCGAAGCGGCAGCAGGCTCGGGGCTGGCCGCTCGCCTGCAGGCCCCGGCCGCCCGCGATCACCACGCCGGCCTCTACACTTGCAGCCGGGAGCGCGACCACCGCGTGCGCGTCGTGGTGCTCCCCGGTACTGGTCCCGGTGCAGGCCGAGCATGTTTCTGGCTCCTTGCGGTGACCCTCCGTCACTCCGCCGTCACTCCGTCTGCTCGTCCTCTCTCGGAGTCGGCCGCCCCTGTGTCTGTGTCTCCCTCGGCCTCCGAGGCCGTCCCCGCCGCACCCGCCGGGCCCGTGTCTCCCGCCGCCGCCGGGGCCTCGGACCTCGCAGAGCTGTTGTACGACGTGCGCGGTAACCTGTCCCTGCACTGCTCGCTGCCCAACGAGAACAGCCTCGCATATGTCTGGACTAAGAACGGTACGGCCCTAGAGCAGGTGTGGGAGATGACAGGCCGCTACGTGCTAGAGAAGGGAGGAGCAGAGCTGAGACTGGCCCGGGCCCTGGAGGACGACTTCGGCAACTACACGTGTGGAGTCGCGGGAAGGAGCGAGACACAGGGCTGGGCGGTGCGCGGGCGACCGCATCTCAAGGTGCCCGCCAACACCAACGTGGTGGAGGGGCAGCGGCTCAAGCTCGTGTGCAAGGTTATTGGCAAACCTTACCGGCCTGTCAGTTGGTGGTACTCCAACTCCTCGGACGACGAAGGCAACTTCACGGAGGTGACGGCGGCGCTCGGGGCGCGCGCCGTAGTGGGCTCGGGCGAGGGCGGAGCGCCCGGCGCCGTGCTCACCGTGGAAGCGGCGGCGCGCTCCCCGCACCGTTATCTTTTCCTTATCACGGTAATCTCCGAGGACGCAGCGGCGGCCGCGATAGCGACACCGAGCAACAATCTCATGACGACTAAGAACGGTACGGCCCTAGAGCAGGTGTGGGAGATGACAGGCCGCTACGTGCTAGAGAAGGGAGGAGCAGAGCTGAGACTGGCCCGGGCCCTGGAGGACGACTTCGGCAACTACACGTGTGGAGTCGCGGGAAGGAGCGAGACACAGGGCTGGGCGGTGCGCGGGCGACCGCATCTCAAGGTGCCCGCCAACACCAACGTGGTGGAGGGGCAGCGGCTCAAGCTTGTGTGCAAGGTTATTGGCAAACCTTACCGGCCTGTCAGTTGGTGGTACTCCAACTCCTCGGACGACGAAGGCAACTTCACGGAGGTGACGGCGGCGCTCGGGGCGCGCGCCGTAGTGGGCTCGGGCGAGGGCGGAGCGCCCGGCGCCGTGCTCACCGTGGAGGCGGCGGCGCGCTCCGACGCCGGCCGCTACCGCTGCAGCGCGCCGGACGCCACACTGCCCGCCACCACCACGCTCCGGGTCAAGGACATGTACGCCGCCCTATGGCCCTTCCTCGGCATCTGCGCCGAGGTGTTCGTGCTCTGCGCCATCATCCTGGTATACGAGAAGAGACGCACCAAGCCCGAGCTCGACGACTCCGACACCGACAACCACGACCAGAAGAAGTCGTAA

Protein sequence:

>DPOGS210507-PA
MAPCAENEAAAGEESRVTVTAGAPLTVECRLRPEQRAEWRRDGATPPPDLRAAPEAAAGSGLAARLQAPAARDHHAGLYTCSRERDHRVRVVVLPGTGPGAGRACFWLLAVTLRHSAVTPSARPLSESAAPVSVSPSASEAVPAAPAGPVSPAAAGASDLAELLYDVRGNLSLHCSLPNENSLAYVWTKNGTALEQVWEMTGRYVLEKGGAELRLARALEDDFGNYTCGVAGRSETQGWAVRGRPHLKVPANTNVVEGQRLKLVCKVIGKPYRPVSWWYSNSSDDEGNFTEVTAALGARAVVGSGEGGAPGAVLTVEAAARSPHRYLFLITVISEDAAAAAIATPSNNLMTTKNGTALEQVWEMTGRYVLEKGGAELRLARALEDDFGNYTCGVAGRSETQGWAVRGRPHLKVPANTNVVEGQRLKLVCKVIGKPYRPVSWWYSNSSDDEGNFTEVTAALGARAVVGSGEGGAPGAVLTVEAAARSDAGRYRCSAPDATLPATTTLRVKDMYAALWPFLGICAEVFVLCAIILVYEKRRTKPELDDSDTDNHDQKKS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: