MonarchBase - Protein-coding gene

DPOGS210000
Transcript	DPOGS210000-TA	1263 bp
Protein	DPOGS210000-PA	420 aa
Genomic position	DPSCF300247 + 135572-161615
RNAseq coverage	23x (Rank: top 78%)

Annotation
*Heliconius*	HMEL013350	9e-78	49.45%
*Bombyx*	BGIBMGA006372-TA	2e-92	52.40%
*Drosophila*	CG34391-PC	6e-151	79.15%
EBI UniRef50	UniRef50_A8JNC7	8e-149	79.15%	CG34391, isoform C n=26 Tax=Neoptera RepID=A8JNC7_DROME
NCBI RefSeq	XP_969598.2	5e-158	78.84%	PREDICTED: similar to AGAP004915-PA [Tribolium castaneum]
NCBI nr blastp	gi\|270014616	2e-169	83.92%	hypothetical protein TcasGA2_TC004659 [Tribolium castaneum]
NCBI nr blastx	gi\|270014616	1e-165	83.92%	hypothetical protein TcasGA2_TC004659 [Tribolium castaneum]

Group
KEGG pathway
InterPro domain	[249-320] IPR013783	4.9e-20	Immunoglobulin-like fold
	[141-213] IPR013098	1.2e-13	Immunoglobulin I-set
	[147-214] IPR003598	7e-13	Immunoglobulin subtype 2
	[36-131] IPR003599	4.5e-07	Immunoglobulin subtype
Orthology group	MCL17163		Insect specific

Nucleotide sequence:

>DPOGS210000-TA
ATGACCGGACGACGCGGACCCTTCAGGAGTTTCGCTATCAGCATCATTCAAATTATCACCATCATATGTCAAGTGTTGACTGAAGAGCCACGTTTTGCGGAACCCATACCTAACGTGACGGTAGCGCTCGGGAGAGATGCCAGCTTACCTTGCGTGGTTGAACACCTCGGCACCTACAAGGTGGCATGGATTCACATCGATCGTCAAATGATCCTGACCATCCACCGTCACGTGATCACCCGCCTCGCCAGATTCAGCGTCTCACACGACAACGCGATGACCTGGTTGCTCCACGTTAGCCAAGTACAGCAAGAAGACCGAGGGTATTACATGTGCCAAGTGAATACGAATCCAATGATCAGTCAAGTTGGATACTTACAAGTTGTTGTACCCCCGAATATATTAGATGAAGAAAGCACACAGTCAGCAGTGGCAGTTAGAGAAAACCAGAATATTAGCCTTATTTGTAAGGCAGATGGCTTCCCGACACCGAAAATTATGTGGCGAAGAGAAGATGGCCAGCCTATATCCGTTGACAGGAGAAAGAAAGTAACAGTCTACGAAGGAGACACGCTAAGTCTACAACGCATCAGTCGCACAGAGATGGGAGCGTACCTCTGCATCGCAACCAACGCGGTGCCACCCTCCGTCTCCAAGAGGATCATTGTGGATGTTGAATTTTCTCCCATGATCTGGGTACCCAACCAGCTAGTCGGCGCGCCTGCCGGCACTGACGTTACCGTGGATTGCCATACAGAAGCTCATCCACGAGCGATCTCATATTGGGTATACGATAGTGTTATGGTTCTACCAACCAAGAAATACGCCATCAACACAGAGGAAAACTCATACAGGGCCCACATGAAGCTGACTGTCAGAAATCTCCAAAATGGCGACTTTGGCAATTACAGATGCATTTCCAAAAATTCTCTCGGAGAAACCGAAGGGTCTATCAGATTGTATGAAATCCCGATGCCTTCGACGTCGCCTAAAGCTACAGAAATGAAGAGCAACGCCAATAAAGAAATCGTGCGTCGCATGAACGTGACGCGTGCGGGTTCTCACGAGTCGGTGACCGAGCGCCCAAGTGTGGTGCGCGCTCAGCTTGACCGAGCACCGGACCGCGGGCATGTCTACCGCGCGCCACATCCTCACCAGGCATCAGGTACCCGGAGTCTGCTATGTTGGCGTCAATCTTTCTTGGCTGTAATGATACTGGCTAATATGGACATCATTTCCGAATTCTTAATGTTATGTTTTTAA

Protein sequence:

>DPOGS210000-PA
MTGRRGPFRSFAISIIQIITIICQVLTEEPRFAEPIPNVTVALGRDASLPCVVEHLGTYKVAWIHIDRQMILTIHRHVITRLARFSVSHDNAMTWLLHVSQVQQEDRGYYMCQVNTNPMISQVGYLQVVVPPNILDEESTQSAVAVRENQNISLICKADGFPTPKIMWRREDGQPISVDRRKKVTVYEGDTLSLQRISRTEMGAYLCIATNAVPPSVSKRIIVDVEFSPMIWVPNQLVGAPAGTDVTVDCHTEAHPRAISYWVYDSVMVLPTKKYAINTEENSYRAHMKLTVRNLQNGDFGNYRCISKNSLGETEGSIRLYEIPMPSTSPKATEMKSNANKEIVRRMNVTRAGSHESVTERPSVVRAQLDRAPDRGHVYRAPHPHQASGTRSLLCWRQSFLAVMILANMDIISEFLMLCF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: