MonarchBase - Protein-coding gene

DPOGS204414
Transcript	DPOGS204414-TA	1776 bp
Protein	DPOGS204414-PA	591 aa
Genomic position	DPSCF300002 - 605167-609805
RNAseq coverage	1441x (Rank: top 9%)

Annotation
*Heliconius*	HMEL006263	0.0	76.05%
*Bombyx*	BGIBMGA007719-TA	0.0	68.65%
*Drosophila*	Hcf-PC	7e-67	62.50%
EBI UniRef50	UniRef50_E3WQB7	3e-71	61.43%	Putative uncharacterized protein n=1 Tax=Anopheles darlingi RepID=E3WQB7_ANODA
NCBI RefSeq	XP_318042.4	8e-71	57.21%	AGAP004774-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|312382809	1e-70	61.43%	hypothetical protein AND_04298 [Anopheles darlingi]
NCBI nr blastx	gi\|158297887	6e-77	33.80%	AGAP004774-PA [Anopheles gambiae str. PEST]

Group
KEGG pathway
InterPro domain	[448-566] IPR008957	8.9e-11	Fibronectin type III domain
Orthology group	MCL22167		Insect specific

Nucleotide sequence:

>DPOGS204414-TA
ATGGAGTCGGACTCTGCTCTTCACGGTGATGTTCCCGATGGCGCGGAAATGTCCCCTTTAGAAGAAAACCCAACAGAGAGTTTAGAAGAAAATGGTGATAACAATGGAGCAATTGAGGAATCGGAATCCGCAGCTACAGAAGAAGACGCAGCAACAAATGGTGGTGCTCCAACTAGTAGCAGTGATGTTTTGGATCTAGAACCTGCTGGACAAGCTGTAGAACATGAAGAGCCCCTTCCGCATCAAGCTAATGCTGAAGCTGAAGAAGAAATGGACATCGATGAAACTACCCCGGGAACTGTTGATGAATCAGCATATATCGGAGACAATTGCTTATCTACTCCGGCGGAAACTGAAGACAATTCACCACAAGAGGAGCACTCGTTACTTAAGGATCACATGTTAGAAGGCGAGGGTGATGGAGAGGGTCTTGAAGGAGCCCAGGAGGAGTCTCCCGACCAATCTATCAGTTCGGCTTTACCTATTGAAGGTGACGGAGCCCCTATCATACAGGATGAAGAATCCAGTACAATGGATGAAGATATGGGCGGTGGCGAGGGTGTAGCCAGCAGTGACGATGTCAATGACATAAGCAGTGCTGCAGCAGAAGTTCTAAGCACCGGCATCAGTTCAAGTACCCAAGAAGGTGCAGACATTACAAGCAGTGGGCAAACTGAGGCGGCCCTGATATCATCTACGGCTAACGGCCCTGCATTACTGCATTCCTTCTCTGTACTGCCTCAACAGCAGCAAGCTAATGAATTCAGTGATGCTGATACATCTGAGATGGAAGGTGCCGCGGACACAATGCCCTCAGTCAGTGAGTCAATGCCATTGCTCACTATGACGGCTAATGGATCAGCAATACTTTCACCAAATTTACTCCAAGGTGATGAAAGTGGAGCTGGTGTGTCCTCGTCGGTGGCGGGACTCAGTTCTGAGAGCGGTGCCGGCGAGGGTGAAGGCGCTGTGAGCAGTTCCGGCGCCGCTCAATCCGCCAAAGGCGCCCCACCCCTACCGCCCACAGACGCCGCACATGCGCTCGCTACTCTCGCTAGTGCAGCGCTGCATCACCAACATGAACAGAATGAACCAGAAGACCAGAAGCCACAAAACGATGAGGATGTCTGGTACACGGTGGGCTTTGTTAAAGGAACCACATTCACAGTACAAAATTACATATCCGATGCAAACGTGGATCTGTCGAGTCTCTCCTTGGACAGTCTACCTGACCTGTCCAATTTACCGACCACCCCGCTGGAACACGGCACGGCATATAAGTTTAGAATTGCTGCCATCAACTCGTGCGGGAAAGGAGAATTCAGTGAAGAGGCGGCGTTCAAGACCTGCCTGCCAGGTTTCCCGGGAGCGCCGTCCGCCATCAAGATATCCAAGTCGGTGGAAGGCGCTCACCTCTCATGGGAGCCGCCGCAAGTCGCCGCTGATGGAATCTTTGAGTACTCAGTATACCTGGCTGTGCGATCTAATCCACAACCAAAGGAGGCCTCTAAGTCTCAGTTGGCGTTCGTGCGCGTGTACTGCGGCAAGGCGAACACGTGTGTGGTGGGTCAGGCTTCGCTGGGCGCGGCGCACGTGGACTCCTCCACCAAGCCCGCCATCATCTTCAGGATCGCGGCCAGGAACGACAAGGGATACGGACCAGCCACTCAGGTCAGGTGGCTTCAGGATATAAAATCTACGGGAGTGAAGAGAGCCGGTGAAGGCCGGCTGCCAGGCGCCTCGCCTTCAAAGCAACCAAAACAACTGCTGTACTAA

Protein sequence:

>DPOGS204414-PA
MESDSALHGDVPDGAEMSPLEENPTESLEENGDNNGAIEESESAATEEDAATNGGAPTSSSDVLDLEPAGQAVEHEEPLPHQANAEAEEEMDIDETTPGTVDESAYIGDNCLSTPAETEDNSPQEEHSLLKDHMLEGEGDGEGLEGAQEESPDQSISSALPIEGDGAPIIQDEESSTMDEDMGGGEGVASSDDVNDISSAAAEVLSTGISSSTQEGADITSSGQTEAALISSTANGPALLHSFSVLPQQQQANEFSDADTSEMEGAADTMPSVSESMPLLTMTANGSAILSPNLLQGDESGAGVSSSVAGLSSESGAGEGEGAVSSSGAAQSAKGAPPLPPTDAAHALATLASAALHHQHEQNEPEDQKPQNDEDVWYTVGFVKGTTFTVQNYISDANVDLSSLSLDSLPDLSNLPTTPLEHGTAYKFRIAAINSCGKGEFSEEAAFKTCLPGFPGAPSAIKISKSVEGAHLSWEPPQVAADGIFEYSVYLAVRSNPQPKEASKSQLAFVRVYCGKANTCVVGQASLGAAHVDSSTKPAIIFRIAARNDKGYGPATQVRWLQDIKSTGVKRAGEGRLPGASPSKQPKQLLY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: