MonarchBase - Protein-coding gene

DPOGS210653
Transcript	DPOGS210653-TA	2295 bp
Protein	DPOGS210653-PA	764 aa
Genomic position	DPSCF300401 + 75916-89653
RNAseq coverage	175x (Rank: top 50%)

Annotation
*Heliconius*	HMEL010796	0.0	65.58%
*Bombyx*	BGIBMGA001798-TA	0.0	57.48%
*Drosophila*	CG31900-PA	3e-37	34.53%
EBI UniRef50	UniRef50_Q7QBZ9	3e-49	28.94%	AGAP002382-PA n=1 Tax=Anopheles gambiae RepID=Q7QBZ9_ANOGA
NCBI RefSeq	XP_001844278.1	3e-47	42.14%	conserved hypothetical protein [Culex quinquefasciatus]
NCBI nr blastp	gi\|347967744	1e-48	28.94%	AGAP002382-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|312377090	3e-57	27.85%	hypothetical protein AND_11738 [Anopheles darlingi]

Group
KEGG pathway
Orthology group	MCL19956		Insect specific

Nucleotide sequence:

>DPOGS210653-TA
ATGAACCGCAGCACGACACTCAAATCCTGGCTCGAAGACTCCTGGCTGAGGCCACCAGCCGGCATTCTGGTGCCGCTGAGGCCCTTGGCGCTGAATCGGGCTTTGGGCGTTTGGAACGATTTGGCCAATGAAGGCTTAAATTTGACAGACATCGTCATAGTCGGCTATGACTCCAATGGCGTTAATTGGAGATCCAGGCACAACCTCCAAACGTCCAGCGGAACTAATGGAGATAGGGCTGTCGGGGACGCTTTGTCTAAACTGTTATTGAATTACCAGGACGTTTACACTGATAGTTCGAACGACGGCACGATGAGGGCATTGGCTTCCGCTGCGAAACTTGTGCCGTATGACAGTGCTCTGTTCCTGGTGACTGACAAAGGAGCTGGTGACCCTCAGAGACTGCCTCTAGCTTTGAGGGCGTTAGTGGAGAAAAGGTTGAAGGTGTACACTATATGGACGGATCCCAGTCATCCATCAGTTGAGTCAGAGCTGGCACTGCAGGACTTGAGGAACATCTCCTCGCACACGGAAGGCGAAGTGTTGGCCTATTCATTACAAGTTATAGATGAAGACAACTCCAATCTGGCCTCAGAAGTTGAACTCCAACCATGGGAGCCAGTTTCATCTAATCAAGCCAGACGAGCTAGGATCAATAACCATCCGGATGTGGAAAACTTTGATACTCTATTGGTGAGACGTGGTAGAGCTGAAGCCCTTACCTTGGGAATACCAGTTGAAACAGGAGTGACAGCACTCCGTCTTCTGCTGGAAGGGGCGATTGATCACGCCGTATTATACCCACCCAACGATGGTCCTCAGATTGACCTGTACAATGAGACGTCAGTGAAGATGTATTCAGAATCGTCGACTATTGAGAGCATATCGCCACAGGAAGTCTATATCGTTGTCCCAGGATGGAAACTGTATGTAGACATGCTGTCAGTGTTGCCGGTGATGTCGGCGGGTGAGGACGTCGCTATGACCGGCATGTGGCACCTGAGTGTCAGGTGTGACACTTGCGATTACAGACTAACAGTCAGCGCTAGATCACACATACATTTCGACGTTGAATTCGATACTGAAGATTCGTTGAACATCAAAGTCACTGGGAATGTTGCTAGTGTGAGAGACTCCTCTGTTGTCGACGAGTATGGAGCGACTATCGAAAAACTATCATTCAGCTATCAACCATCAACGGAGGCTTTCGAAAACAAAATGGCGGATATCTTTACCAGTGTCCCAGTGAGAAATGTCTCGGGAAACAGGGCCTATGTCAAAATAGCGGGAAGAGATTTCAAAGGCGAAACTTTCGCACGAGTCGCTGGACCTATACACGGTGAATCTGAAGTGAGAATGGGAAGATCGGCTGCCATCGTCTTCCCAGAGAGCATCAACGATCTAGAGGTGGCTGAGGAGATGAACTCTAAGACGTATAACGAGAAAATACAGAATGAGAGCGATGTGCTGTTCCAGTCTGAGGTGCAATTACAACGTAATCCCGCTATGACAGCTGTTCAAATCGGTCTGAGTTCAAGACTTTACGGCTCTCCGGAAAGCAGATTACAGCTTCATTTCGAAGTCACTAACTTGAGGGATACATCCGTGTTCTATCGTTTCGGTGCTGCTGGTGAACTGAGGTTCTTGACCGGAATTAATCCAGAAACTCAAACAGTGGCTGCTGGTCAAACCGTCAACGTCATAGTCAGCTTATTGATAGCAAGCAACGCTCAGGTCGGAGCCAGGGACCTCATCAAATTCACCGCTTATGGTCAATCCGAACAAGTATCCCTATCTTCGTACGTGTACGTGGTGAGCAGCGGAGACAACATCAGAGACCTCACTCCGCCCGATGTCAGACATAACTTCCAAGGCACATGCCTAGGCAGACTGGGGAGCGACTGTGCTGAACACGTCTGGTCTACATCTGTGATCGCCAGAGACGCCATGGGAGGTCTTCTTCGGCTATCATCAACGCCAGCAGGTATATCCTACAACGCTGGCTTCATATCAGGTTCCAGGGATGAGATCATAGCCACGTACAGAGCCAACTGCTGCGCCCCGAGGGTTGTTGTAAATGCGGTAGACGCTTTTGGGAACACCAACACTTATACCATTGACATATCAAATTACATTAATGAAGCAACGATAGCCGCTATAGCCCTAGGTGTTATATTAATATTAATTTTAATATTTCTTATAATAATACTGACGTACTTCTGCGTAAAGAGAAGGAAGGAGTCCAGAGAGCTACCGACCTACTCAACTTCCAGATCATCGAGAAACATTACTTGA

Protein sequence:

>DPOGS210653-PA
MNRSTTLKSWLEDSWLRPPAGILVPLRPLALNRALGVWNDLANEGLNLTDIVIVGYDSNGVNWRSRHNLQTSSGTNGDRAVGDALSKLLLNYQDVYTDSSNDGTMRALASAAKLVPYDSALFLVTDKGAGDPQRLPLALRALVEKRLKVYTIWTDPSHPSVESELALQDLRNISSHTEGEVLAYSLQVIDEDNSNLASEVELQPWEPVSSNQARRARINNHPDVENFDTLLVRRGRAEALTLGIPVETGVTALRLLLEGAIDHAVLYPPNDGPQIDLYNETSVKMYSESSTIESISPQEVYIVVPGWKLYVDMLSVLPVMSAGEDVAMTGMWHLSVRCDTCDYRLTVSARSHIHFDVEFDTEDSLNIKVTGNVASVRDSSVVDEYGATIEKLSFSYQPSTEAFENKMADIFTSVPVRNVSGNRAYVKIAGRDFKGETFARVAGPIHGESEVRMGRSAAIVFPESINDLEVAEEMNSKTYNEKIQNESDVLFQSEVQLQRNPAMTAVQIGLSSRLYGSPESRLQLHFEVTNLRDTSVFYRFGAAGELRFLTGINPETQTVAAGQTVNVIVSLLIASNAQVGARDLIKFTAYGQSEQVSLSSYVYVVSSGDNIRDLTPPDVRHNFQGTCLGRLGSDCAEHVWSTSVIARDAMGGLLRLSSTPAGISYNAGFISGSRDEIIATYRANCCAPRVVVNAVDAFGNTNTYTIDISNYINEATIAAIALGVILILILIFLIIILTYFCVKRRKESRELPTYSTSRSSRNIT-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: