MonarchBase - Protein-coding gene

DPOGS210829
Transcript	DPOGS210829-TA	2115 bp
Protein	DPOGS210829-PA	704 aa
Genomic position	DPSCF300027 - 231385-233795
RNAseq coverage	101x (Rank: top 61%)

Annotation
*Heliconius*	HMEL017684	1e-126	42.48%
*Bombyx*	BGIBMGA014395-TA	2e-125	42.61%
*Drosophila*			%
EBI UniRef50	UniRef50_UPI000192758B	3e-77	36.59%	UPI000192758B related cluster n=2 Tax=unknown RepID=UPI000192758B
NCBI RefSeq	XP_002166180.1	1e-154	43.21%	PREDICTED: similar to predicted protein [Hydra magnipapillata]
NCBI nr blastp	gi\|221125676	3e-153	43.21%	PREDICTED: similar to predicted protein [Hydra magnipapillata]
NCBI nr blastx	gi\|221125676	7e-149	43.27%	PREDICTED: similar to predicted protein [Hydra magnipapillata]

Group
KEGG pathway
Orthology group	MCL18525		Insect specific

Nucleotide sequence:

>DPOGS210829-TA
ATGAAACGTGGTCGAGCGGATTCAGTCACATGTTTGCGGACAAGTGATATGGCAAACCAAATGCGTAAAGATTTCATAAAATTATCTGAAATGGGTGAAGAGGAGATCTGGCAATTGCTAGATAATATTCCTACTGATGATGAAGGGACAGACGATGACAACGATGACGACGTTGATAGCGATCAAGGCGCCCCAAATCTTGATTTCATGCATACTGAAGATGAATTGGAACCACTCACTGACGAATCTCAGAAAACGGAAATACCTACTAATACAACAGAATCGGGCAGTGCAGTGTCAACAATTTGTCCGATTGTTCCAGAGCAACTTGATCAAAATGAAGAAATAATTTCGCTTATGCCTGACCACACAGAAGAAATTGCTGTACAGGAATCCGCGAAACCCTATCGACGCCGCAAACGTCCTCGTACCCCGGAGCCAACAGAAGAAGAAGACGGTCCCGTTGTTCAAGCTCTCGGTGTAGTGGATGATGTTGCAGACATGAAAAATGATTCTCCACAATTCAAATCTATTGTTTGGAAAAAAAAGAATCTTCACCTTCATGTAAATGAAGTGGTTTTTAGAGGTCAAAAAGAATTACCGGAGACGATTACCAGATTGGACACACCTTATAAATGTTTCCGTTACTTTATGAACGACGCCCTGTTTGACCATCTTGTTGAACAATCAAATTTGTATGCAAGGCAAAAGAACATAAGAACAAACTTCAGTGTCCAATCCGTTGATTTGCGAAAATTTGTTGGCATTCTATTGTATATGTCGGTTTATCGCTATCCAAATGTGCGATCATATTGGGGAAATAATTCCTTTGAGGCAATTCGCCAAACAATGCCCGTTTTGCGATTTGAAGCAATACGCCGGTACCTCCATTATAACGACAATGCAGCAGTAGTTACACGAGGTGACCCAGGATATGACCGTCTTTATAAAGTTCGTCCCTTGGTAAAACATTTCAATGAAAGATTTCTATCAGTGCCCATGCCTTCTAGGCTGTGCGTAGATGAACAAATGTGTGCCACAAAAATGACGGGATCCCATTTGCGCCAATATATGCCCAATAAGCCACATAAGTGGGGCTTCAAATTTTTTTGTCTTTGTGATACTTCCGGATTTTCGTACTCTTTCGAAGTATACACTGGTGCCGGAGATAACGTGATTTTTGATGGTATGCCAGATCTTGGGGCTGCGTCAAATGTTGTAGTTCGCTTGTCAAAACAAATACCAAATTTCGTAAATCACATCCTATACTTCGATAATTTCTACACGTCCCTTGGCCTGCTTACGTATCTCCGAAGTAGAGGAATTTACAGTTTGGGAACTGTGCGAGTAAACAGAGTACCCAACTGTAAATTGTCTAGCGATGCAATTTTGCAACAGAAAAAGGTTGATCGTGGTTACTCAGAAGAGTTTGTAGGTACTGCATATGGTATTGATATATCCTCTGTGCTATGGAATGATACGAAAACTGTGCGCCTATTGTCTACCTACGTTGGAGTAAAACCATTTGCGTCTAAAAACATAAACAAACAGATTTCAAAAGTAACACGTTGGGATAGAAAAAAGAAAACCCACTATGACATTGACTGTCCACAAATCATCAAAGAATATAATCGGCATATGGGGGGTGTCGATTTGATGGATGGCTTATTAGGCCGTTATCATATTCGTATGAAAACCCGGAAATGGACCAACCGAATTTTTTATCATATGGTCGACGTGGCAATGGTGAATGCTTATATACTTTATCATCGGTTGCATCCCCATGCAGATAAAATTGAGTTGCCAACGTTCAGAACACAAGTCGCAGAATCACTCTGCGTGTGCGGCACTATTCCAGTAAAACGAAGCGTTGGCCGACCATCCAATACGACACCGCCACCAAAGATACCAACAGCGAAACGAGCCTATCTGCCAACCGATGATATTCGTTATGACCAAATTGGCCACTGGTGCGTTTTTAGGGATCGGTCTGGCAAGAAGCAGTGCAAATACCCTAAATGTAAATCGGAAACTCAAGCATACTGCACTAAATGCAATCTATCTTTGTGCAGTTCAACAACAAAGACATGCTTTTATGATTTTCATAACAAATAG

Protein sequence:

>DPOGS210829-PA
MKRGRADSVTCLRTSDMANQMRKDFIKLSEMGEEEIWQLLDNIPTDDEGTDDDNDDDVDSDQGAPNLDFMHTEDELEPLTDESQKTEIPTNTTESGSAVSTICPIVPEQLDQNEEIISLMPDHTEEIAVQESAKPYRRRKRPRTPEPTEEEDGPVVQALGVVDDVADMKNDSPQFKSIVWKKKNLHLHVNEVVFRGQKELPETITRLDTPYKCFRYFMNDALFDHLVEQSNLYARQKNIRTNFSVQSVDLRKFVGILLYMSVYRYPNVRSYWGNNSFEAIRQTMPVLRFEAIRRYLHYNDNAAVVTRGDPGYDRLYKVRPLVKHFNERFLSVPMPSRLCVDEQMCATKMTGSHLRQYMPNKPHKWGFKFFCLCDTSGFSYSFEVYTGAGDNVIFDGMPDLGAASNVVVRLSKQIPNFVNHILYFDNFYTSLGLLTYLRSRGIYSLGTVRVNRVPNCKLSSDAILQQKKVDRGYSEEFVGTAYGIDISSVLWNDTKTVRLLSTYVGVKPFASKNINKQISKVTRWDRKKKTHYDIDCPQIIKEYNRHMGGVDLMDGLLGRYHIRMKTRKWTNRIFYHMVDVAMVNAYILYHRLHPHADKIELPTFRTQVAESLCVCGTIPVKRSVGRPSNTTPPPKIPTAKRAYLPTDDIRYDQIGHWCVFRDRSGKKQCKYPKCKSETQAYCTKCNLSLCSSTTKTCFYDFHNK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: