MonarchBase - Protein-coding gene

DPOGS208372
Transcript	DPOGS208372-TA	5322 bp
Protein	DPOGS208372-PA	1773 aa
Genomic position	DPSCF300146 + 50537-57561
RNAseq coverage	1773x (Rank: top 7%)

Annotation
*Heliconius*	HMEL007233	0.0	64.14%
*Bombyx*	BGIBMGA012360-TA	0.0	57.69%
*Drosophila*	CG43078-PH	2e-26	27.23%
EBI UniRef50	UniRef50_D6WEE6	1e-36	30.83%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6WEE6_TRICA
NCBI RefSeq	XP_972005.1	3e-37	30.83%	PREDICTED: similar to AGAP005739-PA [Tribolium castaneum]
NCBI nr blastp	gi\|270003910	3e-36	30.83%	hypothetical protein TcasGA2_TC003200 [Tribolium castaneum]
NCBI nr blastx	gi\|270003910	4e-104	28.41%	hypothetical protein TcasGA2_TC003200 [Tribolium castaneum]

Group
KEGG pathway
Orthology group	MCL20554		Insect specific

Nucleotide sequence:

>DPOGS208372-TA
ATGGAATCTCAATTGTCAGCAGATGAGAATAAAAATTCTCCATTGCCTATTATAACACATGAATGGGAGGATTTAAGAAAAGCTCGTGAGGCAGGCGGCTATCCTTGGACTCACCTTTTGAAAGCACCTTTAGAAGGAGAAATTACTGCAGAAGACATTATAAGATCTACTTCTCCAAGAAGAAGCATGTCTCGAGAATTTTCTAAATCTCGAACTCATTCACCAGTTGATGAAACAGTCCAAAAAATTCTTAATCTTGACTCATCACCAGGTAGTAGCCGAAAACATGGTGAAGAAGGTGAAGATGAAGGAGTGCATATACCAAATTTTTCAAAAGAAATTTCATTGGACTCAGACGAAGATGTTGTTAACCAAGCACTGGCTACAAAACAGTTAGAAAACCAAAATACTCAACATTTGATATCGCCACCAACGGAAATTCCAAAAAATGTCTCACCAAAAAGTATTCTTAAAAGAAGGACACCAGAACCACAATACTTTGGGAGTACTGAGACACGTGAAAAAACAAAATGTTGTCACCCGTTAGTTAATAAACTTAAACACTTAGCTGACAAAACGTTACACAAGTTAGAAAGAAACGATCATGAAAAATCTCCCCAAACAAAAAGAAAAAAAGCTGAAGAGCCTCAAGAAATAAGACAACTCAAAAACTCTCCTAGCGCTATTCGAAGACAAAAATTTAGTGCTATAAAATTGGGAGACTCAGATGAAATGAGCAGAAATATGAGCATAGATATCCCAACGCCTCTGAAAAAAAAAGAACACATATACGAAGATATAGAAGAATCAAAAGAGTTTGATAATGTAAAATCATTACAGGATCCTCCGGATATTGATAACGATGATTTAAAAACAAGTTCAAATAAAGAAAACGACAGTCTTCAAGATAAAAAGTCGAATACATCTCAGGATCCTAGTTTAATAATTGAAGACAATGCTTCACTAGACGCTAATGAACATGTGATGGAAAAACTTCACCAGAGAAGTAGTATTAGTAAAGAAGTTGTAATGTTAGACGAAGAAATAGTTCCAGCAGAGTCAAACACAGAACTAATGTACAAATCGGAAAACGATATTAGAAAAAACAATGAATCTCCAAATATTACCATTACAGAAATAAATGATGATGACATCACCATAGAACCGTCTTCTTCGATACCTATAGAATCATCTCCAAGTCCCAGTCCTCGTGTTATTGATAGTAAACAAGACTTCATGGATACAGACTGGTCTAGACCCAACAGGCCTACTAGAGAAGGCAGTGTTCAATTATATACACCAGAAGTACGTTGTGCATGTCAGTTTTTCCAATGTGATTCCCTATTACCGGAAAGAATAAATCCCGTGGGCACTAGACCAACTTCTCGAGCTAGTAATATTATTCAAAATATTAGTGATCACGAATACGAAATTATAGAAAAACCTCCCCCAAATATAATTTATACGGCACCAAGTATCGACAATAAACCCAACATGGTGGTAACGGACGACGATGAATTATCAAGTATCTCGTCACTGGAAAAAAAATACCTTCATCATACATCCGACGAGGATGAGCCAATGGAGCATAAGGAACAAATTAATTGCGAAAAAGATGAAAATATTTCAAACGCTGAAGCATTACAAAAAGGCATTGAAGAACGCTTCTTTGTAAATACTCCCTCAACGACATCTAGAACTGAATGTGAAGTAAGTACCAGTCAAGTAGATTCTTCGGCCCTGGAAAATTTACCCTTAAAGAGAAGTAGTAGAAATAAAAATTCTGAAGGAATTGAGTCGAAAATACAGCAGCGTATAAAAGAAGGCACGGGAAAAATAAAAAGTCAAGCTGGAAAATTAAAAACAAAATTAAATACTATAAAAAACAAACAAATGCATTTTCCTGAAAGATCAAAAATAAAATTGCAAGAAAAACCAAAGCCTTCTAACGCTGATCGGTCGAAATCAACATTACCAGAAAAACGAAAGTTTAGTTTGCCTGACAGACCAAAATTTAAAAAGATTAATTTTTCTGAAAAACTATCGTTTGGTGATCGAAAGAAATTCAGTTTTCCGGAACGTCCCAAATTTAATATGCCTGATCTACCTAAGTTTAAAATGCCTGAGAGACCTAAAATAAACTTCCCAAGTCTTGGTAGGAAAAAAGTTGATATAAATAAGTCTGAATCTTCATCCGATTTACAAAATGTCTCCGTAGAGTTTGAAGCTAAAACATATCCGAGACTTTTTAATAGAAAGAAACAATATATTCCAAAAACCTCATCTTCACCGACGCTTAACAGAGAAGATACCCCACCAGCAACATTTACTTTTACTAGAGTAAAAAAGGCAACGGATAACCAAGAACCGTCACGTCATATCCCAGATAGTCCCGAAGAACCCCGAGAATACGGTAGTTTAGACAAGGAGTGCGAATATACCGATGACTACAAAATAGAAAACAGACAAAACTTTTGTACCACATACGACTTTGATAAAGTAGATCAAGTAGATCAAGAATTTGCAGATGAAACAAATAGTCATGATGAGTTAAGAATACAAGTTTCCGAATCAGATATATCACCGCCACTACAAGAAAACACACATATAAACGAATTAAACAATGACGAATTTTTTGTACGACCGAGAGGTATTTCTCGTGAAAATATACAAGTTAGAGAATACTTAAGCGACGAAATACGACAAGCATTTAAAATTCCCAAAAACGTGCTCGCTGATATGTCCAACGAAGACCAATTTAATAACAAAAATATATATGCCAACGATCCAGAAGACCACGACATAGCATTAGATGGCCAGCCTATCAGTTATTCCACTGAAGATATAAATGATAGAGATGATGGTTATTACACATTCCCGCCAGTACGACCTTCAAGAGCAAAACGAAAGAAAAAGGATGCTGAATCAATTAAATATATAGACGACAGTATAAATGCAAGCATGCAATTTAGCGAAGTTGATTTAGATCTAAGACCTACTACTGATCTTCATTCTATCCATGAATACGCCAATGATGATGTTATCGAATATCCTGATAGTATGCCAATCCAATCTCAAACCTTACCTATGCCACCACGAAGGAAGAAAAAATCTTTAAAAACTGGTATCAGAAATACCTCTTTAAATGATGTGAACATGTACCCAGCAGAGAGATGGCAATCAAAACACGATGGATGCGATGATATTATCGTCTACAGAACAGAACACGAGTACATTGTTCCACAAGCTGATTTATCCCAAGGTGATGTAACAGAACAAAGTCCATTACCACCGAGAAGAAATCGATCCAGAAGTTCAAGGACCACTTCTGTATGTGATGATGACCGTACATCACATGGTGCGGAATCGCTTATTCTCGATGCTCATATTTCAACAGCTGACAACGCTTTATCTGAAAGTGATATTCAGCGTGAAAGTCCAGGTTATGCAACTGTTGACAAAGGTAATTTTACGCCAAGTAAAGGTGCTAGACGGTCATTAAGCAAAACTCCACCAGCAAGACGCCGTAAGAGTAATAGTTCTGAAAGAAAATATTACACAGTCTCTAGTCAGAAAAGCAGAATGCCAGATCGACCGCCGAGAAAAAAATCCTCTACGAGTCTTATGACCCTTGACAGCTTCACAAAAGAATCTATAAATGGTGATCAGACCCAATATGTTGAAATAGACAGATCGAAAATGGAAGATTCACACAAAGACCTAAAATCGGGGGCAATCGTCAGTAAAATGAAAGACAGACCATTACCTCCACCTCCTCGTCCTCCCAGAGGACCAAAGCGTAAAAAACTCTCGCAAGAGGAAGAAAGCCAAAAATCAGCATTAAATTTATCAGATTATCTTGATGTAGTAGAAATTGAAGTTTCGACACAAACAGATCCTTTGCCAGATGATGTTGACTTCGAATTTGGAATAGATGACAATCTTGATTTGTCTATGTCTAGTTCCCTTAGAGACATAATTGATGAAGAATCAATATTAGGAAAGATTCATGACAAGTCAATTACATTAGAAGCGGATCGCCGTAGTTCTAGGCCAGCATCACGGTCTGAGAAGTCTCTAAAGTTGTCGGATCCTAAATTAGGGGAATTTTCTAAATCAAGCCTCGGTAAGACATCCCCTACTGTTATATTAGTGGAAAAACGGGTATCTAGCCCAACGAGAATAGACGAAAAAGAGGTAATATTAACAGAAGCATCATTGACTGTACAGCCTATTGATATTGATGATTCACAAGTACCAGATGTTCCGCCTTTACCAAAATCTAGAGACACTCTAACTTCAACTATAAAACCTAGAACTGAGCCTGAGATTCCTGAAAGTGAGAAAACTCTTGATAAAATTGCTGAAACTAACAAAGATATTTTGTTAGATAACTTAGTAACACAAAGACTTCAAGTTCGAGATTTAGACGTTGGTCGATTAAATGTTTCAGAACTGCAAGCATCAAAAATTCTTGTTTCCGATATTGAAGGCATGACTTTAAATGTTAACGAGTTAGACTCTAAGTCTGGTCATATTTCAATAACTGGAATAGAGTTCTCTCAATCTGTAATCGATGAAATTGTTAAGAAATTTACCGAAATGTCAACTTCTATTGTTCCTAACACTCAGATAGTAGACACCCAAAATATTGAGAGGCCAATTAGTAGGGAAGAGGAAACGCAAACAGATACTCCTTTACCTGATAAAAAACAAGAAAATATTATTTCAGAAGAGATTAAAATTGACTCATTACCATCCTCAACCGCCAGAAGTAGTGAATATATTGAGGAAATAACTGTCCCCCCACAACGACCTCCGCCTCCTGATTTGACGCCTTTATTATATTCCTATCTGCAGGATCTAACGATTACGTCATCATTACCTCATCAACAACCAATACTGCGGGAGAGGCATTACAGTGACTTTCATGAACCACAACTTCCTTCACCACAGCCACCAACACGTCGAGCTAAAAGAAAACCACCCGTTTTGCACAGCGAATCAAGTTCGGATGACGTAAAACCTCGACCGTCGCCCAGAAGAATGCCACCTCCAGCCCGAACTCAAGAACCAACGATAACTGAAGCTGGTGTCCAATTCTTACGGGTATGTCAGAATTCAATAAGCAGAACGTTTAGAAATATTGTGAACACATTTACGTCTTACATAAGCGGAACTCAAAATAAACATGATATGCAAGTCGCCATGGTTATATTCCTCGTGTTAATAGCTGGTTTAATAATGTTCGGACTCAGCGATAGCCGTACGATTCATCACCATCATTGGGAATTTTTTAATCCACCAGATAATAAGCAATAA

Protein sequence:

>DPOGS208372-PA
MESQLSADENKNSPLPIITHEWEDLRKAREAGGYPWTHLLKAPLEGEITAEDIIRSTSPRRSMSREFSKSRTHSPVDETVQKILNLDSSPGSSRKHGEEGEDEGVHIPNFSKEISLDSDEDVVNQALATKQLENQNTQHLISPPTEIPKNVSPKSILKRRTPEPQYFGSTETREKTKCCHPLVNKLKHLADKTLHKLERNDHEKSPQTKRKKAEEPQEIRQLKNSPSAIRRQKFSAIKLGDSDEMSRNMSIDIPTPLKKKEHIYEDIEESKEFDNVKSLQDPPDIDNDDLKTSSNKENDSLQDKKSNTSQDPSLIIEDNASLDANEHVMEKLHQRSSISKEVVMLDEEIVPAESNTELMYKSENDIRKNNESPNITITEINDDDITIEPSSSIPIESSPSPSPRVIDSKQDFMDTDWSRPNRPTREGSVQLYTPEVRCACQFFQCDSLLPERINPVGTRPTSRASNIIQNISDHEYEIIEKPPPNIIYTAPSIDNKPNMVVTDDDELSSISSLEKKYLHHTSDEDEPMEHKEQINCEKDENISNAEALQKGIEERFFVNTPSTTSRTECEVSTSQVDSSALENLPLKRSSRNKNSEGIESKIQQRIKEGTGKIKSQAGKLKTKLNTIKNKQMHFPERSKIKLQEKPKPSNADRSKSTLPEKRKFSLPDRPKFKKINFSEKLSFGDRKKFSFPERPKFNMPDLPKFKMPERPKINFPSLGRKKVDINKSESSSDLQNVSVEFEAKTYPRLFNRKKQYIPKTSSSPTLNREDTPPATFTFTRVKKATDNQEPSRHIPDSPEEPREYGSLDKECEYTDDYKIENRQNFCTTYDFDKVDQVDQEFADETNSHDELRIQVSESDISPPLQENTHINELNNDEFFVRPRGISRENIQVREYLSDEIRQAFKIPKNVLADMSNEDQFNNKNIYANDPEDHDIALDGQPISYSTEDINDRDDGYYTFPPVRPSRAKRKKKDAESIKYIDDSINASMQFSEVDLDLRPTTDLHSIHEYANDDVIEYPDSMPIQSQTLPMPPRRKKKSLKTGIRNTSLNDVNMYPAERWQSKHDGCDDIIVYRTEHEYIVPQADLSQGDVTEQSPLPPRRNRSRSSRTTSVCDDDRTSHGAESLILDAHISTADNALSESDIQRESPGYATVDKGNFTPSKGARRSLSKTPPARRRKSNSSERKYYTVSSQKSRMPDRPPRKKSSTSLMTLDSFTKESINGDQTQYVEIDRSKMEDSHKDLKSGAIVSKMKDRPLPPPPRPPRGPKRKKLSQEEESQKSALNLSDYLDVVEIEVSTQTDPLPDDVDFEFGIDDNLDLSMSSSLRDIIDEESILGKIHDKSITLEADRRSSRPASRSEKSLKLSDPKLGEFSKSSLGKTSPTVILVEKRVSSPTRIDEKEVILTEASLTVQPIDIDDSQVPDVPPLPKSRDTLTSTIKPRTEPEIPESEKTLDKIAETNKDILLDNLVTQRLQVRDLDVGRLNVSELQASKILVSDIEGMTLNVNELDSKSGHISITGIEFSQSVIDEIVKKFTEMSTSIVPNTQIVDTQNIERPISREEETQTDTPLPDKKQENIISEEIKIDSLPSSTARSSEYIEEITVPPQRPPPPDLTPLLYSYLQDLTITSSLPHQQPILRERHYSDFHEPQLPSPQPPTRRAKRKPPVLHSESSSDDVKPRPSPRRMPPPARTQEPTITEAGVQFLRVCQNSISRTFRNIVNTFTSYISGTQNKHDMQVAMVIFLVLIAGLIMFGLSDSRTIHHHHWEFFNPPDNKQ-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: