MonarchBase - Protein-coding gene

DPOGS207536
Transcript	DPOGS207536-TA	3699 bp
Protein	DPOGS207536-PA	1232 aa
Genomic position	DPSCF300177 + 665495-674316
RNAseq coverage	47x (Rank: top 71%)

Annotation
*Heliconius*	HMEL021789	0.0	64.07%
*Bombyx*	BGIBMGA001900-TA	0.0	57.69%
*Drosophila*	sha-PB	2e-102	39.08%
EBI UniRef50	UniRef50_UPI0000D56B09	2e-121	44.68%	UPI0000D56B09 related cluster n=1 Tax=unknown RepID=UPI0000D56B09
NCBI RefSeq	XP_394811.3	5e-127	32.20%	PREDICTED: similar to shavenoid CG13209-PA [Apis mellifera]
NCBI nr blastp	gi\|383849001	1e-127	34.59%	PREDICTED: uncharacterized protein LOC100880665 [Megachile rotundata]
NCBI nr blastx	gi\|91087787	3e-177	36.91%	PREDICTED: similar to shavenoid CG13209-PA [Tribolium castaneum]

Group
KEGG pathway
Orthology group	MCL18982		Insect specific

Nucleotide sequence:

>DPOGS207536-TA
ATGGCCCTGCTGCTGTTGCTGGTGGCAGTCGCGGGCGCAACGAGCCTCGGAGACCTGACGAGAAAGGATTCCGGAGACGTCTTCACTATACTTGATGGTGAATGTGGTGCTGCAAGATGCGCGGAGCACGGAGCTGGAAAAGGCGTAGAAGACCTCGAGTGCTCCTGCGCGTGTCCCCAACGAGCTCCCCTGTTCAGAGAGGACAGGGAATTGTGTGTTGACGACCTACCAGAATGCTCCCTCGCAACTTTCGGCACTGGTCTTGGCACGCAGAGGATACCCTTCGTTTATCTCCCATTGAAGGGTCAAATAATCCATCCATCCAGAGAAATTACTTTTCAAAATGTCAAGACTCCAATATGCGCAGTTTCGGGAGCACAGTTTTTAACACGAAAGGGATTCCTCGATCTTAGGAATACACTTGACGCTGATGTTCCGTTTAATTTATTCCGTGATGAAGGCAGAACATTTCTTCAGTGGAGTGGGGAGGACGAAGTGCGCAAGCGCATGTCAGGTCGTATGATGGTGGTCAGGCTGCTGTGTCGTGATATATCCGCCGCAGCGTCTTCGCCGCTCGACCTTCGTGGAGTATTCACGCCATGCGTTGCCTTCAGAGTCCAGGGAACACCGCCTCGACATTCCAATAATATAACCGAAGTTCAGTTTGCACCAAACGTACAGACATCAGAAGGCTCAACAGCGACTGGTTTAACTGTATCAGAATATATAGCCATTGGTATCAGTTCCTTGCTTTTAGGTTTAATTTATGTGGCATCTGTATTTTTATATCTACACATTAAAAAGAAAAGGAATTCAACGGCAAAAGAGAACGGCTTAAGAAAACTTAAAGGACTGAAAAAGGATGGCTTGACTATAACGGAACGTGATATAATAAGGATAAACAATGAACGTATACAATCCCTGCCAAATGTTATGGGTCAAGATGATGGTGTTGTCAAAAAAAATCCACTATTGAGTGTAGGACGGCAGTTTGATAACAAAACGTTTCCTAGTGATCTCTCTGATTCAGATGATTTTGCGGACACTTTGCGCAAGGATGATAATTCCTGCCATAATCAACTAACATCAGTAGTAATACACAGACATATAGACTTGAAATGTGATAATGTAGATCATCACAGAGAAGAGAGCATTGAAAGATTACCAGACGAACATGTCAGCATTGTAGAAACTATAGATGATAGAGAAATAACGCGACCGGTTGGAACCACACGCCGGAAACTTTACTTCAACCCAGCATACTTTGAACCACAATTAATGGCTGATCCCCCTCCTGCAGCTATTGAGTTTCTCTCAAAAATTCGAGAAGTAATATCAATCGCTAAGCAAAAGATGGCAGCAAAACGTTTTCATCCAGTGCTAAACGAAATACCAGAAGAAGAAACATATCCTTCAAACGCAAACAGCATAGATATGTACCACGGCGTGGGGAGCCAACGTAGCGGTAGCCTTGTTAGTTTGAAAAGAGAAAATAGCAGGAAAAGATCAACAAATTGTATGGGTTGCCCAGGATGTAAAAGCAATGTAAGCAATGATATTCAAAATCTTGTTAAACAAAACGTTACAAAATCATGCACTAATTGCTTCAATGAGAAAGGAGAGAAACAAAACAGTATTCGGAAGTGGCTTGAAAACATCCCAAATGTTAAAAACTCACTTTTCTTCAACGATAGCGACGCTCCAAACAATTTAACGCATTCACTGCATGCTTTACCTAGCGAGGGAAGCCAATGTAAACTACAAAAACAAAATAGCTTCTCCCATGTGACGCACTCAACAGACAACCTCACGTCACACAGATCCACATCCCGGTCTGTGAGATCTGAGCCATCATTAAGAAACTATAATATACCTTTACCAGAATTTAATAGCGAAACCACTGAAAATAATAACTACCTAACTATGTCTCGAATAAATGAATTAAAAAATATAGAATTAAACGAAAGAGCGTTTGACGTACAAAATGAAAGAGAAGTCTCGAGACAAAACATGCAGACATTGAAAAATAAAAGTGGTTTACCCGACATGGTCAACGAGGCTATAGCGCTTGACCATTTTTCAAAATCTCTATATAATACCAGCAGTTCAGATGAGGAGAGATGTTCTAGAAATGCGCCAGAAAAAAGCAATTCAGATAGTCCTTCTGGAAACGAATATGAAACTGATAGTCTTGAGAGGTCGTCTCATAAGAGGAACAAAACTACGACCCTTGATTATCTTGAAGTACCGTCATCCCAAGCTTCTCCGAGTTTAAGTACTGCTCTGCCGTTAGAAGAAGAACTAACTATGAGAAACGCTGTTTACAAGACGCCCTCTAGTGGTAACAGTAATACTCCGTCGCCCGAAGCACATATTGGCATAGAAGAGAATCACTATGAGACTATAGACGTTAAGAAAACTGACAATATCCAAGAAACGATAGACATTACGGTTAAGCCTAGTAATAGTTACAGTTTAGTAAGCGAAGTATACGTTAATAATAATTACAATTTTGGTAGTGCGCCTACTTCACCTAGTGGTTCGGAGTCTTCGATGGGTAACAGAAAATTGATTCAATTTAACAATTCTGTAGCAAAACCTGGATGTTTAACCATAGAATTAAAAGATCCCCCTGAAAATTATATCAAAATTCACGAGTCGGATGGCTTTGAACCAGACACTTTGGACCGTAAGCATCTTAAACATAAAGAAAGTGTAGAGAGTATTCAATTAGATCGACAAGACTTCCTAACCGACTGCGACAATTCCGTAAAAAGAGACAAAAAAATTAAACTAGGAAGCAGCGAAACTTTCTGTAAAAATAACGGACAAAAAGAGAATAGTAACAAATTTAACAGTTTAAGAAATGACCACGAGCATGGCTTTGATCGAACTAAGTTGTCGCCTATTTTGTACAGTGGTTCAAAGTCTCTTGACACTGCAACTGATGACACATGGGATGATAACGCAGGTTGGAGTTCTGAGGAAGGCAGAATATTAACATTAGAGCTTAGACACTCGAAGCGACAACGACAATCCACGCCACCGTCTATAAAGCAAATGAAAAATTTGGCTCGACCTGATATTTTGCCTCCCCTACCGCCAACTGAGGACACCCCTATATACGAAAAGCCGACAATCCCGCCAAAGAGGGTTCCATATGGAAGCCCAGTACCACAAACCATCACTGAAAAACGACAAATATTTCCGCGTAATTCAATATCTTGTAGCTCATTAAAAATTGCAGAAACCGATGATATGAATAGTATAAAATTGTGCGAAAATGATCAAAGATCAGAAAGTGGTCGTAACTGTAGGAGAGCATCAAGCAGTTGTAGCAGCGTTGTAAATACAAACACATTCATTAAAGGACAAAAAGCCGAGAGTATTAGAACAAAATTACGTCGCAGAAAAGGTTCCAACATAGAAGATTCCGGATATCTCAGCAGTGATTCCACGTGTTCAAAACAGTTTCAAAGGAAAATAGTAATAGCGAAAATTGACAGTTGTAGTGACAGTGACGAAACAGAAGACGAAGCTAGAAGTGAATCAGGTGCAGAAAGTGTTGAAACACATTCCGTATATTTTGGTAATTGTCCTAGATTACGTAAAAATGAGGAGAGCATCAAAAACACAATAAAAACCACAAGGGACAGCAAACGCAAAGTTATAGTTAATAATGATGTAAATAATGAATAA

Protein sequence:

>DPOGS207536-PA
MALLLLLVAVAGATSLGDLTRKDSGDVFTILDGECGAARCAEHGAGKGVEDLECSCACPQRAPLFREDRELCVDDLPECSLATFGTGLGTQRIPFVYLPLKGQIIHPSREITFQNVKTPICAVSGAQFLTRKGFLDLRNTLDADVPFNLFRDEGRTFLQWSGEDEVRKRMSGRMMVVRLLCRDISAAASSPLDLRGVFTPCVAFRVQGTPPRHSNNITEVQFAPNVQTSEGSTATGLTVSEYIAIGISSLLLGLIYVASVFLYLHIKKKRNSTAKENGLRKLKGLKKDGLTITERDIIRINNERIQSLPNVMGQDDGVVKKNPLLSVGRQFDNKTFPSDLSDSDDFADTLRKDDNSCHNQLTSVVIHRHIDLKCDNVDHHREESIERLPDEHVSIVETIDDREITRPVGTTRRKLYFNPAYFEPQLMADPPPAAIEFLSKIREVISIAKQKMAAKRFHPVLNEIPEEETYPSNANSIDMYHGVGSQRSGSLVSLKRENSRKRSTNCMGCPGCKSNVSNDIQNLVKQNVTKSCTNCFNEKGEKQNSIRKWLENIPNVKNSLFFNDSDAPNNLTHSLHALPSEGSQCKLQKQNSFSHVTHSTDNLTSHRSTSRSVRSEPSLRNYNIPLPEFNSETTENNNYLTMSRINELKNIELNERAFDVQNEREVSRQNMQTLKNKSGLPDMVNEAIALDHFSKSLYNTSSSDEERCSRNAPEKSNSDSPSGNEYETDSLERSSHKRNKTTTLDYLEVPSSQASPSLSTALPLEEELTMRNAVYKTPSSGNSNTPSPEAHIGIEENHYETIDVKKTDNIQETIDITVKPSNSYSLVSEVYVNNNYNFGSAPTSPSGSESSMGNRKLIQFNNSVAKPGCLTIELKDPPENYIKIHESDGFEPDTLDRKHLKHKESVESIQLDRQDFLTDCDNSVKRDKKIKLGSSETFCKNNGQKENSNKFNSLRNDHEHGFDRTKLSPILYSGSKSLDTATDDTWDDNAGWSSEEGRILTLELRHSKRQRQSTPPSIKQMKNLARPDILPPLPPTEDTPIYEKPTIPPKRVPYGSPVPQTITEKRQIFPRNSISCSSLKIAETDDMNSIKLCENDQRSESGRNCRRASSSCSSVVNTNTFIKGQKAESIRTKLRRRKGSNIEDSGYLSSDSTCSKQFQRKIVIAKIDSCSDSDETEDEARSESGAESVETHSVYFGNCPRLRKNEESIKNTIKTTRDSKRKVIVNNDVNNE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: