MonarchBase - Protein-coding gene

DPOGS203995
Transcript	DPOGS203995-TA	4392 bp
Protein	DPOGS203995-PA	1463 aa
Genomic position	DPSCF300005 + 1428453-1440763
RNAseq coverage	379x (Rank: top 32%)

Annotation
*Heliconius*	HMEL013866	89.24%
*Bombyx*	BGIBMGA002140-TA	92.81%
*Drosophila*	DIP2-PA	62.76%
EBI UniRef50	UniRef50_UPI000206079E	72.37%	UPI000206079E related cluster n=2 Tax=unknown RepID=UPI000206079E
NCBI RefSeq	XP_002432341.1	75.15%	disco-interacting protein, putative [Pediculus humanus corporis]
NCBI nr blastp	gi\|270004770	76.56%	hypothetical protein TcasGA2_TC010545 [Tribolium castaneum]
NCBI nr blastx	gi\|270004770	76.98%	hypothetical protein TcasGA2_TC010545 [Tribolium castaneum]

Group
Gene Ontology	GO:0008152	9e-48	metabolic process
	GO:0003824	9e-48	catalytic activity
KEGG pathway	bte:BTH_II0276	8e-26
	K01913 (E6.2.1.-)	maps->	Benzoate degradation via CoA ligation
			Propanoate metabolism
			Caprolactam degradation
			Limonene and pinene degradation
			Tropane, piperidine and pyridine alkaloid biosynthesis
InterPro domain	[880-1382] IPR000873	9e-48	AMP-dependent synthetase/ligase
Orthology group	MCL10982		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS203995-TA
ATGTACGCCGCTTTTGACTTGAACATGGTACAAGTGAGGCAGGAGGCAGTACAACAGGCGCTCGCTGAAATGCAGAACAGACCTAAACCTTCACTTCCGATGCCATCGAAGAGAACCTCTATGATGGCCAAAAGTCCTGATAGAGAAAGACATGATCTGTCATCGAGTTCAGATGAAGATTCTTGCGCTGGTGACAGTGAGTTGCCCCCTCCTCCAGAGTTGGGTTCACCACCAGCTAGACGACCAGCCGCACCTCATCCACGATCCCACCCACACCCACTGCCACAACCGCACCACCAGCGTGAAAAGAAACATGGTCTCAGGGACAAGACGGAAATAGACTTGTCAGACATCACACATCTACCGGCTTACATCCAACCGGACGTTACGCACACTACGTCGGGGGCCCGGCGTGGTGGAGCTCATATAGCTGACCGTGTTCAGTGTTACGCTCAACCCGAAGACACTGGCACCGGCACCGGCAGGTGGAAGGTATCAGCCAAAATACAACAACTTCTCAACACCTTAAAGCGCCCGAAACGTCGACCGCTGCCGGAGTTCTATGAAGACGATGACATTGAATTAGAAATCGCTGCGAACCCCAAAGATCCGAACGCCCCCAAACCCGAGGGAGGCACAATGACCCCGGCTGTGGGCGAGCAACTTGTGGTACCCGCGGGACTCCCACGAAACCTTGAAGCAGCTTTACAAAGATATGGAACAGCATCATTCAAAGCCAACGTAGCTACAGTGCTCGATCCAAACGGAAAACTGAGCAATTCACTTACCTATGGCAAGTTGCTAAGCCGCTCACTAAAAATTGCTCACGCTTTGCTGAACAAAACGTTCACATCGAAAACTAGCAGCGGCGGACCGCTGACGGGGGATAATTCCATAAAACCGGGAGACAGGGTGGCTCTGGTGTACCCTAACAATGATCCTATAAACTTCATGTGTGCGTTCTACGGTTGCCTGCAAGCCGGCATAGTGCCAGTGCCGATTGAAGTGCCATTGACGAGACGGGACGCCGGCCTTCAGCAAGTCGGCTTCCTGTTGGGATCTTGTGGTATACAATATGCACTCACGTCTGACAACTGCTTGAAAGGGTTACCGAAAACGTCATCGGGGGACGTGGTATCCTTCCGTGGCTGGCCGTCACTGCAGTGGGTGTCGACAGAGAAGTTGCAAAGACCTCCTCGAGACTGGATCCCACCACCGCGCCCCGCCGAAGACTCCCCAGCTCATATAGAACACACCTCCGCCGCTGATGGTTCAGCGATGGGAGTCATCGTTACAAGGTCGTCAATGTTGGCACATAGTCGTATGTTGTCCGTCGCCTGCAACTACACCGAAGGCGAACACATGGTGTGCGTGTTGGACTTCAAACGTGAAACTGGTCTCTGGCACGCTGTGTTAGCCAGCGTTCTCAATGGAATGCACGTTATATTCATACCATACGCCCTCATGAAAGTCAGCCCGGCCTCCTGGATGCACATGATCACTAAATACAGGGCGTCGGTCGCGATTGTGAAGTCACGTGATCTCCACTGGGGCCTATTGGCGACTCGTGACCACAAGGAGATATCTCTCAGCTCGTTGCGCATGTTATTGGTCGCTGATGGAGCTAACCCTTGGTCTCTATCTTCGTGTGACCAGTTCCTATCAATATTCCAAAGTAAAGGTGTTCGCGGCGACGCTATCTGTCCGTGTGCATGCAGCAGTGAGTCGTTGACGGTTTGCGTGCGGCGTGCGGGACGAGGGGGAGCAGCAGCTGGCCGGGGCGTGCTGTCCATGTCCGGACTCTCATACGGAGTGGTTCGAGTAGACGCTGAGAACTCCCTTACCTCACTCACACTTCAAGACTGCGGACAAGTTATGCCATCCTGTGTAATAGTGGTAGTGAAGATGGAGGGTCCCGCCTATCTATGCAAGACCGACGAAGTGGGGGAGATATGTGTATTGTCTGGAGCCACTGGATCGGGTTACTGGGGACTACCCGGTTTAACTAACACTGTGTTTAGAGTACAGCCGTTGGATGCTGACGGGGAGCCTATTGGAGAGGAACATTATGTTAGAAGCGGGTTGCTAGGTTTCCTTGGCCCAGGAGGTTTAGTATTTGTTTGCGGTTCTCGTGATGGTCTTATGACGGTTACTGGCAGAAAACACAACATGGACGATATAATCGCAACTGTTCTTGCTGTGGAACCAATGAAGTTCATATACAGGGGTCGTATAGCAGTGTTCTCTGTTCGAGTTTTGCGTGATGAACGGATATGTATAGTGGCGGAACAAAGGCCAGATTGTGGGGAAGAAGAGTCATTCCAATGGATGTCTCGCGTTTTGCAAGCCGTTGATTCTATTCACCAAGTGGGTATATATTGTTTGGCACTTGTGCAACCAAACTATCTACCCAAAACACCCCTCGATGTTGGACCAGCTTCGGTCATAGTTGGAAATTTAGTACAAGGAAATCGTCTAGCGTCTGCCCAGGGTCGGGATATGGGATATAGTGATGATTCTGATGCTGCTAGAAAATATCAGTTTATATCACAAATATTGAGGTGGCGCGCTCAGAGCACATCCGACCATGTCATATTCACATTGCTTAATTCCAAGGGTGCTGTATCAAAAGTACTGACATGTGCCGAATTGCATAAAAAAGCGGAAAGAATCGGAAATCTATTGCTAGAGAAAGGCAGAGTGAACACCGGAGACCATGTAGCTTTGATATTTCCACCGGGGCTAGATCTCATTTGCGCATTCTACGGCTGTTTGTACGTAGGTGCTGTTCCCGTTACAATTAGACCACCACATCCTCAGAACCTCCATACCACGCTACCAACAGTACGCATGATAGTAGATGTGAGCAAAGCTACTTTGATCCTTTCCAATCAATCTGTGATAAAATTGCTCAGATCAAAAGAAGCTAGCAACGTTCTCGATAGCAAGGCGTGGCCTATTACACTTGATACAGATGACGTTCCTAAGAAGAAATTACCAATATTATACCGAGCTCCTACAGCAGAAATGCTTGCTTATTTGGACTTCAGTGTTTCTACTACCGGGATGTTGGCTGGTATTAAGATGTCTCATGCAGCTGTCACTTCCCTCTGCCGTTCAATGAAAATCGCTTGTGAATTATACCCCTCTAGACACATAGCACTCTGCTTGGACCCCTACTGCGGACTTGGATTTGCTCTATGGTGCTTGAGTAGCATCTACTCCGGTCACCATTCTATTCTTATTCCTCCATCAGAAGTGGAAATTAACCCCGCCTTATGGCTTAGTGCTGTATCTCAATATAAAGTACGTGACACATTCTGTTCTTACGGTGTAATGGAATTGTGTACCAAAGGCCTCGGCAGCTCGGTTAACCAGCTTAAAGCGAAAGGAATTAATTTGGCATGCGTTCGAACGTGTGTTGTAGTTGCAGAAGAACGACCACGAATTAATTTGACAAACTCATTTTCGAAGTTATTCTCAGCACTTGGCCTTACTCCACGTGCGGTGTCCACATCGTTCGGTTGTCGTGTCAACATAGCCATCTGCCTCCAAGGTGCATCAAGTCCTGAACCGTCTACAGTTTATGTCGATCTAAGAGCATTGCGTAATGATCGTGTCTCGTTAGTGGAACGCGGGAGCCCTCACTCTCTTTGCCTTATGGAGTCCGGCAAATTGTTGCCAGGAGTTAAAGTAATCACAGCTAATCCTGAAACTAAAGGCCAGTGCGGGGATTCCCATTTAGGTGAAATATGGGTGCAGTCACCTCATAATGCTAGCGGCTACTTCACGATATATGGTGATGAGAGTGACTATGCTGACCATTTTAGTGCTCAATTAGTTACCGGTAACACTGGGGAGGTTTACGCTAGGACCGGGTACCTCGGTTTTTTGCGACGAACTGAAATCAGTACGACGAACGCATCTGACGATACGTCTCTATTGGCACGAGACAGTGACACAGAGTCTATGTTATCTGGATGCGGCAGTGTGTCTGGTCTAACTGACACACACGACACACACGACGCTGTGTTTGTGGTGGGAGCTCTTGATGAAACAATCATGTTACGCGGTATGAGATACCATCCGATCGATATCGAAAATTCAGTTATGAGGTGCCATAAAAAAATTGCTGAATGCGCTGTTTTTACATGGACAAATCTGCTGGTGGTAGTTGTAGAGTTGGACGGTAACGACAGCGAAGCTTTGAATCTGGTGCCCCTTGTGACGAATACTGTGCTAGAGGAGCACCATCTAATTGTTGGAGTCGTGGTGGTGGTAGACCCCGGAGTGGTGCCCATCAACTCTAGAGGAGAGAAACAACGCATGCACCTCCGTGACGGATTCCTCTCCGATCAGATTGATGCTATATACATAGCTTACAACATGTAA

Protein sequence:

>DPOGS203995-PA
MYAAFDLNMVQVRQEAVQQALAEMQNRPKPSLPMPSKRTSMMAKSPDRERHDLSSSSDEDSCAGDSELPPPPELGSPPARRPAAPHPRSHPHPLPQPHHQREKKHGLRDKTEIDLSDITHLPAYIQPDVTHTTSGARRGGAHIADRVQCYAQPEDTGTGTGRWKVSAKIQQLLNTLKRPKRRPLPEFYEDDDIELEIAANPKDPNAPKPEGGTMTPAVGEQLVVPAGLPRNLEAALQRYGTASFKANVATVLDPNGKLSNSLTYGKLLSRSLKIAHALLNKTFTSKTSSGGPLTGDNSIKPGDRVALVYPNNDPINFMCAFYGCLQAGIVPVPIEVPLTRRDAGLQQVGFLLGSCGIQYALTSDNCLKGLPKTSSGDVVSFRGWPSLQWVSTEKLQRPPRDWIPPPRPAEDSPAHIEHTSAADGSAMGVIVTRSSMLAHSRMLSVACNYTEGEHMVCVLDFKRETGLWHAVLASVLNGMHVIFIPYALMKVSPASWMHMITKYRASVAIVKSRDLHWGLLATRDHKEISLSSLRMLLVADGANPWSLSSCDQFLSIFQSKGVRGDAICPCACSSESLTVCVRRAGRGGAAAGRGVLSMSGLSYGVVRVDAENSLTSLTLQDCGQVMPSCVIVVVKMEGPAYLCKTDEVGEICVLSGATGSGYWGLPGLTNTVFRVQPLDADGEPIGEEHYVRSGLLGFLGPGGLVFVCGSRDGLMTVTGRKHNMDDIIATVLAVEPMKFIYRGRIAVFSVRVLRDERICIVAEQRPDCGEEESFQWMSRVLQAVDSIHQVGIYCLALVQPNYLPKTPLDVGPASVIVGNLVQGNRLASAQGRDMGYSDDSDAARKYQFISQILRWRAQSTSDHVIFTLLNSKGAVSKVLTCAELHKKAERIGNLLLEKGRVNTGDHVALIFPPGLDLICAFYGCLYVGAVPVTIRPPHPQNLHTTLPTVRMIVDVSKATLILSNQSVIKLLRSKEASNVLDSKAWPITLDTDDVPKKKLPILYRAPTAEMLAYLDFSVSTTGMLAGIKMSHAAVTSLCRSMKIACELYPSRHIALCLDPYCGLGFALWCLSSIYSGHHSILIPPSEVEINPALWLSAVSQYKVRDTFCSYGVMELCTKGLGSSVNQLKAKGINLACVRTCVVVAEERPRINLTNSFSKLFSALGLTPRAVSTSFGCRVNIAICLQGASSPEPSTVYVDLRALRNDRVSLVERGSPHSLCLMESGKLLPGVKVITANPETKGQCGDSHLGEIWVQSPHNASGYFTIYGDESDYADHFSAQLVTGNTGEVYARTGYLGFLRRTEISTTNASDDTSLLARDSDTESMLSGCGSVSGLTDTHDTHDAVFVVGALDETIMLRGMRYHPIDIENSVMRCHKKIAECAVFTWTNLLVVVVELDGNDSEALNLVPLVTNTVLEEHHLIVGVVVVVDPGVVPINSRGEKQRMHLRDGFLSDQIDAIYIAYNM-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: