MonarchBase - Protein-coding gene

DPOGS206945
Transcript	DPOGS206945-TA	3249 bp
Protein	DPOGS206945-PA	1082 aa
Genomic position	DPSCF300001 - 402219-411662
RNAseq coverage	176x (Rank: top 50%)

Annotation
*Heliconius*	HMEL002123	2e-146	41.68%
*Bombyx*	BGIBMGA012941-TA	5e-126	44.84%
*Drosophila*	CG4830-PA	5e-54	28.33%
EBI UniRef50	UniRef50_D6WF94	3e-101	27.68%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6WF94_TRICA
NCBI RefSeq	XP_973874.2	4e-72	32.18%	PREDICTED: similar to CG6178 CG6178-PA [Tribolium castaneum]
NCBI nr blastp	gi\|270003843	1e-100	27.68%	hypothetical protein TcasGA2_TC003124 [Tribolium castaneum]
NCBI nr blastx	gi\|270003843	2e-99	27.61%	hypothetical protein TcasGA2_TC003124 [Tribolium castaneum]

Group
Gene Ontology	GO:0008152	1.5e-79	metabolic process
	GO:0003824	1.5e-79	catalytic activity
KEGG pathway
InterPro domain	[62-471] IPR000873	1.5e-79	AMP-dependent synthetase/ligase
Orthology group	MCL10359		Insect specific

Nucleotide sequence:

>DPOGS206945-TA
ATGCAGCAGTCTTTTGATTCATGCAATTATTACTTCAATGAAATATCTAATAAGGTCACAGCTGAATCTGGAATATGGACCGACGGAGAGCATCTTGGAAAAATAATCATACGATGTCTCAAAGAAGCACCGAATTTTATAGCACAGATAGATGGGGGAACAGGTGAGAAGGAAACAAATAAGTCCGTTTTGGAGAGGACTGTAATGTGCGCTCAGAGTTTCATAAATTTTGGCCTGAAATACCAAGATGTTGTAATGGTCATTGCACCGAACCATCTGCACATCAGTATTCCACTGTACGCCGCGTTCTGTACTGGTGTAATTTTCGCTGGAATAGACTTTAACTTGGGAGAGAATGAGTTAGCGGACACATTTAAATCGGGCCAGCCAAAAATGATATTCTGTCAGAACTCGAATCTGCAAACAGTCCGTAAAGCACTTGCAAGAATAAAAAGTAATGCTGAGATAGTTACGTTCGATGAAGGGCAAGACTGTATAAGTTTTACGAAATTCATTTCTAAATACAGTGGGGATGCTACTGTTGAAAATTTCAGGATTTGCGATTTTGAACCAGTTGAAACCATAGCATTGTTAATCGCTACAAGCGGTTCCACAGGTTTACCTAAAGTGGCTGTACTAACTCACCAGAACGTTAGCGTTGGCTTCATACAAAATTGGAAAGGTTTATCAAAGGCCCCAAATCCATTCGATATAGGTTTGGTGATATCTCCAATTCAATGGATATCTTCAACTTTCCAGATAGTAATGTCACCAATTTTGAGATACACCAGATTACAAACATCAAATAAACTGTCCCCTGAACACGTTTATGACTTAATTAATAAATATAAGCCAAAATATACCATCTGTAGTCCCACATACATGACAACTTTACTTAGAAACGATCATCAGCATGTATGTGATTTTACATCATTCAAATATATTCTAATTGGTGGAAGTGCTGTGTCAAAAGAGCTTTACGCAGACCTAAAGAAAGTAGCTCCAAATGTAATGATACAAGTTGGTTACGGTATGAGTGAGGCATCCGGATTAATATTTTCACCACATTACGTACCTCTGGGTTCAATTGGAAGACCCATGGAACATGTCAATTGGAAACTCGTGGATCCTGATACTGAAGAAATAATTCCTGAACCATATAAGGCCGGAGAGATACGAATAAAAGGGAGATCTATATTTAAGGGTTATTACAACAATCCCGAAATGACCGCACAGGCTTTTGACAAGGATGGCTGGTTGAAGTCAGGAGATATTGTATATAGAGATGAAAACTACAATTTCTTTTACGTGGATCGTCAAAAGTTGCTGCTTAAATACAGGAATCATCAGGTATCACCGTTAGAAATAGAAAATGTTATATTAAAACACCCGGGAGTTGTGGATGTGGCGGTATCAGGTATACCAGACCCTGAATATGGTGACCTTCCAATAGCTTTTGTGGTGAAGAAGAATGATTACGATCTCACCGCGCAATGTGTCGAAGATTTGGTCAAAGAAACACTAACGGACTCAAAACAATTGAGGGGAGGCGTTATTTTTCTGGACGAGCTCCCTGTGACATCAACATCAAAGCTAGACCGAACGAAATTAAAGAATATGGCAGTCAACATGGCAAAATGGGTAAGAAGCAGGAATGCAGTAAACATGCACCTGGAAGAACTATCTTCAAGAATAGTGGCTGATTCTGGTATACCAACTGATAGATATCATTTAGGAAAACTGATATTGCAGAGCCTTAAAGATGCTCCCGATTATCTGTCACAGATTGACGGGGCCTCTGGAGAGACTGAAAATTTCGAATCGGTTCTGAGACGATCTGTTCGATGTGCTACAGCATTAAAGAATTTAGGGCTAAAACAGGGAGATGTGGTGGTTTTGATGGCACCGAACCACATTCATCTATGTATACCCATTTACGCTGCATTGTACATTGGAGCAATTGTTGCAGGAATTGACATGAACTTAAAAATCAATGAACTTAAGGATAGTTTCAAAATAAACAAGCCGAGCGTAATATTTTGCCAGAGCGAAAAAGCCGCTGATATTAATTTGGCTTTAAGCAATTTGAACATCGATCCTAAAATAGTAACATTTGACAAAGGGAGCGACTATTTGAATTTTCATCAATTTGTTGATAAATATGGCGACGATACTCCTGTCGAAGAATTCAAAGCTACCAATCTGGATCCAAATGAGGCGATAGCTTTACTGATCTCTACAAGCGGAACTACAGGCTTACCAAAATCGGCTGCTGCTACACATGCAAACTTTGCAATATCAGCTGCTAACATGTGGGTCCTCTTTGATACTTGTCCGTCCCCAACTCGCCTATCCGTTATAATGTCACCCCTACAATGGTACTCAGCTTTATTCCAATATATATATACGCCAATAGTGAGGACAACGCGTCTCCAGTCCTCTTTACCAATGACACAGGAACACGCATACTACATTATAAATAAATATAAGCCGACATTTACAATGTGCAGTCCGAATATGTGGGCTGAGCTCTTCAAGAAGGGAGATCGTGACAAATGCGATTTAAGTTGTTTCGATCTTATTATGGCCGCCGGCAGCGATGTACCATCCACACTCTTCGATACTATAAACTCGGTCGTCCCAGAGACATGTTTCATACCAGCGTATGGTTTGAGCGAGATATCGGGAATCGCATTTGTTTACGACAGCACAAATCCAAGGTCGTTGGTGTCACCGGAAACAAAATTAGATGTTACGGAACCGAACGTTCCTGGAGAATTATTTATAAAAGGACCAGCCGTTTTTAAAGGCTATTACAACGATGAAAAGTGTACAGAGGAGACCTTTACAGATGATGGTTGGTTCAAAACTGGTGATATATTTAAGAGGGACGAGAATTGGTATTTCTACTTTGTGGAACGAAGAAAGATGTTGCTGATACATAAAAATTACCAGGTTTCCCCTTTGGAAATAGAGAATGTAATTATTCAACACCCAGCGGTATACCAAGTTGCGGTAACCAGTGTTCCACATCCTGAACATGGAGATCTGCCCGTGGCTTGCGTAGTTAAACATAAGGACAGTACTGTAACTGCCCAGGATATTAAGGATATGGTCGAAGAAACATTATCGGAACAAAAGCATTTGTCTGGAGGAGTGATATTTTTGGATGCACTACCAATGACCTCAACATCCAAAGTAAATAAGTCCAAACTTGCGGCTTTGGCTCGAGTTTCGGAACGACTGTAG

Protein sequence:

>DPOGS206945-PA
MQQSFDSCNYYFNEISNKVTAESGIWTDGEHLGKIIIRCLKEAPNFIAQIDGGTGEKETNKSVLERTVMCAQSFINFGLKYQDVVMVIAPNHLHISIPLYAAFCTGVIFAGIDFNLGENELADTFKSGQPKMIFCQNSNLQTVRKALARIKSNAEIVTFDEGQDCISFTKFISKYSGDATVENFRICDFEPVETIALLIATSGSTGLPKVAVLTHQNVSVGFIQNWKGLSKAPNPFDIGLVISPIQWISSTFQIVMSPILRYTRLQTSNKLSPEHVYDLINKYKPKYTICSPTYMTTLLRNDHQHVCDFTSFKYILIGGSAVSKELYADLKKVAPNVMIQVGYGMSEASGLIFSPHYVPLGSIGRPMEHVNWKLVDPDTEEIIPEPYKAGEIRIKGRSIFKGYYNNPEMTAQAFDKDGWLKSGDIVYRDENYNFFYVDRQKLLLKYRNHQVSPLEIENVILKHPGVVDVAVSGIPDPEYGDLPIAFVVKKNDYDLTAQCVEDLVKETLTDSKQLRGGVIFLDELPVTSTSKLDRTKLKNMAVNMAKWVRSRNAVNMHLEELSSRIVADSGIPTDRYHLGKLILQSLKDAPDYLSQIDGASGETENFESVLRRSVRCATALKNLGLKQGDVVVLMAPNHIHLCIPIYAALYIGAIVAGIDMNLKINELKDSFKINKPSVIFCQSEKAADINLALSNLNIDPKIVTFDKGSDYLNFHQFVDKYGDDTPVEEFKATNLDPNEAIALLISTSGTTGLPKSAAATHANFAISAANMWVLFDTCPSPTRLSVIMSPLQWYSALFQYIYTPIVRTTRLQSSLPMTQEHAYYIINKYKPTFTMCSPNMWAELFKKGDRDKCDLSCFDLIMAAGSDVPSTLFDTINSVVPETCFIPAYGLSEISGIAFVYDSTNPRSLVSPETKLDVTEPNVPGELFIKGPAVFKGYYNDEKCTEETFTDDGWFKTGDIFKRDENWYFYFVERRKMLLIHKNYQVSPLEIENVIIQHPAVYQVAVTSVPHPEHGDLPVACVVKHKDSTVTAQDIKDMVEETLSEQKHLSGGVIFLDALPMTSTSKVNKSKLAALARVSERL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: