MonarchBase - Protein-coding gene

DPOGS215350
Transcript	DPOGS215350-TA	2613 bp
Protein	DPOGS215350-PA	870 aa
Genomic position	DPSCF300120 + 500890-504777
RNAseq coverage	326x (Rank: top 35%)

Annotation
*Heliconius*			%
*Bombyx*	BGIBMGA008115-TA	1e-95	35.64%
*Drosophila*			%
EBI UniRef50	UniRef50_D6WYA2	6e-115	39.77%	Putative uncharacterized protein n=21 Tax=Bilateria RepID=D6WYA2_TRICA
NCBI RefSeq	XP_969432.2	2e-122	42.17%	PREDICTED: similar to Copia protein (Gag-int-pol protein) [Tribolium castaneum]
NCBI nr blastp	gi\|189239753	4e-121	42.17%	PREDICTED: similar to Copia protein (Gag-int-pol protein) [Tribolium castaneum]
NCBI nr blastx	gi\|189239753	2e-117	36.38%	PREDICTED: similar to Copia protein (Gag-int-pol protein) [Tribolium castaneum]

Group
KEGG pathway	uma:UM00214.1	2e-35
	K00140 (E1.2.1.27, mmsA, iolA)	maps->	Inositol phosphate metabolism
			Propanoate metabolism
			Valine, leucine and isoleucine degradation
InterPro domain	[388-633] IPR013103	7.4e-87	Reverse transcriptase, RNA-dependent DNA polymerase
Orthology group	MCL10015		Insect specific

Nucleotide sequence:

>DPOGS215350-TA
ATGGCGGCAAACTACTTGGTAAATGTACCCAAATTACGCGGGCGGGAAAATTACAGCGAGTGGAGCTTCGCGGCAGAGAATTTCCTAATCCTTGAAGGCATGAAACATTGTGTAAAGCCAGAAGGAGCTGTAGTAGGAGCTGCAGACGACGAGAAAACTCGAGCAAAATTGATTATGACAATCGACCCGTCTTTGTTTGTACATGTGAAAAGTGTAAGAACAACGAAAGAACTCTGGGATAAACTACAACAGTTATTCGATGACAACGACATGGAGTCAACCATAGAGGAACGTGATGAAGTTGGCGGCGCGTTCGCAGCTCGTTCGAATTCTAAGTACAAGAAAAATAAAATGGCGTCAAGAAAAAATGTCAATGTTGGTAGCACTGCCGATACGTCAAAGTCAAACGTGACATGTTACAGATGTAAACAAAAAGGCCATTATAGAAATCAATGTACTAATAACGAAAATAACGCGTCGAACTTCAAGGAAAAACCCCGAATGCAGTCTAATGCGTTTAGTGCTGTGTTCCTGAGCGGGAATTTCAGTAAAAATGCATGGTATATTGACTCTGGAGCCAGTGTACACCTTACGGCAAATGAAAGTTTGGTTATGAATGCGTCGTATGATCAGAAACAGGAAATTATCGTTGCGAACAGTGAAAAGTTGTCAGTTTTGTGTTCTGGCGATGTGAAAATTATAACTACAACTGGTGATATTGATTACGAAATTATGGTTGAAGACGTTTATTGTGTTCCAAGTCTGGCGACTAACTTGCTATCAGTCAGCCAACTCATAAGCAAAGGAAACAAGATGGAAGTTTCCTCTCAGAGTTTTGATTCAGTGGGGGAAGAAGAAGTTAATATAGATGAACCAAACTCGGAATCTGACCACACAGATAGCTCAGAGGACACATTTCTGGATGTGGTTGATGAGACATATAAACCTAGTGATTCTGAAGCTGAAGATATCCCGCAGATTAGACCTCAAAGACCTACACGAGAGAGGAAGCAACCAGACAGGTTCAAATGTTCAAATTTTTGTGCTGGTGAGAGCACATATGATGATGTGACAGGATTGTCTCTTCAGGATGCCTTAGCCGGACCTGAAAAAGAACAGTGGAAAATAGCTATGGCTGAAGAGTTACAAAGTTTCAAAGAGAATGATGCATGGGAGATTAGCAATCCTCCTCAAGATGTTAGAGTTGTAAAGTGCAAGTGGGTGTTACGTAAAAAATATGATTGTGATAATAACATTCGGTTTCGTGCGCGTTTAGTGGCGAAAGGTTTTTCACAAGTTCAAGGTGTGGACTATACTGACACTTTCTCACCTGTAGTGAGGCATACCACATTGCGGCTTTTATTTGCTCTGTCTGTTCAACTTAATCTTGATATAACACATCTTGATGTGACAACTGCTTTCTTGTATGGAATTCTTGAAGAAGACATTTATATACAAATACCTGAAGGTTTTTCTGAGAAAGTAGAGAAAGGTCAAGTTCTTAAATTAAAGAAATCTATGTATGGTTTAAAACAGTCTTCAAGAGTATGGTACAAGAGAGTAGAGGAATGTCTTTTAAAAATTGGCTTTGTTAAATCTAAGATAGAACCTTGTATGTTTTTGAAAACACAGGATAAGTTAAAAACTATTGTTACTCTGTATGTCGACGATTTCTTCATTTTTTCAAATGATATTATAGCTACTAAGCACTTAAAAGATGTTTTATCTGACAATTTTAAAATTAAAGATTTAGGTGAAATCAAGAAATGTCTTGGAGTAAATGTAAAAGTAAATAAATGTGAGAAAACAATATCAATAAGTCAGGAAGATTATATTGATCAGCTGTTACTTAAATTCAAAATGAGTCAATGTAAAACTGTTCAAACTCCAATGGAGACTAAGTTACATGCATCTAAAGATGAGAATAATGTAGATAAGTTATTGTTTCCTTATCAACAAATGATAGGTTCTTTAATGTATTTAGCGGTTCTTACAAGGCCAGACATTGCATTTGCAGTTAGCTTTTTAAGTCAATTTAATAATTCCTATACCAAACAGCATTGTTCATATGTAAAACGCATATTGCGATATTTAAAATTGACCAAACATTATGGTTTAAAATTTTCTGCAGATGGGAACTCTGTCATTGAAGGATTTGTAGATGCTGATTGGGGTGGGAACACTATTGATAGAAGATCCTACACGGGTTTCTGTTTCACTTTGTCAGGTTGTGTAATTTCTTGGGAGACAAAGAAACAGAAGACCGTGGCTTTATCAAGCAGTGAAGCCGAGTACATGGCTTTAACTGAAGCATGTAAGGAATCTCTTTATTTAAGAAATTTACAGTTTGAAATAACTAATAAGAAGTACACTATTGAATTATATAATGATAACCAGAGTGCATTAAAGTTAACTCAAAATCCAATCTTTCATAAGAGAAGCAAACACATTGACATACGTTATCATTTTTCTAGAGAATGTGTAAATAATAATATTGTGAATGTTAAATATTTACCATCAGCTGAGATGCCAGCTGACTTACTTACAAAGAGCTTGTGCTCTAATAAGCATTATTATTTATTGGATAAGTTGGGGGTTCAGCACATATGTTAA

Protein sequence:

>DPOGS215350-PA
MAANYLVNVPKLRGRENYSEWSFAAENFLILEGMKHCVKPEGAVVGAADDEKTRAKLIMTIDPSLFVHVKSVRTTKELWDKLQQLFDDNDMESTIEERDEVGGAFAARSNSKYKKNKMASRKNVNVGSTADTSKSNVTCYRCKQKGHYRNQCTNNENNASNFKEKPRMQSNAFSAVFLSGNFSKNAWYIDSGASVHLTANESLVMNASYDQKQEIIVANSEKLSVLCSGDVKIITTTGDIDYEIMVEDVYCVPSLATNLLSVSQLISKGNKMEVSSQSFDSVGEEEVNIDEPNSESDHTDSSEDTFLDVVDETYKPSDSEAEDIPQIRPQRPTRERKQPDRFKCSNFCAGESTYDDVTGLSLQDALAGPEKEQWKIAMAEELQSFKENDAWEISNPPQDVRVVKCKWVLRKKYDCDNNIRFRARLVAKGFSQVQGVDYTDTFSPVVRHTTLRLLFALSVQLNLDITHLDVTTAFLYGILEEDIYIQIPEGFSEKVEKGQVLKLKKSMYGLKQSSRVWYKRVEECLLKIGFVKSKIEPCMFLKTQDKLKTIVTLYVDDFFIFSNDIIATKHLKDVLSDNFKIKDLGEIKKCLGVNVKVNKCEKTISISQEDYIDQLLLKFKMSQCKTVQTPMETKLHASKDENNVDKLLFPYQQMIGSLMYLAVLTRPDIAFAVSFLSQFNNSYTKQHCSYVKRILRYLKLTKHYGLKFSADGNSVIEGFVDADWGGNTIDRRSYTGFCFTLSGCVISWETKKQKTVALSSSEAEYMALTEACKESLYLRNLQFEITNKKYTIELYNDNQSALKLTQNPIFHKRSKHIDIRYHFSRECVNNNIVNVKYLPSAEMPADLLTKSLCSNKHYYLLDKLGVQHIC-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: