MonarchBase - Protein-coding gene

DPOGS208836
Transcript	DPOGS208836-TA	3435 bp
Protein	DPOGS208836-PA	1144 aa
Genomic position	DPSCF300036 + 776626-784405
RNAseq coverage	921x (Rank: top 14%)

Annotation
*Heliconius*	HMEL015437	0.0	61.42%
*Bombyx*	BGIBMGA007943-TA	0.0	54.05%
*Drosophila*			%
EBI UniRef50	UniRef50_F4WTP3	6e-97	35.68%	Protein SMG7 n=5 Tax=Coelomata RepID=F4WTP3_ACREC
NCBI RefSeq	XP_001605792.1	2e-106	36.51%	PREDICTED: hypothetical protein [Nasonia vitripennis]
NCBI nr blastp	gi\|156543150	4e-105	36.51%	PREDICTED: hypothetical protein LOC100122190 [Nasonia vitripennis]
NCBI nr blastx	gi\|328793075	4e-107	29.69%	PREDICTED: hypothetical protein LOC409556 [Apis mellifera]

Group
KEGG pathway
InterPro domain	[59-176] IPR019458	1.4e-13	Telomerase activating protein Est1
Orthology group	MCL17822		Insect specific

Nucleotide sequence:

>DPOGS208836-TA
ATGGTTTTAAATGCCGCTGTGCAGTTATTAAGAGAGGCGGAGGAATTGAAACAGAAGATTTTAAAATTCAATAGTTGCATTTCTATGCTTCAGGATAGAAGTTTATGGGTAACACAGCAACAGTTACAGAAGGTGTACCAGAAAGTTTTGGTACTGGATCTTGATTATGCTCTAGAGAAGAAAGTGGAACAAGATCTATGGAATGTTGGGTTCAAGCAGCAGATTGAGGCTTTGCAGGCCATTTCCAAAGATAGAAAGAGTGTCCTCAGAAGTGAAGCTCAAGGTATGCTGTCATGGGTGCTGCAGGCTGCCGCTGGGTTCTACCTATGCCTCTTGCATCAAATCTGCACAACATTTAAACTAGATCTACCATTTAGACGTAGGGCGTCCCTTCTTGGCTCGGTTGAAGGGTGGGAGGCCGGTGGGTGTCCGGAACCCGTTCGAGCCGGTGCTGGAGCTGCCCGGTATGCGTGCCAGCACTGTCTCGTACACCTAGGGGACCTCGCCCGTTACAGACACCAGCTGAAAGTCGCACACACCTTTTACAGGCATGCCCTAGCGGTGTCTGTGCATTCAGGGCAGCCATACAATCAGTTGGCGCTGGTCGCTTGGCGTCGTGGCCGCCGTCTGGCCGCCCTCTACTGGCACGTCCGGTCGCTGCTGGTCCGAGCGCCCTTCCCTCCCGCCCCCGCGAACCTCACCCGGACCCTGGCGGCCGCGGGAGACACTGTGCAAAAATGTTTCAGTCGTGACGTCAAGGAGACGCCGCTGCCCGTGCTGCCGGGGCTGTCCGGGGTGGAGGGGCACGCCACCAGCGCACCTTCAAAGGCAACTGTAACTGAAAAACTCGACTCGCACTCCTATGTAAATGAACTAGTACGAGCACTCCACTACCTGCACAGCTTGGAACATCTCGACACGGCCGAAGAGCTGGTTGGGAAGCTGAACTCGTCCCTGACACACCTCGTGGCCACTGACAGCTTCGATTCCATGACTCTGGTTAAGATGGCGTGCGTCACAATCTGGCTGGTTCACTCCAGTACGGAGGACCTTTCGGTGGAGCCGTCGTCCATGAGCGAGTCGGAAGGTCGGGCCGCAGTGCTGGCGTGCTCGCTGGCCGCTCACAGCGTGCTGGCACTGCTGCTCGCAGCACACACTGGGGACACGCCCAACAAGGGCTTGCCGGCATTGCGTGTGTGGCTTCAGTGGTCGTGGTGTCGGCCCGCGGCGCTCCGGTCGCATGCTTGGGGCTCCAGACCTCACATGTGGGCAGCGCTCGCACACGCACTCAACAACATGGGAGACGCCCTCGAAGACCCCGCCTATGAGACCCTCCCTCTGCCGGAGGATGAAGAGTTACACGGCTTCTTACCGCTGGAGGAGGCTTTGAAGGGACTCAAGTTTCCAAACCACTGCGGCTGGGACTCCAACAAACTGCCTCAAGAGGAACCCGAAGAAGACACGGCGTCCAGTGTATCAGCGTCGTGGGGGTCGTCGTACCTGGCGCTGGTCAGCGACACCGAGCTGCAGGCCCGCGTGAGGACGGCGCGGCTAAGACGACTCGGGGAGAAACTGGCGGAGCAGCACCCGGGACTACTCACCTGCGATACTGACGAAGACGGGGTGATGACATTTTCCACGAGCGAGTCTAGTAAGGAGCAGCTGTCCTTGGTGTTGGCGACCCTGACCCCGCCCTCCGCCCCGCCCACAGAGCCTAAGACCCCACCTCCGGCACCCCCACCACCACCACTCATCATATCGGAGGCTGACTTTCGAGAGAAAGTACGAGAAAAACGCGCTGGCATTCTCAAGCCGCAGGGGTCGCTGGAGCGCGCGAGGGAGGAGAGACGAGCCGCGCCCGCCGCTGAGGATCAGGACGGCGAGGAGTGTGAGGAGGGAAGTAAGAACGAGGACAAGAAGGAGGCTCGCAAACCACGAGTCAACATCGCCATGGCGGCCATCATGAGGAAACAGGAGGAGAGCAACAAACAGGTTAAATTTGTAACTCCACCCCCCACGCCGGAGACCACAGATGAAGCGAGCGAGAGTTCGTCGAAGGATGAGAAAACCAAAGTCATTCAACCGAAGGCCATTAAATCATTAGCAAATTTACCGGTGGGAAGAAAAACGGGGGGAATTCTCTCGTTGAAAGATAAGTCGGCCGGATATCCGCACCTCCAGAATACGGAAACGGAAACGAAGAAACCGGAACAGGAGGAGATGAACGAAGAGAAGTCTGCCCAAAACAGTTCCGTCTCGCAGAGCTACCATCAACGCGATCAAGGTACCAACTGGCCGACGATGCCGGCGCCCTACGGTGACAATAATAAAATGAACTTCCAAAAGAATTACGGAATACAAAACAGCGGCATAAGTTACAACCCCAACTACCAACCTCCCCCCAACACTCAGGGGATACGACTACCTGTTGTCAACCCCAAGGAGATCGACGTCAGGACGGCGGCGCTTCAGAAACAGAACTCTCGCCAGGAAATATTCCAGGAGGCCAACAAATTCAATCACGGATACCAAATATCGGGGGACAAAAAGAATTTCCTCAACGACCTGCCGCCGAGATTCGCGAATCAGTACCGCTACTGGCAGAGTCCGCAGGAAAACCAGTTCAACGACAACAAGTTCAGGGACGACAGCAACAAACTCACCGCGCCCTTCACGGCACAACCTCCGAGACAAAATTGGCCGAACCAGAGTGAAAACTTCCAACAGGGGATTCCCTGGTGGAAACCTGATACCCGCACCAATTTCAATCAGCCTAACTTCTCCACCACACCCATGAATGTACCAAACTTCTATTCTCAAATGTCCGGGAACGTGCCTAATATTTATCCAAATTTACAATACAGCCAGATGCAAGGACAGAATATTGGCCAAAACATGCCAACCGTGGGCCAGAATTTGGCAAATATAGGACGAAATAAACAGGATAGTTTGGCGCCGTCGTTCGGTCAGTCGGCCGTCGGTCAGCCGCAGCTCCAGACCCTGGCGAGCATGGTGTCGTCTCCCGGCTACGGCTCGGCCTTGAACAGCTTCACCCCCTACCCGGCGGCCGTCAGCTACGACTCTTCCTTGTATCCTCAGTTCAACAAACTCGGCTACCAGCCCCTGCAGCTGAACAAACAGAACTTCCAAGGGAAGGAGTCGGAGCCCGGAGTCAGCTTCGGCAGCAACGTGCTGGACGTACAGCATATGAATTATAACGAACCGTTCGTCGCCGACGGAGCCAACGACGCCTCGGAAGACGCGGCGGGCGCTCAGTCGGAGGCCGGCGTCTCCAACACATACTCGCTGTTCCGACAAGACGCGCACGCCTGGCCGCCCTCCACACATCAGTCGCTGTGGTCGGGGCCGGGCGGGTCTCCGCTGGAGCGTCTCCTCGAGCAACAGAAGCAGATGAAGCCGCCGTCGACGCACTGA

Protein sequence:

>DPOGS208836-PA
MVLNAAVQLLREAEELKQKILKFNSCISMLQDRSLWVTQQQLQKVYQKVLVLDLDYALEKKVEQDLWNVGFKQQIEALQAISKDRKSVLRSEAQGMLSWVLQAAAGFYLCLLHQICTTFKLDLPFRRRASLLGSVEGWEAGGCPEPVRAGAGAARYACQHCLVHLGDLARYRHQLKVAHTFYRHALAVSVHSGQPYNQLALVAWRRGRRLAALYWHVRSLLVRAPFPPAPANLTRTLAAAGDTVQKCFSRDVKETPLPVLPGLSGVEGHATSAPSKATVTEKLDSHSYVNELVRALHYLHSLEHLDTAEELVGKLNSSLTHLVATDSFDSMTLVKMACVTIWLVHSSTEDLSVEPSSMSESEGRAAVLACSLAAHSVLALLLAAHTGDTPNKGLPALRVWLQWSWCRPAALRSHAWGSRPHMWAALAHALNNMGDALEDPAYETLPLPEDEELHGFLPLEEALKGLKFPNHCGWDSNKLPQEEPEEDTASSVSASWGSSYLALVSDTELQARVRTARLRRLGEKLAEQHPGLLTCDTDEDGVMTFSTSESSKEQLSLVLATLTPPSAPPTEPKTPPPAPPPPPLIISEADFREKVREKRAGILKPQGSLERAREERRAAPAAEDQDGEECEEGSKNEDKKEARKPRVNIAMAAIMRKQEESNKQVKFVTPPPTPETTDEASESSSKDEKTKVIQPKAIKSLANLPVGRKTGGILSLKDKSAGYPHLQNTETETKKPEQEEMNEEKSAQNSSVSQSYHQRDQGTNWPTMPAPYGDNNKMNFQKNYGIQNSGISYNPNYQPPPNTQGIRLPVVNPKEIDVRTAALQKQNSRQEIFQEANKFNHGYQISGDKKNFLNDLPPRFANQYRYWQSPQENQFNDNKFRDDSNKLTAPFTAQPPRQNWPNQSENFQQGIPWWKPDTRTNFNQPNFSTTPMNVPNFYSQMSGNVPNIYPNLQYSQMQGQNIGQNMPTVGQNLANIGRNKQDSLAPSFGQSAVGQPQLQTLASMVSSPGYGSALNSFTPYPAAVSYDSSLYPQFNKLGYQPLQLNKQNFQGKESEPGVSFGSNVLDVQHMNYNEPFVADGANDASEDAAGAQSEAGVSNTYSLFRQDAHAWPPSTHQSLWSGPGGSPLERLLEQQKQMKPPSTH-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: